百度對重復內容是如何處理的?
[日期:10-09-27]
由于現(xiàn)在的互聯(lián)網(wǎng)轉載、復制的現(xiàn)象較明顯,
有的甚至是完全模仿某網(wǎng)站的頁面自己再搞一個分站點。
(這里不說采集這種無前途的方式)
百度對這種頁面是如何處理的?
現(xiàn)在看到的一些結果是原本運營了不短時間的網(wǎng)站,隨著這個競爭網(wǎng)站模仿頁面的收錄,自己的頁面排名逐漸下降。
這的確是個顯著的問題。這表明我們在這方面的策略上有極大改進空間。這類積重的問題,非一朝一夕能搞定,需要傷筋動骨的動動手術才行。所以請大家耐心。
另外需要說明的是,搜索引擎的排序出發(fā)點,是用戶的搜索體驗。雖然說,很多時候尊重原創(chuàng)和用戶體驗是一致的。但是,畢竟也有一些case,轉載的體驗會比原創(chuàng)更好。這時候原創(chuàng)者的排序未必會高于轉載者。但無論如何,原創(chuàng)者的應該以另外一種方式被肯定,而不是簡單的被聚合掉。
問:百度如何面對很難處理的重復頁面,比如列表頁有分頁,文章頁也有分頁,他們的meta都是相同的,這樣會不會當重復頁面處理。同時比如一個論壇有兩篇相同的帖子都收錄,會影響先收錄的排名嗎?
答:1,判定頁面重復的算法很復雜??梢钥隙ǖ氖?,僅meta相同,是不會被判為重復的。
2,相同兩個帖子被收錄(URL可能不同),低權重的頁面會不被建索引,或者被高權重頁面類聚掉。