百度對(duì)重復(fù)內(nèi)容是如何處理的?
[日期:10-09-27]
由于現(xiàn)在的互聯(lián)網(wǎng)轉(zhuǎn)載、復(fù)制的現(xiàn)象較明顯,
有的甚至是完全模仿某網(wǎng)站的頁(yè)面自己再搞一個(gè)分站點(diǎn)。
(這里不說(shuō)采集這種無(wú)前途的方式)
百度對(duì)這種頁(yè)面是如何處理的?
現(xiàn)在看到的一些結(jié)果是原本運(yùn)營(yíng)了不短時(shí)間的網(wǎng)站,隨著這個(gè)競(jìng)爭(zhēng)網(wǎng)站模仿頁(yè)面的收錄,自己的頁(yè)面排名逐漸下降。
這的確是個(gè)顯著的問(wèn)題。這表明我們?cè)谶@方面的策略上有極大改進(jìn)空間。這類(lèi)積重的問(wèn)題,非一朝一夕能搞定,需要傷筋動(dòng)骨的動(dòng)動(dòng)手術(shù)才行。所以請(qǐng)大家耐心。
另外需要說(shuō)明的是,搜索引擎的排序出發(fā)點(diǎn),是用戶(hù)的搜索體驗(yàn)。雖然說(shuō),很多時(shí)候尊重原創(chuàng)和用戶(hù)體驗(yàn)是一致的。但是,畢竟也有一些case,轉(zhuǎn)載的體驗(yàn)會(huì)比原創(chuàng)更好。這時(shí)候原創(chuàng)者的排序未必會(huì)高于轉(zhuǎn)載者。但無(wú)論如何,原創(chuàng)者的應(yīng)該以另外一種方式被肯定,而不是簡(jiǎn)單的被聚合掉。
問(wèn):百度如何面對(duì)很難處理的重復(fù)頁(yè)面,比如列表頁(yè)有分頁(yè),文章頁(yè)也有分頁(yè),他們的meta都是相同的,這樣會(huì)不會(huì)當(dāng)重復(fù)頁(yè)面處理。同時(shí)比如一個(gè)論壇有兩篇相同的帖子都收錄,會(huì)影響先收錄的排名嗎?
答:1,判定頁(yè)面重復(fù)的算法很復(fù)雜。可以肯定的是,僅meta相同,是不會(huì)被判為重復(fù)的。
2,相同兩個(gè)帖子被收錄(URL可能不同),低權(quán)重的頁(yè)面會(huì)不被建索引,或者被高權(quán)重頁(yè)面類(lèi)聚掉。