谷歌分析师称互联网重复内容占6成

日前,在新加坡举行的GoogleSearch Central Live活动上,谷歌Webmaster趋势分析师Gary Illyes称物联网上有六成内容是重复的。

参与本次会议的鈴木謙一(Kenichi Suzuki)补充了Gary Illyes提出说法的上下文,解释谷歌如何处理互联网上的“重复数据”:

1. 删除协议重复的内容 — 有利于 HTTPS
2. 删除 www/non-www
3. 删除包含无用参数的 URL (例如 sessionID?)
4. 删除斜线 / 无斜线的变体
5. 删除其他的校验和重复