Matt Cutts访谈 – 关于Google索引,301重定向,重复内容等

Matt Cutts访谈 – 关于Google索引,301重定向,重复内容等
这篇访谈有点早了,是今年3月份时的事。Matt Cutts针对Google的爬行,索引机制以及对301重定向,重复内容处理的问题做出了些回答。访谈的原文比较长,SEOmoz有人以插图的形式很好的再现了这次访谈的大致内容,比较直观,这里我进行下转载。
#1. 关于爬行和索引


关于索引问题,我想应该很多朋友都有体会,为什么我的站Google收录的很少?为什么我发的反链Google都没有收录?
Google目前的索引量到底有多大,大家可以在Google里搜索a试试,从这个结果应该能看出个大概。
About 25,420,000,000 results (0.17 seconds)
然后,根据资料,截止到2007年2月,互联网上已经发现的网站数量是108,810,358个。[来源]
我们暂且拿当今的Google索引量,除以两年前的网站数目,也就是平均下来,每个站的Google收录量不到300。那么实际情况呢?
很多时候,并不是Google没有发现你的页面或者反链,只是觉得这些页面或者反链不够重要,没什么必要加入到他们的索引数据库里以供用户查询时返回结果。
那么什么样的页面才是重要的页面?Google又是怎么判断的呢?PageRank是这份插图所列举的一个例子。
#2. 站内重复内容

这里提到了尽量使用canonicalization来避免站内重复内容导致的索引问题。
#3. 关于aff链接

通常情况下,直接用AFF链接也不会输出link credit。
#4. 301跳转无法传递全部PR或者链接权重

Google官方年初就已经公开说明了301跳转时权重会有所损失
Matt Cutts: That’s a good question, and I am not 100 percent sure about the answer. I can certainly see how there could be some loss of PageRank. I am not 100 percent sure whether the crawling and indexing team has implemented that sort of natural PageRank decay, so I will have to go and check on that specific case. (Note: in a follow on email, Matt confirmed that this is in fact the case. There is some loss of PR through a 301).
说说我自己最近的一次301,是站内的301重定向跳转。之前有个站拿XsitePro做的静态页面,后面转到WordPress后,花了一个多月的时间才慢慢恢复(其中也有我自己的原因,页面地址首字母大写没注意先),也有人说Mayday更新后也对301跳转传递权重有影响。[来源]
另外,如果有朋友有机会转移域名的,可以试下跨域名的canonical标签,Google在09年底开始支持这个标签,其后便在10年年初降低了301跳转的作用。也许是用301重定向用来作弊的人太多,总之感觉这个做法比较像Google的习惯,启用一个新的解决方案来逐步替换掉老的实现同样的功能。
更多关于canonical标签的资料请Google。
#5. 低质量的网页内容会影响你的索引

Autoblog就是一个很明显的例子。做英文SEO时,这种类型的垃圾站不是说你装几个插件用scrapebox发两下就能有好的收录表现。Google也有类似对新站的考察期,这点Autoblog Blueprint上也有讲到。另外说点题外话,我已经有很多次提到了Autoblog Blueprint这份教程,群里现在也有人放出了完整的视频,我不知道到底有多少人好好看了。市面上现在有些Autoblog培训,我敢说这些自动博客培训所教的绝对没有一个能超过这本教程所讲的1/10。很多东西你不能一直总等着别人来跟你讲解,也不要妄想认为花点培训费就能都掌握。
#6. 关于PageRank Sculpting


之前很多人利用nofollow来控制PR流动,以此来提高特定页面的权重/排名,这项技术被称为Pagerank Sculpting(PR剪枝)。之后Google修改了nofollow的规则。
Matt Cutts: So what happens when you have a page with “ten PageRank points” and ten outgoing links, and five of those links are nofollowed? Let’s leave aside the decay factor to focus on the core part of the question. Originally, the five links without nofollow would have flowed two points of PageRank each (in essence, the nofollowed links didn’t count toward the denominator when dividing PageRank by the outdegree of the page). More than a year ago, Google changed how the PageRank flows so that the five links without nofollow would flow one point of PageRank each.
更直观点的
图片来源:http://www.cnblogs.com/shuchao/archive/2009/10/14/pagerank-sculpting.html
所以这次Matt Cutts再次申明了:Pagerank Sculpting并不一定总是一个最好的主意。
更新下:看到wosoho的评论,觉得有必要贴出访谈原文里matt关于的Pagerank Sculpting的回话,
Matt Cutts: My advice on that remains roughly the same as the advice on the original ideas of PageRank Sculpting. Even before we talked about how PageRank Sculpting was not the most efficient way to try to guide Googlebot around within a site, we said that PageRank Sculpting was not the best use of your time because that time could be better spent on getting more links to and creating better content on your site.
这个说法可以自行理解下,看起来是比较官方的说辞之类。
我自己做的都是些页面不多的小站,对nofollow这类应用经验比较少,如果有朋友有Pagerank Sculpting这类实际操作经验的,希望能留言指出。
访谈全文:Matt Cutts Interviewed by Eric Enge
插图来源:An Illustrated Guide to Matt Cutts’ Comments on Crawling & Indexation