云裂变营销网

标题: 我是如何把「SEO」这词排名到百度首页的 [打印本页]

作者: 匿名    时间: 2021-12-31 18:11
标题: 我是如何把「SEO」这词排名到百度首页的
这几年来,我写的东西越来越少,各方面的原因。最主要的就是互联网大势的改变,微信的崛起与百度的没落。
在过去那些年里面,其实一直有些东西没敢分享,哪怕在开过几期的收费培训里面也没有提到过。不仅是藏私的考虑,而是这些东西如果大范围公开,大家都知道了,对行业的变化会是非常难以预期的。
而摆在这个时候,再来写写,可能也就没什么大碍了。
这篇文章想写的,是我当初把「SEO」这个超级热词排名做上去的理论与实际操作。这个词的竞争多大?行业里面,当时有至少数以百计的论坛、博客、培训网站、乙方的官网等等的都在做这个词的排名,竞争者是一线的从业者乃至团队。
但其实另一方面,毫不客气的说,这些竞争者不过是一群连基础概念都不懂的人罢了。
没错,可悲的是,哪怕这个行业的中流砥柱,也大多是连基础概念都缺乏的。
因此本文我必须要从基础概念讲起。

1.
一句话概括搜索引擎的排序规则:
在最短的时间内,让尽高比例的用户找到符合他需求的内容
从这一条终极原则出发,可以通过演绎法直接推论出许许多多的可能的操作点。

此处,为了方便理解,让我假设个情境。用户搜索「火影忍者」这个词,互联网上总共就三个相关网页。同时,假设百度总共只展示3条搜索结果,那么这三个网页同时展现了,分别的点击率如下:
假设总共只展示1条搜索结果呢?上面三个网页之中,无疑会展现1号网页。
但如果总共展现2条搜索结果?有意思的事情发生了,显而易见应该展现的是1、3号网页,这样才能满足不同用户的不同需求,达到整体点击率的最大化。

2.
许多词,背后都有着差异很大的细分需求。
比如「火影忍者」可以有「火影忍者动画」、「火影忍者漫画」、「火影忍者游戏」等等细分需求。
搜索结果首页的10条搜索结果里面,展示的细分需求越全面越好,这应该已经很容易想明白了。但是,百度是怎么确定每个词具体的细分需求是什么呢?
这里涉及到个非关键,但知道了会容易帮助想明白问题的知识点,其实也属于搜索引擎领域的常识——大多数用户,在看了一页搜索结果没有找到想要的内容的时候,不会选择翻到下一页,而是改为搜索另一个(往往更具体的)词。
所以对于百度而言很简单,只要看搜索「火影忍者」之后,有多少比例的用户会转为搜索「火影忍者漫画」,就知道这个细分需求的程度有多大。

3.
我是如何彻底确定上述理论的?
在赶集网负责SEO的时期,因为赶集是百度竞价的大客户,所以我混到了百度司南这个数据工具的使用权限。当初,百度司南提供一项数据叫做「后续搜索词」,明明白白的列出了在每一个词之后,有多少比例的用户转为搜索其它什么词。
比如当初看「招聘」这样一个词,后续搜索词有「招聘网」、「招聘找工作」、「招聘 58同城」等的。拿这些后续搜索词和具体排名去对照来看,发现果不其然,后续搜索词的比例排第几,它对应的网页基本也排在第几。
偶尔稍微存在一两名的偏差,再大些也不奇怪,因为存在「满意点击率」这个特殊的最后置排序调整规则,此处不展开。

4.
不知道读者看到这里有什么思考。问题在于赶集网是百度大客户,所以我有数据,所以我能想明白这些吗?
不是的。

在看到数据之前的很早时间,我就明白了这些。非常值得留意的事情是,到前面第2段为止,所有的都只是基于百度的排序大规则,加上逻辑推演就一步步得到的猜想。
当后续搜索词影响排名的「猜想」已经得到后,随便多看些词的排名,就足够确定这个排序规则了。
在这个过程中,没有借助任何项目经验,或是深奥的技术、繁琐的数据。

5.
单独了解「后续搜索词」这一个概念,还不足以把「SEO」这种超级热词的排名做上去。接下来,需要介绍的一个概念是粗排和精排。我仍然是通过「逻辑」来想明白它的。
不过就算没有深入思考,只要细读几本搜索引擎原理书,或者自己做个简单的全文检索,都一定会知道粗排和细排的问题。然而,哪怕我一向认为搜索引擎原理书籍是入门头一个礼拜就该去看的,却鲜少有人真正去踏实学习这种基础中的基础。
让我们具体来看这事儿吧:
假设百度在搜索结果首页想展示10个后续搜索词的对应网页,那么技术上有以下几种策略:
显然,尽管看上去搜索质量上面1>2>3,但计算的时间成本上1和2都远远大于3。
到这里为止,百度实际采用的哪个方案都可能,如果谁研究Google规则发现它用的是1或者2,毫不奇怪。

继续动用逻辑:
如果,主词的比如1000万的搜索结果里面,必有后续词;
比如「火影忍者动画」这种包含了「火影忍者」主词的。但顺带它们并不绝对需要包含。
那么,在这情况下,上述策略1和策略2的最终展示结果是一样的;
总有些特殊情况,比如缓存策略等等,所以需要多搜一些词来确定。
反过来,只要直接搜后续词排名第一的结果,有较高的比例没有出现在主词的首页,就能说明百度采用的策略3。
实际百度用的就是策略3。

SEO这东西吧,一个最好的地方就在于,排名结果都是摆在那儿的东西。要验证猜想,多搜些个词看看就行了,成本微乎其微,花上几个小时都算磨叽。
什么实践出真知,一定要试试才敢确定结果,测试一下动辄几周几月。那些不分情况总是固执于「实践」的人,脑子真的是不好使。

6.
虽然逻辑上说清楚了,有个对应的词会更容易记住这样的概念,一般在搜索引擎领域被叫做粗排和精排。
粗排,是搜索引擎从数以亿计的互联网页面去找到主词对应的top n个页面。
精排,是搜索引擎从top n个页面里面,再进一步的计算更复杂的规则,其中就包括了后续搜索需求这个问题(但远不止是)。
粗排精排的概念,我小范围公开分享过。后来有个朋友找认识的百度研发人员直接去问,对方回复是,百度的粗排这轮取的页面数量,就是搜索结果展示的最大数量760,而且粗排的排序规则只有BM25。
如果读者不知道BM25是什么,搜索引擎原理基础就属于一塌糊涂了,我个人建议从《走进搜索引擎》看起。
粗排规则只有BM25肯定是扯,只用BM25的话随便在页面上重复几次关键词就过粗排这轮了,极其不合理,而且也和我收集的大量案例不符合。
但粗排取的页面数量是760,根据我观察下来的粗略分析,有可能确实是这样的。

7.
写了很多了,但我究竟怎么把「SEO」这个词的排名做上去的呢?
介绍下当初网站情况吧,当时我运作了一个小型的SEO行业论坛,每日活跃发帖用户十几二十人。整个网站几百个页面,很少的友情链接(后来的也是排名上去后,随便就能和人换到链接,就保险起见加了些),更没其它外链。
开始动手做排名之后呢?因为排名做上去的流程实在太简单了,所以不把理论说全面,一定被当成扯淡:
没了。
真的没了。

8.
肯定有读者会想,这么简单有问题吧?如果直觉上有这样的想法,是应该的。毕竟,错误的归因,是大多数人都会犯的错误。
我看过很多很多次,有谁做了什么SEO操作,过了几个月了都忘了,回来发现流量涨了,就说自己做对事了,瞎对应。

归因,至少在SEO这件事上,正确的归因至少要具备两个条件:
1) 合理的理论解释
2) 合理的时间点

在我的网站「SEO学堂」这个后续词已经排名前列,而「SEO」在前760名都看不到的时候,我知道最后一步只差进「SEO」这个词的粗排。
而且根据观察,百度的粗排规则主要是类似于PageRank的比较基础的权重,这也是个稍微多搜些词就能发现的问题。因此我买了两条链接,随后一周左右的时间,百度排名更新后排到了首页。

9.
有一个读者肯定已经发现的奇怪的还没解释的问题,为什么后续词是「SEO学堂」这么诡异的词?
答案是,我也不知道谁刷的,一直在那。我那时早没百度司南的数据权限了,但只看到长期有个title里面包含「SEO学堂」,也基本没命中其它后续词的页面排在首页,就能直接确定「SEO学堂」是个有用的后续词。借了个巧。
后来排名稳定了一段时间,我也把自己网站上的论坛运作的还不差,想想网站权重应该不低了,同时觉得「SEO学堂」这个诡异的词放在title不太合适,就去掉了它,改为了「SEO教程」,排名仍是稳定了许久。
如果不是我这种实在没内容没链接的小破论坛,只要稍微好点的网站,当时都完全是可以直接做「SEO教程」或其它类似的后续词排名的。
等等!

「SEO学堂」改成「SEO教程」之后,我网站排名没掉是因为什么?真的是我前面说的理论那样吗?还是本来就可以排在前面了,一切只是巧合?
还是前面提到的,读者在阅读过程中,有怀疑是应该的,没有怀疑才是错误的汲取知识的态度。
但是,回到后续词的理论上,哪怕可能没做过、没观察过,还是可以仅仅通过逻辑想明白。将后续搜索词,结合粗排精排的概念,可以得出猜想:

对于存在后续词效应的主词,其对应搜索结果页面的排名只有两种状态:在第一页、在后面任意位置。并不存在第一页排名下降后顺位挤到第二页的情况。
实际情况会稍微复杂些,比如开放平台占位、点击调权等,但整体还是前面所述。

当初,我的网站通过「SEO学堂」排上去的时候,原来那个「SEO学堂」对应的其它网站排名同时掉到了很后面;
同样,「SEO教程」上去的时候,原来的「SEO教程」对应网站排名也同时掉到了很后面。
理论、时间点都完美符合,因此是正确的归因。

后来,一方面是因为焦大他也自己琢磨出了个大概,和我竞争排名;另一方面我那时候创业做外包,业务量大实在顾不过来。最终「SEO」这词的排名在百度首页保持了一年多以后掉了。
另外,时至今日,读者已经没什么必要再去分析「SEO」这个词的排名了,百度首页目前被各种刷点击的网站全面覆盖,倒也是简单粗暴。

总结
通篇文章,读者可以再回顾。一切,都是哪怕一个外行人都可以很轻松的快速掌握的常识,通过大量的逻辑推演,再稍微搜些词验证猜想,就最终得到的完备理论。
很多同行都知道我行业经验十分丰富,那么可能多少会想,尽管我通过逻辑说明白了前面的问题,但事实上,是否是我通过「经验」做出了效果,只是通过逻辑来解释,借此把功劳交给了「逻辑」?
第n次强调,有怀疑的态度是应该的。

不是的。
我当初为什么把「SEO」排名做到百度首页?因为我在美团那阵实在太闲了。那年我23岁,从业仅四年。而且,我想明白这些理论,则是更早得多的事情,哪有什么经验可依。
最后实际操作起来,改个title、买两条链接。在绝大多数人看来几乎不可达成的「SEO」这种词的排名,实际做起来不过是吃两顿饭的功夫。

一天到晚换链接、伪原创……
看上去高大上些了,
一天到晚写代码、爬数据……
都在干些什么?
作者: 匿名    时间: 2021-12-31 18:12
很早就发布在公众号的文章,突然想到再搬到知乎上
作者: 匿名    时间: 2021-12-31 18:12
写得真好,真想跟你学。[小情绪]
作者: 匿名    时间: 2021-12-31 18:13
思路不错
作者: 匿名    时间: 2021-12-31 18:13
求Z大公众号
作者: 匿名    时间: 2021-12-31 18:14
同求
作者: 匿名    时间: 2021-12-31 18:14
有空试试,看看渣度改策略了吗?谢谢Z大分享~
作者: 匿名    时间: 2021-12-31 18:15
感谢分享
作者: 匿名    时间: 2021-12-31 18:15
时候后把刷点击的原理说一下了
[吃惊]
作者: 匿名    时间: 2021-12-31 18:16
aeo啊,汗的汗死,涝的涝死……
作者: 匿名    时间: 2021-12-31 18:17
就凭这些信息,完全可以找到Z大的公众号。不过是搜一下的工夫。
作者: 匿名    时间: 2021-12-31 18:17
有没有兴趣做8115,爱站这类的seo工具类网站? 还是挺有前景的
作者: 匿名    时间: 2021-12-31 18:18
很有兴趣想了解下如果让你从0做一个网站目标流量十万,整个行业假设有千万搜索量,不知道你需要多久,多少开发,编辑? 我只是好奇问问,特别感谢
作者: 匿名    时间: 2021-12-31 18:18
SEO自己做流量尚存空间,做服务/工具/培训的市场已经远远不如以前了,做工具类网站意义不大。至于新站到10万流量,我做不太到,经验所限;反之如果一个站已经有十万乃至百万的流量,翻倍轻松的很,花两天时间改网站,再干等两个月时间的效果,最多也只需要一个技术人员。
作者: 匿名    时间: 2021-12-31 18:19
大佬,我真搜不到,搜什么关键词
作者: 匿名    时间: 2021-12-31 18:19
公众号名称:零思  旭然 共两个公众号
作者: 匿名    时间: 2021-12-31 18:20
谢大佬!
作者: 匿名    时间: 2021-12-31 18:21
嗯,那也挺不错了,我也在做这方面的,有时间再交流,关注了
作者: 匿名    时间: 2021-12-31 18:22
我在开发摩天楼的过程中,用了3个月验证百度的tfidf算法,结果不是很准。
又通过2个月的数据训练集才基本验证了百度用了BM25的算法,但是一直没有公开资料说百度用了BM25,,终于无意中浏览知乎的时候看到你这篇文章。
Z大真的是通过现象看本质了,小辈如获至宝,感激涕零。
作者: 匿名    时间: 2021-12-31 18:22
非常中肯
作者: 匿名    时间: 2021-12-31 18:23
这种理论扎实的十年二十年前的基础算法,闭着眼睛都能知道百度一定会用它或者类似的算法,干嘛要验证。。。要研究也跟着百度专利看些新的东西。




欢迎光临 云裂变营销网 (https://www.yunliebian.com/yingxiao/) Powered by Discuz! X3.4