百度最近更新的搜索引擎加密算法有哪些,和过去有哪些不同

扫描体验微信营销
||服务专线:021-
大家知道搜索引擎的算法是变幻莫测的,也就是说搜索引擎这些年来是不断发展,不断改进的。也许今天是这样的算法,明天就会是别的算法了。所以了解搜索引擎最新的算法成了我们广大SEOer不断追求的目标。下面亿万科技给大家探讨下最新百度搜索引擎算法是什么?
& & & & & & & & & & & & & & & & & & &
百度搜索引擎的特点: &
  1. 基于字词结合的信息处理方式。巧妙解决了中文信息的理解题目,极大地进步了搜索的正确性和查全率。
  2. 支持主流的中文编码尺度。包括GBK(汉字内码扩展规范)、GB2312(简体)、BIG5(繁体),并且能够在不同的编码之间转换。
  3. 智能相关度算法。采用了基于内容和基于超链分析相结合的方法进行相关度评价,能够客观分析网页所包含的信息,从而最大限度保证了检索结果相关性。
  4. 检索结果能标示丰硕的网页属性。(如标题、网址、时间、大小、编码、摘要等)并凸起用户的查询串,便于用户判定是否阅读原文。
  5. 百度搜索支持二次检索(又称渐进检索或逼进检索)。可在上次检索结果中继承检索,逐步缩小查找范围,直至达到最小、最正确的结果集。利于用户更加利便地在海量信息中找到自己真正感爱好的内容。
  6. 相关检索词智能推荐技术。在用户第一次检索后,会提示相关的检索词,匡助用户查找更相关的结果,统计表明可以促进检索量晋升10-20%。
  7. 运用多线程技术、高效的搜索算法、不乱的UNIX平台、和本地化的服务器,保证了最快的响应速度。百度搜索引擎在中国境内提供搜索服务,可大大缩短检索的响应时间(一个检索的均匀响应时间小于0.5秒)
  8. 可以提供一周、二周、周围等多种服务方式。可以在7天之内完成网页的更新,是目前更新时间最快、数据量最大的中文搜索引擎。
  9. 检索结果输出支持内容类聚、网站类聚、内容类聚+网站类聚等多种方式。支持用户选择时间范围,进步用户检索效率。
  10. 智能性、可扩展的搜索技术保证最快最多的收集互联网信息。拥有目前世界上最大的中文信息库,为用户提供最正确、最广泛、最具时效性的信息提供了坚实基础。
  11. 分布式结构、精心设计的优化算法、容错设计保证系统在大访问量下的高可用性、高扩展性、高机能和高不乱性。
  12. 高可配置性使得搜索服务能够知足不同用户的需求。
  13. 提高前辈的网页动态摘要显示技术。
  14. 独占百度快照。
  15. 支持多种高级检索语法,使用户查询效率更高、结果更准。已支持&+&(AND)、&-&(NOT)、&|&(OR)、&site:&、&link:&,还将继承增加其它高效的搜索语法。
有良多枢纽字人们会常常拼写错误的,找出这些常常泛起错误拼写的词或词组可认为你带来额外的流量。(就GOOLE来说,它有检查拼写错误的功能。建议不要用拼写错误的词、词组作枢纽字)
  1、 处理枢纽字:
  首先收集良多与你的网站或产品有关的枢纽字了。接下来的工作就是把收集到的枢纽字进行组合,把它们组成常用的词组或短语。良多人在搜索的时候会使用两 个或 三个字组成词。据统计,均匀是2.3个字。不要用普通的,单个字作为枢纽字。这样的枢纽字很难排到搜索引擎的前十位。例如:你有以下几个枢纽字:&搜索引 擎、软件、进步&,试着把他们组合为&搜索引擎软件&、&搜索引擎进步&等。把字组成枢纽字短语有利于进步你网站的排名,你将会更有效进步你网站访问量。 例如:很少人会用&搜索引擎&或者&软件&。
  2、 舍弃一些枢纽字: 寻找出那些搜索时很少用到的枢纽字:
  A:在英文里,在搜索引擎大小写是没有区别的。
  B:拼写错误的枢纽字是没用的,但是找到一个常常泛起拼写错误码的词可以额外埠进步你的访问量
  C:去除那些停用的词,在英文里有&the, for , a ,& 等。中文里有&的,地,你,我&等。
  D:没有人会用&最好的&,&疯狂的&等词语进行搜索。假如你的网站里有类似的词,最好把他去除。
  选择最佳枢纽字:
  假如你按照上述所说,你一定列出了一大堆的枢纽字。尽管,你已经去除了一些没人使用的。但是对于你来说仍是太多了。现在是时候进入枢纽字优化的最后一步了。
  提示:
  试着用剩余的枢纽字在搜索引擎中进行搜索,不要把焦点放在最流行的枢纽字上。有时候,次枢纽字排名起来仍是比较轻易的。由于最流行的枢纽字会存在着更 多的竞争对手,而次枢纽字反之。在选择枢纽字时的技巧是找出枢纽字需求与枢纽字竞争的平衡点,即所选枢纽字竞争不是很激烈。
  为什么要使用html的meta标签?
  1、 meta标签是内嵌在你网页中的特殊html标签,包含着你有关于你网页的一些躲藏信息。Meat标签的作用是向搜索引擎解释你的网页是有关哪方面信息 的。对于高级的搜索引擎来说,html 的meta 标签并不是什么新颖的东西。但是不管如何它是一个优秀网页不可缺少的。下面我们就它进行一些讲解吧。
  2、当你计划策略是meta标签长短常重要的。尽管如斯,一般的加入meta 并不能匡助你在搜索引擎中获得更好的排名。有好几种meta标签,但重要的有以下几个:description标签, keywords标签, title标签(严格来说title不算是一个标签)。当你不时刷新标签时这几个标签显得特别的重要。假如你但愿搜索引擎对你的网站进行索引时就会用到 html标签的重定向(redirect)标签与robots标签。
  留意:调查表只有20%的网页用到&枢纽字&与&描述&标签(即keyword, description)
  多个枢纽字用逗号分开。
  3、 title 标签
  title 标签可能是你网页中最重要的标签,它是你网页中最先看到的部门。把它放在description 与 keyword前。在这个标签中最好是加上你网站的枢纽字,title标签在搜索引擎的搜索中据有非常重要的地位。最好是把它放在其他meta标签前,这 更有利于你网站的排名。(留意:有些搜索引擎会按title标签的字母的优先权进行排名,尽量在你的title中使用开始的字母)title标签是人们在 搜索引擎中第一个看到有关你网站的描述,所以尽量把它弄得简朴、明了。让人一看就知道你的网站是关于什么的。
  4、 Description标签
  Description标签就在title后面,该标签可以是一小段(一个或者两个句子)。用于描述你网站。与title标签一样,这也是人们在搜索 引擎 列表中链接到你网站的点击。这些描述将鼓动人们去浏览你的网站而不是你竞争对手的。(描述不能太夸张。不然,当访问者到你网站发现内容根本不是你说的那个 样子,那么他很快就会退出去。)良多搜索引擎答应描述的字数在150个左右,所以你要保证你的描述在150以下,否则搜索引擎会自动把多余的部门剪去从而 造成你网站的描述的不完整。搜索引擎以为描述里的枢纽字远比网页中的内容要重要(似乎现在这种情况不是那么显著了)。真如上所述,这里提供了非常重要的信 息:确定你的描述能准确的反映你网站的主题,尽量在描述中加入你主要的枢纽字,越靠meta的枢纽字意义越大。这样会突显你的枢纽字。
  现在大多的搜索引擎(google除外)都会支持descriptin标签。假如你不使用的话你将会失去排名靠前的可能。
  5、keyword 标签
  比拟于description与title标签,keyword标签显得并不是那么重要了。有些搜索引擎把它完全地忽略,但是使用下准确的keyword标签对进步排名仍旧有效。
  除了搜索引擎外,一般情况下人们是看不到的。keyword标签是一个躲藏的标签,向搜索引擎提供了一组与你的页面有关的的枢纽字或枢纽短语列表。你 可以 用相应的工具找出一系列合用于你网站的枢纽字。(留意:枢纽字标签中只能包括与你本页内容相关的枢纽字列表。所有在这里的枢纽字必需与页面的内容相联 系。)
  提示:在你每一个页面中组织相关的枢纽字,每个页面必需专注于不同的产品或者内容。在标签中列满枢纽字对于进步你网站的排名并没有好处。多个枢纽字间 用逗 号用隔,逗号表示是逻辑&或&的意思。空格表示逻辑&与&。这是正式在keyword标签中描述枢纽字必需的。尽管如斯,良多搜索引擎也会把枢纽字间以空 格分开以达到能搜索出更相关的结果的目的。这样做的意义是,搜索引擎会把空格分开的枢纽字根据一定的方式自由组合。可以尝试用两种方法,看哪一种更加适合 你。
  枢纽字不宜以统一形式重复3-6次,一般这已经以为是最大的枢纽字重复数(似乎现在又发生了变化)。所以,尽量避免把你的枢纽字一次又一次地不断重 复。这 对于每一个搜索引擎来说是SPAM(枢纽字垃圾),你会因此而受到惩罚。大多数的搜索引擎会答应你在keyword标签中使用最多 1000个字符。通常,对每一个页面使用相关连的枢纽字会进步你网站的排名。一个很重要的因素是你枢纽字冗余度,假如你一个枢纽字是一个字符,而你的 keyword标签中有100个字符,那么你枢纽字的冗余度就为1%。搜索引擎将会利用相关的算法对你的枢纽字冗余度进行统计你网页中的每一个重要的词或 短语。去除多余的枢纽字有利于进步你网站的排名。
  基本搜索引擎优化策略:
  为什么有的网站能在搜索引擎上排名很好,而有的却连找到找不到呢?这个秘密何在呢?正如免费搜索引擎上的指导方针所说,有五个因素你是必需铭记于心的:
  1、 你网站的内容与主题。
  2、 每页的枢纽字数。
  3、 枢纽字放置的位置。
  4、 点击量。
  5、 链接数目。
& &搜索引擎优化策略:网站内容
  网站的实际内容是seo策略的一个重要的因素。假如你想让你的网站在搜索结果中排得靠前,在你的网站中必需有实际的内容。搜索引擎的蜘蛛基本上是一个瞎 子。他们只能对你网页内容进行判定你网站的质量,而不能从图片、flash动画上判定。在所有的页面中有充足的内容给搜索引擎进行索引是一个成功搜索引擎 优化策略的基本需要。很轻易明白,为什么一个没什么内容的网站很难排上去。人们在查找信息的时候,老是但愿找到一个包括良多重要信息的网站。很天然,网页 内容丰硕的网站要比那些网页内容还那么丰硕的网站排名要好得多。每个为他们的网站进行优化的站长请牢记:不要健忘更新你的网站。不管是搜索引擎仍是访问者 都但愿看到比较新的信息。这是什么意思呢?这就要求你要收集大量的信息,专注于这领域的变化。
  搜索引擎优化策略:枢纽字密度
  枢纽字密度 (Keyword Density)是指在一个页面中,枢纽字(keyword)或枢纽字段(keyphrase)占所有该页面中总的文字的比例,该指标对搜索引擎的优化起 到枢纽的作用。为天然进步在搜索引擎中的 排名位置,您网站中页面的枢纽字密度不能过高,也不要过低,一般在 1% 到 7% 较为合适。假如要达到 1% 的比例,那么您在均匀100 个文字中最好包含 1 个枢纽字或枢纽字段,假如在 1000 个文字中仅仅只包含 1 个枢纽字或枢纽字段,那么枢纽字密度就被稀释了。记住,您千万别把所有的枢纽字或枢纽字段堆积在一起,要不搜索引擎将人为是一种恶意行为(Spam),  直接降低您网站的排名位置。
  索引擎优化策略:凸起枢纽字
  在有价值的地方放置枢纽字,当你统计完你的页面需要多少个枢纽字后,接下来就是考虑把你的枢纽字放在网页的什么地方。凸起枢纽字是吸引搜索引擎留意的 一个 最重要的因素。搜索引擎将会专注于你网页中某一部门的内容,处于这一关注部门的词语显得比其他部门的词语要重要得多。这就是所谓的&凸起枢纽字&。
  A: Title 和meta 标签:在上一节已经提到,title 标签是网页中最重要的标签。所以在title中放置枢纽字显得非常重要。有一些搜索引擎会额外的留意&描述&与&枢纽字&标签。
  B: 标题(headings)
  标题标签为你的访问者指明了哪些是网站中比较重要的内容。在&标题&标签中能泛起枢纽字对于进步你网站排名有很大的好处。
  C: 超链接文本: 你链接到一个网页与你网站内容相关,这一想法主意长短常正常的事。这也是枢纽字在链接文本中为什么那么重要。
  D: URL文本:在你的域名和你的网页中泛起枢纽字对于搜索引擎排名会产生很大的影响。这样的枢纽字被称为&URL文本&,在另一个网站与你网站建立链接时,尽量使用枢纽字作为链接文字,这有利于进步你网站的重要性,从而影响到PR。
  E: 顶部:网页顶部的文本,每段开头的内容显得特别重要,所以,尽量在这些地方把枢纽字包含进来。
注:转载请注明出自于西安建站:/news/.html
客服热线:
体验微信营销蒋鑫鹏:百度搜索算法总结—关键词分词算法 - A5站长网
当前位置:
蒋鑫鹏:百度搜索算法总结—关键词分词算法
21:22&&来源:&
  此文接上文百度算法总结详细请点击:
  一、关于中文分词:
  1.中文分词难度分析
  首先要说明下的是:普通用户的搜索与做SEO或者更大说熟悉网络搜索用户的搜索习惯是非常不一样的,而恰巧普通搜索用户是百度搜索的基础力量。在开头赘述 这一点是蒋鑫鹏为了表达其对于百度搜索算法中的中文分词的重视。因为,对于百度google这样的第二代搜索引擎来说,采用的检索技术主要是依靠关键字来 匹配的,而用户对于关键词的理解与机器程序对于关键词的理解是有很大距离的。
  在中文分词方面百度胜过了Google,这是baidu取胜google的关键因素之一,中文的分词比英文要复杂得多(同样与中文分词一样麻烦的重要语言 还有日语、韩语、俄语,这也是Google没办法在这几个地区取胜的原因之一),蒋鑫鹏在这里因为篇幅不做赘述,有兴趣的朋友可以研究一下拉丁语系(以英 文为例)的造句与中文造句的区别,中文造句不仅近义词很多,而且语序变化无常,副词太多(主谓宾之外的定状补,叹词等等)。
  简单举个例子&百度如何排名&&百度是如何排名的&&百度怎么排名&&百度是怎么排名的&&百度如何排位&&百度怎么排位&&百度按什么排名&&百度靠什 么排名&&百度的搜索是怎么排位的&&&这几个短语短句至少都包含一个意思&百度搜索结果的排名是什么规则(原理)&,除此之外,每个句子都有其他的含 义,如这些句子还包含有&怎么做百度排名(实现这个目标的方法)&&百度是怎么进行搜索排名的(原理实现的过程)&&&
  拿上面的例子来说:当用户输入以上短句时(大多数情况下,普通用户把百度当做是万能的,所以才搜索SEO开来这么不符合规则的搜索行为),百度要迅速的响应出用户需要的结果,这个时候,百度面临的核心问题是:
  A.首先要知道用户是要搜什么(语义分析,见&二&);
  B.其次因为百度的检索方式目前仍然以关键词匹配技术为主,所以要对用户的搜索进行分词(下一段将分析百度如何分词);
  C.然后百度要通过分词分出的结果,去数据库中检索匹配的快照;
  D.上一步只是检索出来,还要进行第四部的排名,这个时候已经不是挑战百度的难题了(虽然在SEO看来,这一步确实是非常艰难的)
  E.第五步要将得到的结果返回到搜索页面给用户使用,并且要完成其广告的投放(百度竞价广告),并要适当推广自己的产品(百度知道、百度文库&&)写的有点乱,蒋鑫鹏在此致歉,没找到更好的陈述方式,望朋友们整理发扬光大。
  2.百度中文分词方式:
  百度对于中文的分词不仅是大量的用户搜索(这点不同于Google,百度毕竟是植根于中国文化的,对中文更了解),而且还有庞大的中文词典数据库作支撑, 并且动态加入了搜索热词,搜索行为造词等技术,【从近期百度算法的调整看,百度比以前更加尊重用户的搜索行为,就是用户的输入为首要,百度纠正次要,这点 那很重要哦】下面以实例来说,用户搜索&百度如何排名?&时的分词:
  A.自然分割:包括标点符号、空格引起的分割,这是首要因素,比如或者&百度 如何排名&这样的搜索行为会被百度首先划分为&百度&、&如何排名&,这一点是肯定的,要理解用户搜索的行为意图,首先是要尊重用户的搜索行为;(这是 SEO顾问蒋鑫鹏根据实战中的观察总结出的,做SEO的很多朋友可能没注意到,在此提个醒)
  B.中文词库分割:不难理解,&百度如何排名&将被分为&百度&&如何&&排名&这几个词,因为这是中文词典里存在的词,百度有庞大的中文词典库支撑,这个不是难度;
  C.分词组合分词:B中的分词显然是不够的,要更能理解用户意图,必须保证语义连贯,那么那三个词可以组合成&百度如何排名&;&百度如何&+&排名&; &百度排名&+&如何&;&如何排名&+&百度&以及这几个词颠倒的组合,重要程度按照顺序优先原则,紧接着是倒序和双向序列的分词组合,分析切分有个基 本的原则就是最少的切分。
  以上三点是通常意义上的分词,除此之外,还有更麻烦的分词需要百度处理,见后几点。
  D.分字:如果用户搜索&百 度 如 何 排名&的时候,百度也是无可奈何的,因为你不能判断出来用户就是在搜索&百度 如何 排名&,还得尊重用户搜索行为,所以,不得不进一步将中文词进行分字:&百&&度&&如&&何&&排名&,然后在进行组合分词,组成不同的词组去数据库中 匹配。
  E.别音字/错别字:如有人搜索&白度如何排名&实际上是误将&百度&打成&白度&,那么百度还要纠正这种错误,但近期的调整看,百度不像以前通过词库近 义匹配来进行纠错【而更多的是以用户搜索后浏览的行为积累的数据来为纠错做准备】(如搜索&白度&的很多用户最后花更多时间在&百度&关键词页面上,那么 百度以后对于&白度&的搜索纠错会偏重到&百度&上!
  当然,这个词是蒋鑫鹏举例说明,实际上百度搜索&白度&不是这样的,例子可以参看百度的&美规车&查看,百度会提示或者说试探你&您要找的是不是: 美规车&),此外,百度对于纠错通过搜索下拉框相关词推荐、搜索页面底部&相关搜索&、百度知道(用户量很大,是百度搜索的重要补充)来进行纠错数据的统 计与纠错引导。
  F.新词:新词的来源一般有两种:a.近期流行语造成,这个百度的数据库会根据用户搜索行为积累的数据以及网络热词监测数据来进行调整补充到词库;b.语言新词/用户造词,这个主要是靠搜索行为累积的数据调整,也针对部分语言新词人工作补充。
  蒋鑫鹏再次补充说明一下,百度其实很累的,它对用户的每一次搜索行为都要进行统计(当然是机器程序记录的方式):一般主要记录搜索的关键词、到访的页面及 到访方式(一般都是链接)、各页面停留时间(之前不容易读取到,现在百度通过浏览cookis、百度账户、IP记录、百度统计【如果网站装了百度统计的程 序,实际上百度很聪明,用各种方式想尽办法进入到网站,比如最近流行的百度分享按钮,这个工具实际上就是最大的间谍】等大量辅助工具来统计),一般测算是 根据搜索后到访的百度提供的快照页面的浏览行为(先打开哪个,然后打开哪个,在哪里停留的时间长,最后从哪里离开百度来实现,百度对于一个网页对用户是否 有用的观点:在该页面停留时间最长,并最终在此页面浏览完毕后离开百度为首要标准,其次还有在这些页面的互动程度所起的因素。
  二、关于语义分析:
  其实这段要说的在上一段已经都提到,列出来无非是将&语义分析&这一检索行为与&分词&区别开来,语义分析与分词是相辅相成的,语义分析更多的建立在分词 与用户浏览行为习惯数据的研究结论基础之上,如前所述,百度通过各种方式大量统计用户的行为并针对这些行为及所用的关键词及输入方式索索的统计数据进行分 词的支撑与分词的匹配。
  毕竟,再怎么算,那么多网页、每天数十亿次的检索行为,百度还是难以计算出来的(百度正在通过不断改进方式及完善机器算法来努力实现这一浩大工程),目前 主要采用的是针对热门搜索的抽样统计与其他搜索的随机统计来实现搜索语义分析(此为SEO顾问蒋鑫鹏根据实战中的观察做的假想推断)。
  百度最难以捉摸透的与其说是排名算法,不如说是语义分析算法,因为与SEO搞不懂百度算法一样,百度同样搞不懂搜索用户的搜索意图(所以百度一直在研究, 一直在调整,一直在完善,就像SEO一直在研究,一直在调整,一直在完善一样的道理)。捉摸不透是一个原因,更重要的是这些计算不仅仅是对于文字及分词、 匹配度的研究,更是通过统计学、线性数学、逻辑学、行为学、心理学等众多的学科的精华计算方法结合在一起设计出的算法结构,并不断修补完善的,说到这个算 法,百度有一个形容&海量基础算法&,更不用提每种算法的学科本身的难度了,这就是苦逼的SEO迟迟不能搞懂百度算法的根本原因,当然,作为苦逼的 SEO,蒋鑫鹏同样也是搞不懂的,如果能搞懂的,大多都是数学或计算机天才或顶尖人才,早都去搞自己的研究或者发明去了,还至于追在百度后面吹毛求疵?
  更何况,百度本身对于搜索结果的&人为干涉&及&垄断&都带来各种斥责,更何况SEO为了一己之利不断刷排名给用户推荐低质量的信息,那就更遭懂得并理解 搜索算法的牛人看不起了&&所以看到这里,如果你觉得你很牛,就不要做SEO了,如果作为SEO你明白了作者蒋鑫鹏写此篇文章的意图,那你就站在SEM或 者网络运营、网络营销的高度来看待SEO,而不是为了半夜趴在电脑前发外链混营生而SEO。
  扯远了,回归正题,做不到像百度一样设计算法的那个能耐,如果说还能从语义分析中挖掘点对SEO有帮助的东西,那么蒋鑫鹏建议可以去研究研究你正在做的优 化的相关词的用户搜索习惯,比如,蒋鑫鹏最近给上海智宝美规车做网络运营服务期间,发现&美规车&这一词正在受到越来 越多的关注,而做这个词优化的很多SEO或者说站长都顶住&美规车&一个词做,而这个词用户搜索的时候,有可能衍生为&美规汽车&&美规汽车SUV&&美 规车SUV&&美规SUV&&美规车销售&&美规车经销&&美规车经销商&&美规汽车经销&&美规汽车销售&&美规汽车进口代理&等众多的派生词,甚至 &美规车哪里买&&上海哪儿销售美规车&这样的更具有成交意义的长尾关键词,如果理解用户的搜索意图,再针对性的做SEO,这样取得的效果会更好。
  三、关于关键词匹配度:
  1.关键词分词匹配重点次序:
  这是蒋鑫鹏根据SEO实际操作结合网友分享做的总结,精确度不高,但可作为参考。一般意义上的分词算法是&关键词比率&:计算该关键词在页面信息中的比 重,通常包含的参数有:title(网页标题)、meta description(网页描述/摘要)、meta keywords(网页关键词)、网页H1~H6标签、锚文本(按照重点程度及页面位置排序)、内容文本(突出程度如字体、大小、颜色、周围的背景或者说 文字等,一般的位置顺序是从左上到右下)、图片及其他页面文件的Html标记语言属性。
  2.关键词匹配度计算:
  分词后,要对短语中的关键词进行&索库&,如果某个词在短语中与其他词相关性不大,将去除匹配,但是其他词计算匹配度时任然作为字数计算。以&百度如何排 名&来分析:一般意义上,这个搜索短语被分为&百度如何排名&;&百度如何&+&排名&;&百度排名&+&如何&&&:那么&百度如何排名&匹配度就是 100%,紧接着就是&百度排名如何&,&如何排名百度&,&如何百度排名&,&排名百度如何&,&排名如何百度&;&百度排名&的匹配度是1/3+1 /3=2/3;&如何排名&的匹配度是1/2;&百度&的匹配度是1/3&&以上只是粗略的估算,具体的都多分词算法还要加入相关参数计算,如顺序优先 度,倒序优先度,双序优先度,最少化切词度&&(具体的算法因蒋鑫鹏学识有限,恕不能分享,在此只是一个基本思路的分析,可以供朋友们参考,另外分词中含 有很多关于标点符号、空格、单字等的处理)
  3.title关键词匹配度:
  title中的关键词在title本身的分词匹配中的计算方式与2中提到的一样,蒋鑫鹏在此想说明两点:A.根据观察推断,百度收录快照后,对快照的存档 中应该已经做好可能的分词及匹配度的数据标注(如果不是这样,那么百度检索的效率不会有这么高)B.每一次用户的检索百度都要进行分词,并依分词的结果从 从档的快照中的分词标注中做最大化的匹配。
  另外,Title的公认长度一般认为是不超过80个字符(包含标点及空格,折合中文汉字约为40个字),但从百度检索结果的快照标题中看,对于不同站点百 度根据权重会有不同的限制,一般为60个字符,有的站能达到70个字符,超过的部分用&&&代替,但并不意味着百度不计算在内,以 &&来说,蒋鑫鹏再添加标题的时候将&智宝美规车SUV&放到最后,但你百度&智宝美规车SUV&的时候现实的快照标 题可以正常显示&智宝美规车SUV&而将title超过显示的部分以段前段后省略的方式显示。
  一般,如果没有特殊必要,建议不要超过公认的80字符,否则,不仅稀释了关键词的匹配度,还会影响搜索引擎对快照的打分。
  【做title的技巧】,写到此,顺便分享下蒋鑫鹏的一点技巧,企业网站因为页面少,一般容易获得排名的主要是主页,所以主页的title一定要精心布 置,如果实在放不下的关键词放到description中靠前的位置,另外,建议将站点名称简写放在后面,以保证重点关键词靠前而获得较好的匹配度,站点 名称用&【】&起来,虽然浪费了4个字符,但是在搜索结果中会比较突出,能吸引用户的注意而提高网站知名度和进入率。
  顺便提下,蒋鑫鹏在操作中发现,如果头部标签更新频繁过度会被降权处理(一般头部修改后会进入快照观察期,搜索结果对于修改后的标题显示会延迟1~3周不 等,具体根据不同关键词在页面内容中的体现更新及外部链接锚文本中包含该关键词的更新度不等而延迟时间不等),头部标签一月内修改2次以上,百度会直接随 机抓取页面内的文本作为描述摘要。Google对于Title更新频繁的页面,会直接抓页面布局中重点体现的某段短语做标题。
  4.description关键词匹配度:
  与title的计算方式类似,只不过description不会被百度像title一样被分词,而只作为title中关键词和keyword中的关键词以 及给给页面带来流量较大的关键词的匹配计算,关键词在description中的匹配度按照顺序优先原则,以关键词在description总字符中的占 有比率及连贯度计算。
  description是对页面的摘要说明,做SEO的童鞋务必遵守规则,不要将无关信息或者说页面文本中不包含的关键词堆叠到此,以免降分。
  description公认的允许最大字符量为200,百度快照显示的一般为140字符左右,蒋鑫鹏建议不要超过160字符,因为这样不仅稀释关键词匹配 度,而且百度最近的算法调整,对description超出快照显示的部分将不再做关键词匹配。同样以智宝美规车来说 明,蒋鑫鹏将美规GMC放在描述摘要最好,最近算法调整后不做显示了(当然可能是个案,仅供参考)。
  5.keywords关键词匹配度:
  keywords对于百度来讲,貌似本身不作为匹配,但是有一点百度很在意:不要将页面没有的关键词加到keywords中,如果这样,有可能会被认为是在作弊,这点对于Google来说更是如此,Google对于keywords作弊比百度严格的多。
  keywords一般公认的不超过100字符,这点,蒋鑫鹏的理解是,对于Google来讲:keywords一定不要过多,要与页面匹配,一般页面能容 忍的关键词也就十多个到头;对于百度来讲,建议keywords的设计根据百度权重(可用站长工具或爱站网测试)关键词来设计,有权重的词,可以加到 keywords中。
  对于企业网站而言,因为Title和description限制而字数有限,无法容纳公司全称,这个时候可以考虑将公司全称及简称在keywords中体现一下,因为页面版权信息中一般会包含公司名和简称。
  6.页面内容中的关键词匹配度:
  页面内容不做分词计算,但标签中的分词和快照中存档的分词在页面所占比列计算中会对页面中包含的关键词进行匹配并计算次数及在整个页面字符中所占比例。
  页面的关键词重要程度首要的是H标签和其他重要的标签,当然在百度快照中主要是按照页面世家显示的文字为标准,一般链接锚文本中包含的关键词、页面突出位 置出现的关键词、以突出的方式(字体、颜色)展示出的关键词会比较重要,这点要根据具体页面作分析,SEO朋友们可以在检索关键词结果中直接查看百度快照 中显示的关键词匹配程度,黄色最高,其次为红色和蓝色、绿色。
  快照是存放在百度数据库中的静态网页,不是真实的网页,所以就有快照更新一说。从快照页面源代码中可以看出,百度快照中只是记载了页面的基本代码及文本文件,并为存储照片及其他文件,现实中的快照中的图片是从页面文件收录快照时记录的文件地址调用过来的。
  百度快照的存在,才是大家都关心百度快站更新的根本原因,因为如果快照不跟新,获得排名的机会就会变少,这个时候的你的网站的快照在百度快照数据库中就像 一个弃婴&&写到此,作者蒋鑫鹏再次将自己的观察提醒一下:以前大家都认为静态页面更受搜索欢迎,随着2.0的不断发展及互联网社交化的趋势,似乎这点正 在被改写并朝着相反方向发展,静态页面、伪静态开始被搜索程序嫌弃&&蒋鑫鹏是这样理解的,如果页面是静态的,那么搜索引擎更容易认为你的页面内容更新会 比较慢,这样自然影响收录频率,蜘蛛到访的频次也就降低了&&
  四、关键词匹配操作&&实例分析
  以上大致讲述了SEO蒋鑫鹏对于百度搜索中文分词及语义分析、关键词匹配的皮毛理解,下文通过实例重点讲一下如何让网页与关键词进行匹配。通常,SEO一 般接到的任务都是客户/领导甩过来一个站,指定几个关键词,然后放手去做,除了在头部标签加上关键词,大量采集一些关键词相关的文章,剩下的貌似都是用各 种工具进行大量的&外部链接生产&工作了,一时间,包含&&的乱七八糟的信息铺天盖地涌向各大论坛、博客、店铺、分类 信息&&(当然,蒋鑫鹏也很低俗,做外链也大致是这样操作的,只不过基本不用工具,尽量减匹配度高相关性强的站点,针对性地发外链)。
  实际上,更好的SEO方式,是在进行排名优化操作前,根据用户的需求,做调查分析统计,然后依次配合客户其他需求,策划网站方案,将SEO的意图在建设网 站(众志传媒出品)的过程中很好地融入,这样SEO做起来不累,也容易取得较为理想的效果,以上文中蒋鑫鹏提到的 服务中的客户上海智宝名车的例子来说,建站之初,众志传媒根据客户专营进口美规车SUV这一特点,通过百度搜索指数、Google关键词榜单、百度相关搜 索推荐、站长工具()进行过较为详尽的统计分析,最后根据客户主营的美规奔驰、美规宝马、美规奥迪、美规卡宴、美规路虎、 美规福特、美规丰田、美规林肯、美规GMC这些品牌车,确定了上述关键词(【特别说明,关键词的策划还要考虑百度竞价竞争程度、页面收录数量、首页结果页 的快照更新程度及百度全汇总,以此来确定难易程度,结合预算与工作量来确定】)。
  在网站设计工程中,众志传媒将产品展示这一栏目设计为&美规车频道&,并依次将上述关键词作为分类,并以下拉菜单的方式实现(蒋鑫鹏提醒:导航条的锚文本 出现的关键词是很重要的,而现在做优化,用户对于关键词数量要求越来越多,结合这一情况,蒋鑫鹏建议首选将导航做成页面左侧的列表通道【实战中发现很有 效,以三禾彩钢为例】,其次考虑希下拉表菜单及最近流行的页面底部行列式导航),在主页内容安排有限的前提下,在底部将关键词对应的栏目页URL做了辅助 导航,在首页文字信息中恰当地将锚文本融入,给主要的图片做了ALT属性等。
  在title设计中,当然&美规车&首选,其次根据关键词顺序排列优先的原则,将主页title设计为&美规车_美规奔驰,美规宝马,美规路虎,美规卡 宴,美规奥迪【智宝美规车SUV】&,因为其他几个关键词无法挤在title中,检索量及价值也不是很高,就放在了description中,并且在 description开头中加入&上海智宝名车公司,顶级美规车进口商,豪华名车SUV美规版经销专卖&,即显示了公司名称,同时又突出了公司特点并在 此体现了核心关键词&美规车&,接下来的&美规宝马X5X6,美规奔驰ML/GL系列,美规保时捷卡宴,美规奥迪Q7,美规路虎揽胜极光,美规林肯外交 官,美规福特,美规丰田,美规GMC。&是对重点产品型号关键词的体现,如&美规宝马X5&,&美规奥迪Q7&等。 毕竟页面的头部文件字符限制,导致很多有限关键词不能体现,对于美规车这个网站,众志传媒做了内链的优化及各个页面的 代码优化工作,完善了站内所有页面的头部标签及页面的其他标签、链接,保证每个页面名称都不重复。以美规车频道 &/Brand.asp&这个页面来说,title采用了&美规车,美规奔驰配置,豪华车SUV美规版 价格_智宝美规车频道&,核心关键词、页面重点关键词、站点名称及页面名称都在title中有良好的表现,并且栏目页面对应的产品子页面都是后台发布新产 品生成的,每个页面的标题及描述摘要都是动态调用了发布产品的名称几摘要。
  在网站运营中,未获得更多有价值的关键词的流量,智宝美规车新闻发布中,尽量采用原创的信息,并配合美观的图片及表格,以提升网页信息的可读性,同时,作 者不忘将关键词在文章中以突出显示的形式和加链接做成锚文本的形式表现,更有利于网站内部链接的建设及丰富,这在操作中获得明显的搜索表现。此外,新闻的 更新,边体重都是包含有限关键词的,在首页调用最新发布新闻标题的方式很好的保证了主页的更新度。
  写的有点累赘,百度的算法不是一两局说得清楚的,众志传媒网络营销顾问在整理发布的,也只是皮毛,从SEO的价值来讲,是一个理解SEO及百度关键词匹配 计算法的分析思路,欢迎SEO童鞋们加入讨论,蒋鑫鹏的微博:/zhyhyhz 求围观拍砖。本文来自蒋鑫鹏的博客(/)转载请以链接形式标明
  本文地址本文地址:/?p=45 &
责任编辑:扬扬
作者:开始123
延伸阅读:关键词:
站长杂谈 草根站长信息中心

我要回帖

更多关于 百度搜索算法 的文章

 

随机推荐