爬行、抓取、索引、收录,指的都是什么?

看SEO有关博客和论坛时能感觉到,很多SEO并没有理解爬行、抓取、索引、收录这些概念到底指的是什么,区别在哪,noindex、nofollow、robots文件的功能又是什么。对这些概念没有精准理解,处理大型网站结构,决定什么页面需要被抓取,什么需要被索引,哪些页面需要禁止抓取、索引等等情况时,就很难明白该怎么做。甚至就像抓取配额那篇帖子的很多留言说的,提到这些情况的处理时,根本看不懂在说什么。 这么基本、重要,又比较容易混淆的SEO概念,我以为以前在博客里写过了,看了留言,翻翻以前帖子才知道,原来以前没写过。SEO实战密码书里是有写的,但SEO每天一贴里并没有写过。今天补上。 爬行是什么? 爬行指的是搜索引擎蜘蛛从已知页面上解析出链接指向的URL,然后沿着链接发现新页面(也就是链接指向的URL)的过程。当然,蜘蛛并不是发现新URL马上就爬过去抓取新页面,而是把发现的URL存放到待抓地址库中,蜘蛛按照一定顺序从地址库中提取要抓取的URL。 抓取是什么? 抓取是搜索引擎蜘蛛从待抓地址库中提取要抓的URL,访问这个URL,把读取的HTML代码存入数据库。蜘蛛的抓取就是像浏览器一样打开这个页面,和用户浏览器访问一样,也会在服务器原始日志中留下记录。 索引是什么? 索引指的是将一个URL的信息进行整理,存入数据库,也就是索引库,用户搜索时,搜索引擎从索引库中提取URL信息并排序展现出来。索引的英文是index。索引库是用于搜索的,所以被索引的URL是可以被用户搜索到的,没有被索引的URL用户在搜索结果中是看不到的。 要注意的是,所谓“一个URL的信息“,并不限于蜘蛛从URL上抓取来的内容,还有来自其它来源的信息,如外部链接、链接的锚文字等。有的时候,索引库中关于这个URL的的信息,根本没有从这个URL抓取来的内容,但搜索引擎知道这个URL的存在,并且有一些其它信息。 抓取和索引不是一回事。 收录是什么? 我个人觉得收录和索引没有区别。只不过收录是从搜索用户角度看的,搜索时能找到这个URL,就是这个URL被收录了。从搜索引擎角度看,URL被收录了,也就是这个URL的信息在索引库中存在。英文并没有收录这个词,和索引用的是同一个词index。 noindex的作用是什么? 页面头信息中放上meta noindex标签是告诉搜索引擎不要索引这个URL,也就是用户搜索时找不到这个URL的信息,这个URL不会返回在搜索结果列表中。 noindex不是告诉搜索引擎不要抓取这个URL,实际上,noindex要起作用,这个URL是必须先被抓取的,不然搜索引擎怎么看到页面HTML代码中有noindex标签呢? robots文件的作用是什么? robots文件是告诉搜索引擎,某些URL不要抓取。注意,这里说的是不要抓取,没说不要索引。和noindex是正相反的。 nofollow的作用是什么? 给链接加上nofollow属性是告诉搜索引擎,不要沿着这个链接爬行,就当这个链接不存在。注意,nofollow只是告诉蜘蛛不要爬这个链接,没有说不要抓取链接指向的URL,也没有说不要索引链接指向的URL,nofollow既没禁止抓取,也没禁止索引。 概念说过后,指出几个SEO们经常弄不明白的情况: 没有被抓取的页面是可以被索引的 也就是说,蜘蛛没有访问和抓取这个页面(比如被robots文件禁止抓取),这个页面却有信息存在索引库中,用户搜索时还能看到。 比如,淘宝整个网站用robots文件禁止百度蜘蛛抓取,但没有用noindex禁止索引(如上面说的,禁止抓取后,就没办法禁止索引了,不抓取,就看不到noindex标签了),所以即使百度没有访问和抓取淘宝页面,但淘宝很多页面是被百度索引的,用户可以搜到的: 百度从网上那么多链接知道淘宝首页的存在,通过链接的锚文字也知道这个页面标题大概是淘宝之类的,当然更知道百度口碑里的评价数。所以即使百度蜘蛛没有抓取淘宝首页,用户还是能搜到,并且显示一些百度知道的信息。 要想百度不能返回淘宝首页该怎么办呢?取消robots文件的禁止抓取,页面上用noindex禁止索引。 被抓取的页面是可以不被索引的 最常见的就是上面说过的,页面头信息使用noindex禁止索引,页面被抓取,读到noindex后,不被索引,不会在搜索结果中返回。老页面新加noindex也不是马上删除索引,还会保留索引一段时间,但不会返回在搜索结果中。 加了noindex的页面上的链接是可以被跟踪一段时间的,但时间长了,有noindex的页面搜索引擎可能就不再抓取和索引了,上面的链接也就无效了。 还有可能是因为页面内容是抄袭、转载、低质量的,搜索引擎虽然抓取了页面,索引过程中检测出这些内容问题,被丢弃,没有被索引。所以页面没有被收录,通常要先检查原始日志,看看是否被抓取过,如果被抓取过,可能是内容质量问题,如果根本没被抓取,建议先看看网站结构是否有问题。 加了nofollow的链接目标页面可以被抓取和索引 前面说了,nofollow既不禁止抓取,也不禁止索引。nofollow的作用是告诉蜘蛛不要跟着这个链接爬,就当这个链接不存在,但nofollow只对这个链接起作用,对别的链接没作用,这个链接加了nofollow,不意味着别的地方就没有正常的指向这个URL的链接,只要别的地方出现了没加nofollow的链接,目标URL还是会被发现、抓取(假设没被robotx文件禁止)、索引(假设没加noindex )。 上面这些概念和应用在SEO中是很重要的,如果还没看懂,我也不知道该怎么再解释了,只能建议再多读几遍。

技术部门SEO规范

为客户提供SEO 为客户提供顾问服务的时候,经常遇到一些作为外部顾问不方便全程参与的情况。比如有的公司要新建网站,或者现有网站推到重来,问我能否从一开始就参与,提供SEO建议。网站规划设计阶段就考虑SEO当然是好事,但作为一个远在异国的顾问,参与到这种需要大量深度讨论、沟通、协调的过程中,实在是不好操作,内部SEO人员更适合这种工作。 有的客户公司规模比较大,技术开发、内容、SEO等各部门是分开的,SEO部门的很多需求是要提交给技术、运营等部门实施的。反过来,其它部门的需求也由技术部门实施,但可就不一定经过SEO部门同意了。这个过程中就可能产生对SEO的不良影响。 也有的公司人员流动频繁,即使原先的开发人员都经过SEO培训,也还是会有完全不了解SEO的新人加入团队。 这些情况都需要有一个技术部门必须遵守的SEO规范,开发网站或修改网站时,即使不与SEO部门协同,也至少不能违反SEO规范,以防产生灾难性的后果。 以前为客户写过一些技术部门SEO规范,现在简单整理更新一下,分享给大家,希望对其它公司也有帮助。   技术部门SEO规范 注: 本SEO规范适用于公司所有新建网站及对现有网站的更新、改版。 本SEO规范不是建议,是强制性规定。编程、前端、运维等技术相关部门务必遵守。 对本SEO规范中的内容有疑义时,请与SEO部门沟通,不可自行解释有疑义部分。 域名及服务器相关 只解析公司因业务需要决定开通的子域名。未开通子域名一律不解析。不要使用泛解析(以通配符*代替子域名)。 不能有两个或两个以上域名显示同样网站内容(无论以哪种方式实现,如解析至相同根目录、上传同样文件和数据库)。 用于测试的子域名使用robots文件禁止搜索引擎抓取。 未完成内容的网站、栏目不得上线。 不存在页面必须返回404代码。每个月使用线上工具确认不存在页面服务器头信息。 服务器开启gzip压缩。 4XX、5XX类服务器头信息不正常增多,及时通知SEO部门进行进一步检查。 新站一律使用https。 开通子域名,需与SEO部门提前沟通并获得同意。 网站结构和URL URL一经确定上线,不得在没有得到SEO部门同意和提供对应机制的情况下,对URL做任何改动。 除了已规划禁止搜索引擎抓取和收录的内容外,网站所有URL一律静态化。 站内搜索结果页面使用robots文件禁止搜索引擎抓取。 网站栏目与URL目录需一一对应,一级分类对应一级目录,二级分类对应二级目录。最多分级至二级目录,如果产品/页面数需要三级以上分类,请先与SEO部门沟通导航和内部链接解决方案。 栏目/目录URL以斜线结尾,后面不要加index.php之类文件名。 栏目名、文件名等URL中的字母一律小写。 URL中不要出现除了短横线之外的其它任何特殊字符。 除栏目需要,URL中不得添加其它多余目录层次。 无论中英文网站,URL目录名使用相应英文单词,长度以3个英文单词为限。不使用中文或拼音。也可以考虑使用数字/字母编号。 英文网站,产品/文章页面文件名使用产品名称/文章标题,去掉虚词。 中文网站,产品/文章页面文件名使用数字/字母编号。 同一个产品不要放置于多个分类之下,只置于一个分类。 所有页面加canonical标签。如果不确认canonical标签列出的规范化URL应该是哪个,请与SEO部门咨询。 所有页面加面包屑导航。 页面元素 页面Title标签、Description标签、H1文字按格式自动生成缺省版本,但系统需要给SEO部门预留人工填写功能。 一个页面只使用一次H1。 栏目页面Title缺省格式:二级栏目名称 – 一级栏目名称 – 网站名称 栏目页面翻页Title缺省格式:二级栏目名称 – 一级栏目名称 – 网站名称 – 第X页 产品页面Title缺省格式:产品名称 – 网站名称 […]

关于SEO技术规范的一些说明

通常博客帖子的留言比较泛泛而谈,没那么具体,也比较少需要回复。上星期的帖子《技术部门SEO规范》则有不少对其中一些技术点很具体的疑问,所以写个帖子回复一下。 作为SEO技术规范,只是列出了应该做什么和不应该做什么,没有解释原因,所以确实会使有些读者不明所以。有的地方是个人偏好,或者有不同解决方法,只是选择其一,不一定要按我写的规范这样处理。重要的是,选择一种处理方法,就要保持一致性,各个地方都要遵循同样原则,所有技术人员都要用同样方法,不要各行其是,结果出现矛盾的处理方法。 静静的民心河问: Zac老师做了这么详细的规范,这些一般都适用于大公司的大型网站吧?一些小公司的感觉很多都实现不了呀!小公司的网站,有什么更好的规范建议吗? 答: 和网站大小没关系,规范是一样的。其中并没有什么小公司不能实现的,实际上,小公司没那么多层级、条条框框,更容易实现。技术上,真没有什么什么能称得上是技术的东西,都是最基本的。 乐梵问: 栏目页面翻页Title缺省格式:二级栏目名称 – 一级栏目名称 – 网站名称 – 第X页 不应该为 栏目页面翻页Title缺省格式:二级栏目名称 – 第X页 – 一级栏目名称 – 网站名称 么? 答: 都行。title太长的话,去掉一级栏目名称也可。重要的是带上页码,使标题有所区别,让用户和搜索引擎都知道自己在哪。 Betty问: 「站内搜索结果页面使用robots文件禁止搜索引擎抓取。」请教这是为什么呢?是防止重复内容吗?那种文章列表翻页页面好像差不多呀,为什么就可以呢我自己上网时候经常会搜到这种结果页面,感觉还蛮能带来流量的 答: 搜索引擎并不喜欢收录站内搜索结果页面。原因很多,比如你说的重复内容问题。还有用户体验问题,搜索引擎希望把用户直接带到最终回答查询的页面,而不是另一个搜索引擎页面。还有内容质量问题,一些搜索结果页面根本就是空的,没有符合条件的搜索结果。 另外,如另一位读者sindy回答的,有时候搜索结果页面会被黑帽利用,搜索一些敏感关键词,让搜索引擎收录结果页面,或者做自己的广告,或者陷害竞争对手等等。具体例子可以看以前的百度处理垃圾外链问题帖子。 文章列表是网站必须的内部结构,没有列表,用户和搜索引擎都无法访问最终页面。形式差不多,实质是不同的。 你在网上搜到的这种结果页面,通常是以聚合或tag页面显示展现的,实质确实就是搜索结果页面。但这种页面的使用首先要有海量内容为基础,词库的选择、搜索结果质量的控制等都是要谨慎计划、监控和调整的。所以,不是不能用,是技术部门不能没有和SEO部门商议就随意使用,或者说,缺省设置是,先别用,和SEO部门商议出好的方案,再用。 Cici问: 栏目页面翻页Title缺省格式:二级栏目名称 – 一级栏目名称 – 网站名称 – 第X页翻页格式不太了解是什么意思呢?其次,关于页面title是否要与这个产品页面的名称一致问过几个老师,有的说最好不一致,有的说一定要一致。我看到Zac说产品页面title就是产品名称 – 网站名称,是否意味着,页面title也要与产品名称保持一致? 答: 翻页指的是,每个栏目,比如显示20篇文章,栏目下多于20篇,页面下边肯定要有下一页、第二页、第三页之类的链接,那些页面就是翻页。从第二页开始,翻页页面的标题要带上页码。 不一定一致。所以系统要有人工改写title的功能。但缺省的设置通常是title就是产品名称,这个最容易实现,后期再挑重要页面人工改写。 梦站博客问: URL结尾以html结尾和非html结尾有什么区别么?搜索引擎对结尾有什么要求么? 答: 没区别,搜索引擎也没有要求或偏好。之所以建议目录以斜杠 / 结尾,产品、文章以html结尾(或者php结尾,或者htm,都一样),只是让自己和用户一看URL就知道这是个目录还是产品页面。有的网站和CMS系统产品/文章页面也是以斜杠结尾的,对搜索引擎没什么区别。 robin.wong问: “中文网站,产品/文章页面文件名使用数字/字母编号” 比较疑惑:您自己的此页面的url命名没用数字或者字母啊? 答: […]

用户体验与SEO

在网上看到有朋友讲,SEO所强调的很多东西,其实就是用户体验的问题。搞网站和产品设计的人,只要关注用户体验,那么SEO的问题就已经解决了,不必再强调SEO。 确实,从根本上来说,SEO就是一个用户体验问题。注意看英文SEO博客的人都会知道,Google员工在回答排名相关问题时,说到最后往往就是一句话:如果搜索引擎不存在,你还会不会这么做?换句话说:凡是对用户好的就去做,对用户不好的就别做。 网站对用户有益,搜索引擎同样喜欢。对用户没用,搜索引擎也不喜欢。搜索引擎在找的和想排名的,就是用户体验好的网站。 所以不可否认,如果用户体验真的做好了,SEO就不是个问题。 但为什么SEO现在是作为一个相对独立的技术大行其道?我觉得有两个原因。 1)只强调用户体验,对站长和设计师的动力不够。也就是说,跟站长讲,网站应该提高用户体验,站长口头上都承认应该如此,但付诸实践时,却没有推动力认真做好,他看不到实在的好处。但是当告诉站长和设计师,把它作为SEO来做,实在的好处就是能带来流量和订单,这推动力就大了。就算设计师自己没推动力,老板也会逼着他去做SEO。 我想做网站的可能不知道SEO,但一定都知道用户体验。可是事实是,大部分网站的用户体验有很大改进空间。所以有时候强调用户体验可能还不如强调SEO更能真正改进用户体验。 2)虽然SEO的很大一部分和用户体验是重合的,也有一部分内容是用户体验不包括的。当然反过来,用户体验的一些内容,也不包含在SEO中。两者有交叉,但不是一回事。 比如做SEO的应该知道,以SEO为目的的文案写作,是一个非常非常重要的技巧。简单的说,文案写作中的用词,应该是围绕主要关键词,但是又要尽量多用同义词,近义词和延伸的相关词,有利于搜索引擎进行语义分析。在英文文案写作中,以相同词根生成的不同时态,语态,单复数,都要交叉使用在网页内容中。 这是一个SEO基本技术,但我实在看不出对用户体验有什么帮助?因为虽然是换着花样写,其实写的的是一个意思,只要用户看的懂。不管怎么写,都必须要用户看的懂。但是对搜索引擎,不同的写法则有很大的区别。 由此也引申出另一个话题:SEO是否应该提升到用户体验,网络营销甚至网站运营的层次?有的人觉得没有必要,牵扯到那么多,只能使SEO神秘化,貌似复杂,却什么都不是。持这样观点的也包括我很好的朋友。 但我近几年越来越觉得,做SEO应该也必须上升到网络营销的层次。叫什么名字是其次,并不重要。网络营销者该做的事,就是SEO该做的事。也许有一天,SEO这个行当会消失,完全融入在网络营销中。这并没什么大不了。但我相信今后做网络营销最出色的,至少有一半都是以SEO起家的。

怎样写标题标签Title Tag?

在网页的优化上,最重要的因素之一就是网页的标题标签Title Tag。 通常在写标题标签时,应该考虑到以下几个因素: 1)所以的网页都应该有适合自己的独特的Title Tag。有很多网站都犯了一个很初级的错误,也就是所有网页都用同一个标题,比如说“欢迎参观ABC公司”。可能设计师在设计网页的时候,都是把整个模板复制来复制去。所以HTML文件里面的head信息也都被复制过去,而没有再改动。 实际上每一个网页虽然都属于同一个网站,但肯定会是在谈不同的东西,可能是你的产品,可能是你的服务。不同的网页必须要写出针对这个网页具体内容的标题标签。 2)标题标签应该对用户有足够的吸引力。当你的网页在搜索引擎被列出时,网页的标题就是来自于标题标签。用户在判断应该点击哪一个网站时,很大程度上就取决于你的标题写的怎么样?是否对用户有足够的吸引力?如果你的标签只是一堆关键词堆砌,却不知所云,就算你的排名靠前,用户不点击也没有什么用。 另外一个原因是,我前几天在另外一篇文章中提到的,搜索引擎很有可能现在正在把用户行为方式考虑进排名算法当中。而搜索结果中的点击率就很可能是用户行为方式中的一种。实际上在Google Adwords中,竞价广告排名的因素之一就是点击率。Google Adwords的排名并不是你出价越高,排名就越靠前。这种技术完全可能被应用在普通的搜索排名中。 3)标题标签中应该含有关键词。这个关键词应该是针对这一页的,而不是你整个网站的。比如说,这个帖子是在谈标题标签,很自然标题里面就含有标题标签。而不是我整个网站要优化的关键词“虚拟主机”。 同时关键词应该很自然的被融入在一句合乎逻辑的通顺句子里,而不是生硬的关键词堆砌。 4)一般来说,搜索引擎只考虑标题标签中有限的字数,比如说前十到前十五个字。所以很长的充满关键词的title tag,只能使你的网站看起来更像垃圾。有的人认为,尽可能把关键词放在标题标签的最前面。也有人认为,随着搜索引擎排名技术的改进,关键词在前面还是后 面,其实无关紧要。只要你的标题标签别太长了就行。 5)在可能的情况下,尽量在标题标签中提到你的品牌,或你的网站名。当然品牌或网站名称与关键词比较,应该处于次要地位。比如通常我在写网页时,都是这样结构标题标签: 文章名 – 分类名 – 网站名 如果太长的话,就只要 文章名 – 网站名 或者还嫌长的话,就只要文章名。 我在这个博客里,做了一个简单的试验。在博客刚开通的时候,我所有的网页标题只是用“搜索引擎优化SEO每天一帖”。过了十五天之后,标题标签改为 搜索引擎优化SEO每天一帖 – 文章名 我检查了搜索引擎排名,确认在标题标签中包含关键词确实会提高排名。比如如果在Google中寻找“网址规范化”,我的网页在改标题标签之前,排在第四到第五。我改过标题标签之后,并且被Google收录后,排名就变到第一了。

Meta标签是否还有用

Meta标签指的是网页HTML文件里面的一些文件标签。其中最重要的是:标题标签Title Tag,描述标签Description Tag和关键词标签Keyword Tag。 其他比如象作者,软件版本等等,可以不用管了,在网站优化当中,没有什么价值。当然,其他标签也不妨碍什么。你愿意的话,可以放上你想放的信息,但是不能太多。因为前面标签放的太多,就会把你的网页正文内容推到文件的后面去了。这对于优化排名很不利。 大概4,5年以前,搜索引擎还都把这些标签看的很重要。因为这些标签的内容,就是站长自己所自称的这个网页是关于什么的。但是随着搜索引擎排名算法被更多的了解以后,人们开始把不相关的关键词堆砌到这些标签里面,希望能在热门关键词搜索中得到好的排名。 几年前,最大的搜索引擎Alta Vista的没落,很大程度上就归功于大量这类垃圾网站充斥在Alta Vista的搜索结果中。Alta Vista对此的策略,不是进一步开发反垃圾反作弊的手法来提高他们搜索结果的准确率,而是向雅虎等门户网站靠拢,企图通过提供更多的内容来吸引访客。 但事与愿违,人们很快抛弃了Alta Vista,转向了Google。因为Google的基于网页级别的排名算法,很大程度上消除了这类作弊手法。 近两三年来,大部分人都相信,Google会给予标题标签比较高的权重。但是描述标签和关键词标签,Google完全忽略。其他重要的搜索引擎也都如此。有可能会把描述和关键词标签做为排名的一个很小的因素,但所占的分量应该非常低。 正因为如此,很多搜索引擎优化从业者,基本上不在标签上放任何精力。实际上,这也有点矫枉过正。有迹象表明,Google就算不把说明和关键词标签当做排名的因素,Google也会把这些标签抓取到数据库中。最明显的是,比如一个完全用flash做成的网站,这个网站的搜索排名中所使用的说明文字,一般就是从说明标签中抓取出来的。 同时,既然所有的搜索引擎排名算法都是保密的,而且是不断变换的,谁也不敢保证,今后搜索引擎都一直不看重这些标签。很有可能描述和关键词标签,一直都是排名算法的因素之一,只是比重占的很小而已。 所以我的建议是,每一个网页都应该认真写出好的标题,关键词和描述标签。至少它也没有坏处。 再一个应该放上这些标签的原因是,这些标签对用户来说是用户友好的一部分。在雅虎和MSN的搜索排名当中,大部分时候,搜索结果的网页说明就是取自说明标签的。如果你的说明信息清楚准确,同时有吸引力,这有助于访客点击你的网站。 在Google和百度的搜索结果中,网页描述是Google和百度认为合适的网页的文字内容。 还有一个需要注意的是,每一个不同的网页都要有不同的标签。我们都看过很多的网站,所有的网页标签都是ABC公司,这是错误的做法。你应该写上适合本网页的标题标签和描述标签。 一般来说,标题标签不要超过十到十二个字。描述标签也不要超过三十到三十五个字。关键词标签只要列出确实和你的网站有关的重要关键词。 在这所有的三个标签里,都切忌重复和堆砌关键词。

关键词优化方法和步骤

关键词密度 我的感觉是3%到7%比较适宜,但是关键词密度占的权重已经非常小了,很多排名靠前的网页关键词密度可能高到30%,也可能完全没有关键词。所以只要你按逻辑,按语法正常写你的网页,就不必太顾及关键词密度了。 HTML标签 关键词应该出现在网页标题标签里面,标题标签Title Tag是目前很重要的一个因素,应该包含你最重要的关键词。 另外在说明标签Description Tag,关键词标签Keyword Tag,图像ALT标签都可以放入关键词,但注意不要关键词堆砌。 关键词在网页正文中 只要你正常的写文章,关键词必然会出现在文章正文中。最好把关键词放在正文标题heading,H1-H3比普通文字有高一点的权重,这也很有逻辑性,因为标题自然是这篇文章应该讨论的内容。 另外可以用黑体,斜体来强调关键词,但一两次就够了。 可以在正文的最前面,也就是第一段第一句话放入关键词,这也是一个比较重要的因素。 还可以在网页最底部放上关键词,当然要符合逻辑和语法,并对用户友好。 URL中的关键词 对英文网页来说,关键词出现在URL中,多少会有点帮助。对搜索引擎相关性算法的帮助可能很小,但其实对用户帮助蛮大的。因为搜索结果列在搜索引擎中时,用户可以从你的文件名就判断出这个网页是讨论什么的。 关键词可以在域名里,也可以在目录名里,也可以是文件名,不过切忌关键词堆砌在URL中。 关键词出现在链接中 关键词应该出现在网页导出链接的链接文字中,这是相当重要的一方面。其实在某种程度上来说,导出链接中含有的关键词,比连向这个网页的外部链接中的关键词还重要。 不仅是在你网站内部互相链接的时候需要以关键词为链接文字,也应该在文章中经常引用和指向其他相关文件,并以关键词为链接文字。 这些地方都放了关键词了?那很可能已经优化过度了。

SEO文案写作

在进行网页文案写作的时候,通常应该考虑到搜索引擎优化的效果,有几个总的原则。 1)整个网站的文章针对不同却相关的大量关键词进行,这样有助于搜索引擎提炼网站主题。 2)每一篇文章的写作以主关键词为目标,但需要其他相关词汇的支持。 3)文章还必须逻辑语法符合读者习惯,不能为关键词而关键词。 举个例子,搜索引擎优化培训,既然是个实验,在写的时候就进行了一些考虑。绝大部分帖子没考虑这么多,特殊需要的时候才考虑,不然就太累了。 要想优化”搜索引擎优化培训”这个词,从整个网站的主题来说,搜索引擎优化无疑是我博客的主题,不用特殊考虑。 “培训”这个词却基本上和其他帖子都无关,也不可能在其他帖子里来加强这个词。所以在这一篇帖子里面就特殊考虑怎样加强培训这个词的相关度。这种加强并不是多提几次培训,而是通过其他相关词汇。 哪些词和培训有关呢? 我当时想到了这些:老师,学生,理论,技巧,师父,徒弟,考试,实践,学校,师资,教育等等。这些词在搜索引擎眼里,由于语义分析的因素,应该是比较相关的。那么在写帖子的时候,就要把这些词符合逻辑符合语法的融进去。 比如这句话,”当然师父领进门,修行在个人,大量实践才是徒弟最后出师的考试。”从整篇帖子的内容来说,也可以算可有可无,但从文案优化的角度来说,是特意加进去的。 再比如这句,”老同志教育我们实践是检验真理的标准,我想做个实验”。其实这句话也可以直接缩短成”我想做个实验”。但是”教育”这个词在其他地方都没想出好的地方放进去,就想起了这句相关的口号。放在这里既能用上相关词汇,又能自然的引出我想做个实验这句话。 帖子的后半部分就主要针对和搜索引擎优化沾边的词。 其实从整个帖子来看,”搜索引擎优化培训”出现的频率也不算很高,但是有其他支持词汇的帮助,实验效果还算不错。 为免误解,两个说明: 1)文案的SEO考虑毕竟还是次要的,最重要的还是言之有物,跟其他任何文字写作一样。 2)请仔细体会,这和关键词堆砌是两回事。

什么样的文章长度有利于SEO?

今天谈一个关于搜索引擎优化细节得有点无聊的问题。 以前在论坛里有朋友问,什么样的文章长度有利于SEO?首先先说两句基本上永远正确的废话原则: 1)从用户出发,考虑用户体验,别考虑SEO。 2)有话则长,无话则短。 再来分析一下,如果必须要站在SEO的角度考虑,应该有些什么样的处理? 首先, 文章最短也应该在200字左右以上 原因有两个: 1)如果只有几十个字,搜索引擎不容易判断出文字的主题是什么,也就判断不出与什么关键词最相关。 2)正文太短的话,有可能比导航系统,菜单,版权声明等杂七杂八的东西加起来的字数还少,被怀疑是复制内容。如果这样的文字过少的页面大量存在,可能造成网站内部复制网页增多。因为你的网页之间相似性太高,有区别的文字太短。 长文章容易吸引链接 看过很多很长的文章,甚至长到几十页。虽然读的时候拉来拉去有点儿不方便,但这样的文章其实是比较容易吸引链接的。 因为这样的文章通常都是就某个话题深入分析,不深入他也写不了这么长。所以其他的博客或网站发现这样的深入研究文章,自然会发现它的价值,把文章当作资源,然后引用。 如果把长的文章分成几段,其他博客就不容易引用。较零碎的文章被当作资源的可能性会降低。这两者之间其实是有微妙的心理差异的,一篇很长,很完整,很深入的文章,给人的印象就是有价值的资源。 再一个好处是,这样的文章内容丰富,在搜索引擎看来,能够增强权威性。 有的时候把长文章分成几页,也有它的优势 第一个好处是整个网站页面增多,网站规模变大。而大的网站有天生的权威度。 第二个是,如果你的文章能够划分成不同的章节,而每一个章节都各有重点,这时候把不同章节分成不同页面就更有利。因为每一个章节都有他的主题相关性,分成多页后,能够针对不同的关键词优化网页。 一般来说,除了前面所讨论的很长的文章,根据文章本身的特性和你是否想更容易的吸引链接,来考虑是否分成不同页外,普通文章应该在400-800字之间比较合适。这并不仅仅是从SEO的角度考虑,也考虑到用户。太长容易让用户看第一眼就烦了,太短像前面说的不能形成主题。 当然这里讨论的是以SEO角度出发,但很多时候做网站,SEO只是很小的一部分考虑。比如说很多网站都有的常见问答FAQ,如果问题一两句话就答清楚了,也没必要写到几百字。

网站关键词布局(下)

每个页面目标关键词不要超过2-3个 很多站长喜欢把很多关键词放在首页上,认为首页权重高,把关键词放在首页,得到排名的机会高一点。 如果你能找到的主要和次级关键词不太多,一共四五个,那么这样还可以接受。但如果最重要和比较重要的相关关键词有10多20个,那就不要勉强都挤在首页上。 每一个页面的目标关键词限制在2-3个,不然页面内容写作,内部链接的安排,外部链接的锚文字等都会遇到矛盾无法解决。最后的结果是,一个页面也还只是能得到2-3个词的排名而已。 不如提早规划,把不同重要性的词分布到不同的页面。这对新网站尤其重要。 关于长尾关键词 长尾理论大家都耳熟能详了,运用在SEO中,有时候我反倒觉得强调长尾有点过头了。对做SEO的人来说,最重要的是有长尾意识,在网站结构安排,内部链接,文章页面的写作等方面,想到有长尾这个概念就足以了。 真正能充分利用长尾优势的网站,至少都要有数十万以上页面。这种网站的长尾效应都是自然而然获得的,而不可能进行全面的长尾关键词研究。在大量文章页面或产品页面上,自然写作,突出非常单一的主题就足够了,不必进行刻意的关键词研究。 避免多个页面竞争同一个关键词 这也是很多网站容易犯的毛病之一,网站里有多个页面目标关键词是相同的。有的站长认为,首页和几个栏目页都加强优化同一组关键词,这样获得排名的机会高一点。其实不然,应该尽量避免这种情况。 同一个网站里竞争一个关键词的,只应该是一个页面。这样,无论是内部链接安排,还是外部链接的建设,还有文案的写作,都能够目标精准,不会分散精力。 这个毛病最极端的现象其实就是大家都很熟悉的复制内容。

网站关键词布局(上)

简单说,多个关键词在网站中需要合理布局,最难的安排在首页,中等难度的安排在栏目页,长尾性质的则安排在文章页或产品页面。 还需要注意以下几点。 关键词研究 一定要先做关键词研究。 不了解用户在搜索哪些关键词,就谈不上合理的关键词布局。我看过太多公司网站首页目标关键词是网站设计人员想当然的词或者是公司名称,都是些根本不会有人搜索的词。 进行深入的关键词研究,除了避免最主要关键词选择重大失误,也有助于所有关键词在不同频道页的安排。最主要关键词通常是搜索数量最多的那2-3个,搜索次数低一等级的有哪些?这些词之间的意义差异性有多大?是否应该安排独立的频道?哪些词可以合并在一个频道?有多少这种中等程度的关键词需要安排?网站的整体架构是否能够满足这些关键词?是否找到的关键词太少,不足以使网站架构足够丰满?等等。 这些问题都必须进行深入的关键词研究,才能够得到答案,靠自己想是想不出来的。 恰当评估首页关键词 做网站时,大部分人会觉得目标定在本行业最难的那个词效果最好,搜索次数多,来的流量一定大。比如在SEO行业就把目标定在SEO或搜索引擎优化上。 对有些企业网站来说,这也是不得已的事,因为企业产品名称是早就固定的,在出现互联网之前就这么叫,无法改变。 但有一些资讯类、门户类、社会化媒体以及个人网站,关注的主题和关键词其实是可大可小,就看你怎么确定。 确定了首页关键词,那么频道页关键词就相应确定了。而首页关键词到底是应该把目标放在SEO?还是北京SEO?还是北京西城区SEO?这需要考虑至少3个因素: 1)搜索次数。 2)竞争对手(现有排在前面网站)的实力。 3)自己愿意的花费的时间、金钱、人力。 很多时候并不一定要把目标定在最难的关键词上,尤其是对新网站来说。难度定的太高,两三年还没达到目标的话,恐怕站长就坚持不住了。

多语言网站优化和hreflang标签

从近两年我个人的SEO服务项目情况看,有越来越多的公司需要做多语言网站优化。国内外贸SEO做多语种网站,以电商公司居多,要往外卖产品。国外公司也有不少要做中文网站,不过电子商务类的不多,大品牌、留学/移民之类的比较多。 如果涉及语言比较少,比如只有英语和中文网站,语言使用范围不复杂的话,做SEO时倒没有什么特殊要求,英文、中文网站可以放在两个独立域名上,也可以放在同一个域名的两个子域名上,甚至可以放在二级目录上,内容和结构等可以没什么关联,基本上可以各做各的。即使页面内容是对应翻译的也没问题,中译英或英译中,内容一样,语言不同,搜索引擎不会认为是复制内容。 为什么需要hreflang标签? 有时候情况复杂点,同一个国家使用多种语言,而且使用人数差别没有那么大,像中文在中国这样具有压倒性主流地位,如加拿大使用英语、法语,瑞士使用德语、法语、意大利语。一个语言也经常在多个国家使用,英语在英国、美国、加拿大、澳大利亚、新西兰,甚至新加坡,都是最使用广泛的语言。 在这些稍复杂的情况下,需要考虑一些多语言网站的SEO问题: 同是英文网站(或其它语言),不同国家或地区有各自独立域名,虽然也许有些许修正,如不同拼写(英国拼为colour,美国拼为color之类),但主体内容是一样的,怎样避免被搜索引擎认为是复制内容? 一个语种页面收录良好,另一个语种收录有问题,能不能让搜索引擎知道另一个语种版本在哪里,从而改进收录? 同一个国家,有不同语言使用者,怎样让搜索引擎知道这个页面是针对哪个语言的? 使用hreflang标签设置语言和地区,可以帮助解决这些问题。 hreflang标签的格式和用法 hreflang标签的标准格式是这样的: <link rel=”alternate” href=”https://www.abc.com.cn” hreflang=”zh-cn” /> hreflang标签分两部分,前面是语言,后面是地区。上面标签指明的是,这个页面针对中文(zh)、中国地区用户(cn)。 对应的: <link rel=”alternate” href=”https://www.abc.com.au” hreflang=”en-au” /> 指的是英文、澳大利亚。 <link rel=”alternate” href=”https://www.abc.co.uk” hreflang=”en-gb” /> 指的是英文、英国。 在三个网站上,上面三个标签都放上,搜索引擎就知道针对不同语言、地区的版本是关联的,各自的网址是什么,并且不会被当成复制内容。 hreflang标签的几个技术细节 还有几个细节要注意。 hreflang标签可以放在同一个域名的不同页面上,也可以跨域名,放在不同域名上。 hreflang可以只写语言部分代码,如: <link rel=”alternate” href=”https://www.abc.com” hreflang=”en” /> 但不能只写地区部分: <link rel=”alternate” href=”https://www.abc.ca” hreflang=”ca” /> 上面这个是无效的,只写地区代码ca,不会被自动判断为是英文还是法文。 所有语言页面上都要加上所有hreflang标签,形成互相确认。中文页面指明自己是中文,同时指明英文版本在哪里,英文页面同样要确认自己是英文版本,对应的中文版本在哪里。 代表语言的代码要符合ISO 369-1标准,代表地区的代码要符合ISO 3166-1 Alpha 2标准。写代码时最好到官网查一下,不要想当然。比如上面提到的,英国的地区代码是GB,不是UK,和域名后缀不一样的。 中文的语言代码是ZH,不是CN。这个是有效的: <link […]