SEO 是英文 Search Engine Optimization 的缩写, 中文译为「搜索引擎优化」;在我的理解里,SEO 是一种遵循搜索引擎的理论排序机制,对网站结构、网页文字和站点间的互动策略等进行合理规划部署来提高网站的权重属性,从而使网站在搜索引擎中具有较强的自然排名竞争优势的技术。
(搜索引擎不是站长家开的,搜索得到的内容自然不是你想排到前面就会排到前面。通过一些手段把自己的网站或者页面提高自然排名、获得搜索流量,这就是 SEO;通过向搜索引擎支付费用获得某些关键词下的优先排序广告称为竞价排名(Bidding Rank),成本会比 SEO 高很多。)
SEO 是给网站带来访问者的「最好方法」虽然也有其他网站推广方法,运用得当效果也非常不错,但总体来说,没有其他方法像 SEO 一样:
(就是打开搜索引擎后在输入框内输入点东西,敲击回车后得到的页面)
页面主体有两部分最主要,一是广告,二是自然搜索结果。
根据搜索关键词不同,搜索引擎会把其他垂直搜索整合在一起,诸如视频、图片新闻等。如下图
当搜索结果页面上应该出现两个来自同一网站的页面时,比如第一位和第八位,按照正常排名算法是来自同一网站的两个页面,Google不是把它们排在第一和第八位,而是把两个结果连在一起排在第一和第二位,第二位的结果向右侧缩进三个字的空间。这样的列表格式非常有助于提高点击率(由于找不到相关关键词,就不截图了)。
对某些权重比较高的网站,当用户搜索一个关键词,这个网站的结果是最权威的内容来源时,Google除了正常结果列表外,还会显示最多四行、两列共8个内页链接,称为全站链接(Sitelinks)。这等于是为权重高的网站提供了多几倍的访问入口,视觉上的醒目也大大提高了点击率。
权重高的网站在某些情况下还会显示迷你全站链接(Mini Sitelinks),不是4行8个,Google 是 1 行 4 个链接,显示的内页与上面说的全站链接是一样的,取其中前面4个。百度目前看下来是 1 行两个,有一排与两排的区别(以及确认和企业认证无关,可搜索「WordPress大学」测试)。
某些关键词会触发 One-box结果,直接在搜索结果页面上显示相关信息,用户不用点击到其他网站上查看。
某些使用RDFa或Microdata格式标签的页面,Google可能还会在标题下面以灰色文字加一行富摘要(Rich Snippet),如图2-16所示的论坛帖子页面还显示出帖子个数、作者数及更新日期。
原本显示一个网址的地方,改为面包屑导航格式,其中的每一个分类链接都指向网站上相应的分类页面。
搜索引擎用来爬行和访问页面的程序被称为蜘蛛(spider),也称为机器人(bot)。
蜘蛛访问任何一个网站时,都会先访问网站根目录下的robots.txt文件。如果 robots.txt 文件禁止搜索引擎抓取某些文件或目录,蜘蛛将遵守协议,不抓取被禁止的网址。
从任何一个页面出发,顺着链接都可以爬行到网上的所有页面。最简单的爬行遍历策略分为两种,一种是深度优先,另一种是广度优先。
深度优先:蜘蛛沿着发现的链接一直向前爬行,直到前面再也没有其他链接,然后返回到第一个页面,沿着另一个链接再一直往前爬行。
广度优先:蜘蛛在一个页面上发现多个链接时,不是顺着一个链接一直向前,而是把页面上所有第一层链接都爬一遍,然后再沿着第二层页面上发现的链接爬向第三层页面。
但是蜘蛛是不可能爬行所有对页面,再做 SEO 时要想让更多页面被收录,就要通过手段吸引蜘蛛来抓取。既然不能抓取所有页面,蜘蛛所要做的就是尽量抓取重要页面。
列举一些对蜘蛛而言判定页面重要度的因素:
(可以在页面的内容中,添加一些关键词链接,连接到站内其他需要高权重的页面。为了不影响用户,可以将页面颜色控制的与其他文字相同。)
搜索词分为「短尾搜索词」和「长尾搜索词」。
短尾:妇科、儿科、中药、减肥,一般是一个词语。
长尾:看妇科病哪里好、减肥药怎么吃、感冒头疼怎么办之类。
短尾关键词优化难度大,长尾相对简单。如果可以找到搜索热度高,优化难度低的关键词,即可话费少量精力得到大量的流量。
可对页面进行网页关键词(keywords)、描述(description)的设置。需要注意的是关键词和描述对搜索词权重的影响比较低。
页面与页面之间的扭转称之为跳转。
除了 301 跳转外,搜索引擎对 302 跳转、Flash 跳转、HTML Meta Refresh 跳转、JavaScript 跳转都不太友好。这一块我直接写一些我了解的结论:
H 标签相当于正文标题,是关键词优化的另一个页面元素,通常认为重要性仅次于页面Title。
H 标签按重要性分为六层,从 H1 ~ H6。一般出现 H1 与 H2 就行。
简单来说,结构化数据就是按一定的结构产生的一系列描述你网站内容的信息,它能帮助搜索引擎的爬虫更好地了解你网页中所要展现的内容,并在搜索结果中有更丰富得展现,而非千篇一律的链接:具体可以看「搜索引擎结果页面的类型」。