SEO 相关内容浅析
2017年11月3日 更新
开启更多功能,提升办公效能

一、什么是 SEO

SEO 是英文 Search Engine Optimization 的缩写, 中文译为「搜索引擎优化」;在我的理解里,SEO 是一种遵循搜索引擎的理论排序机制,对网站结构、网页文字和站点间的互动策略等进行合理规划部署来提高网站的权重属性,从而使网站在搜索引擎中具有较强的自然排名竞争优势的技术。


(搜索引擎不是站长家开的,搜索得到的内容自然不是你想排到前面就会排到前面。通过一些手段把自己的网站或者页面提高自然排名、获得搜索流量,这就是 SEO;通过向搜索引擎支付费用获得某些关键词下的优先排序广告称为竞价排名(Bidding Rank),成本会比 SEO 高很多。)

二、为什么要做 SEO

SEO 是给网站带来访问者的「最好方法」虽然也有其他网站推广方法,运用得当效果也非常不错,但总体来说,没有其他方法像 SEO 一样:

  1. 搜索引擎是用户寻找、比较、确定信息最重要渠的道;
  1. 搜索流量质量高。来自搜索的用户是在主动寻找你的网站,目标非常精准,转化率会比较高;
  1. 性价比高。SEO 不是免费的,但是成本相对较低;
  1. 可扩展性。只要掌握了关键词研究和内容扩展方法,网站可以不停增加目标关键词来获取流量。
  1. 长期有效。网络广告、PPC 一但停止投放,流量就会停止。事件营销效随着时间推移话题过去后,流量也会消失。而只要不作弊,搜索排名一旦上去,可以维持很长时间,流量源源不断;
  1. 提高易用性,改善用户体验。SEO 是需要修改网站才能实现的推广方法之一,而 SEO 对页面的要求很多是和易用性相通的;

三、搜索引擎结果页面常见类型介绍

1、标准搜索结果页面

(就是打开搜索引擎后在输入框内输入点东西,敲击回车后得到的页面)

页面主体有两部分最主要,一是广告,二是自然搜索结果。


2、整合搜索结果

根据搜索关键词不同,搜索引擎会把其他垂直搜索整合在一起,诸如视频、图片新闻等。如下图


3、缩进列表(Indented Listing)

当搜索结果页面上应该出现两个来自同一网站的页面时,比如第一位和第八位,按照正常排名算法是来自同一网站的两个页面,Google不是把它们排在第一和第八位,而是把两个结果连在一起排在第一和第二位,第二位的结果向右侧缩进三个字的空间。这样的列表格式非常有助于提高点击率(由于找不到相关关键词,就不截图了)。


4、全站链接

对某些权重比较高的网站,当用户搜索一个关键词,这个网站的结果是最权威的内容来源时,Google除了正常结果列表外,还会显示最多四行、两列共8个内页链接,称为全站链接(Sitelinks)。这等于是为权重高的网站提供了多几倍的访问入口,视觉上的醒目也大大提高了点击率。




5、迷你全站链接

权重高的网站在某些情况下还会显示迷你全站链接(Mini Sitelinks),不是4行8个,Google 是 1 行 4 个链接,显示的内页与上面说的全站链接是一样的,取其中前面4个。百度目前看下来是 1 行两个,有一排与两排的区别(以及确认和企业认证无关,可搜索「WordPress大学」测试)。



6、One-box

某些关键词会触发 One-box结果,直接在搜索结果页面上显示相关信息,用户不用点击到其他网站上查看。

7、富摘要

某些使用RDFa或Microdata格式标签的页面,Google可能还会在标题下面以灰色文字加一行富摘要(Rich Snippet),如图2-16所示的论坛帖子页面还显示出帖子个数、作者数及更新日期。


8、面包屑导航

原本显示一个网址的地方,改为面包屑导航格式,其中的每一个分类链接都指向网站上相应的分类页面。


四、搜索引擎内容抓取

1、蜘蛛

搜索引擎用来爬行和访问页面的程序被称为蜘蛛(spider),也称为机器人(bot)。


蜘蛛访问任何一个网站时,都会先访问网站根目录下的robots.txt文件。如果 robots.txt 文件禁止搜索引擎抓取某些文件或目录,蜘蛛将遵守协议,不抓取被禁止的网址。


2、跟踪链接

从任何一个页面出发,顺着链接都可以爬行到网上的所有页面。最简单的爬行遍历策略分为两种,一种是深度优先,另一种是广度优先。


深度优先:蜘蛛沿着发现的链接一直向前爬行,直到前面再也没有其他链接,然后返回到第一个页面,沿着另一个链接再一直往前爬行。


广度优先:蜘蛛在一个页面上发现多个链接时,不是顺着一个链接一直向前,而是把页面上所有第一层链接都爬一遍,然后再沿着第二层页面上发现的链接爬向第三层页面。


但是蜘蛛是不可能爬行所有对页面,再做 SEO 时要想让更多页面被收录,就要通过手段吸引蜘蛛来抓取。既然不能抓取所有页面,蜘蛛所要做的就是尽量抓取重要页面。

列举一些对蜘蛛而言判定页面重要度的因素:

  1. 网站和页面权重。质量高、资格老的网站被认为权重比较高,这种网站上的页面被爬行的深度也会比较高,所以会有更多内页被收录。
  1. 页面更新度。蜘蛛每次爬行都会把页面数据存储起来。如果第二次爬行发现页面与第一次收录的完全一样,说明页面没有更新,也就没有必要经常抓取。如果页面内容经常更新,蜘蛛就会更加频繁地访问这种页面,页面上出现的新链接,也自然会被蜘蛛更快地跟踪,抓取新页面。
  1. 导入链接。无论是外部链接还是同一个网站的内部链接,要被蜘蛛抓取,就必须有导入链接进入页面。高质量的导入链接也经常使页面上的导出链接被爬行深度增加。

(可以在页面的内容中,添加一些关键词链接,连接到站内其他需要高权重的页面。为了不影响用户,可以将页面颜色控制的与其他文字相同。)


五、搜索词

搜索词分为「短尾搜索词」和「长尾搜索词」。


短尾:妇科、儿科、中药、减肥,一般是一个词语。

长尾:看妇科病哪里好、减肥药怎么吃、感冒头疼怎么办之类。


短尾关键词优化难度大,长尾相对简单。如果可以找到搜索热度高,优化难度低的关键词,即可话费少量精力得到大量的流量。


可对页面进行网页关键词(keywords)、描述(description)的设置。需要注意的是关键词和描述对搜索词权重的影响比较低。




六、跳转

页面与页面之间的扭转称之为跳转。


除了 301 跳转外,搜索引擎对 302 跳转、Flash 跳转、HTML Meta Refresh 跳转、JavaScript 跳转都不太友好。这一块我直接写一些我了解的结论:


  1. 网站上的链接务必使用最简单的 HTML 链接进行跳转(我们目前的前端页面,大部分都是用 js 跳转方式,这个地方需要修改)
  1. 用户访问某页面时,会自动跳转到网站某个目录下,这样的情况最好不要出现,如果一定要跳转,请务必使用 301;
  1. 请不要使用「框架结构(Frame)」进行页面的开发;
  1. 蜘蛛无法所到必须要等登录后才可以看到的页面与内容;
  1. 不能强制使用 Cookies;
  1. 页面 URL 地址可使用树形结构,分类为「www.xxx.com/blog/」这个分类下的内容即为 「www.xxx.com/blog/xxx.html」
  1. 链接结构最好采用树形结构;即一级页面——> 二级页面——>三级页面,链接走势清晰
  1. 可采用面包屑导航;
  1. 面包屑导航对用户和搜索引擎来说,是判断页面在网站整个结构中的位置的最好方法;
  1. 对于特别需要做SEO的产品功能,可以使用 「ywyd.myweimai.com」之类的二级域名,搜索引擎给予的权重会高于「www.myweimai.com/ywyd」;但不建议所有业务都用子域名,这会导致网站数增加,同时每个网站的内容减小,这一块具体让运营方面做 SEO 的同学来决定好了。
  1. nofollow 标签代表着页面上这个链接不传递权重。产品可根据实际情况判断是否需要添加 nofollow 标签;(可对导航菜单的首页添加 nofollow,并在第二个出现的首页链接上添加首页最主要的关键词,会对该关键词的权重提升有作用)
  1. URL 静态化、URL 越短越好、不要出现特别多的参数!如果是目录形式的 URL,目录层级不要太多,比如 「www.baidu.com/doctor/222.html」,全部小写;
  1. URL 如果可以包含关键词,那么最好。比如「www.baidu.com/wenzhen/fukejibing」
  1. 如果 URL 中需要出现连词符号,请使用「-」,不要使用下划线;
  1. 网址规范化:同一页面不允许出现多个可访问的不同 URL 地址。如果没法解决,可确定一个 URL,将其他 URL 301 到这个地址;

七、页面内容层级(H标签)

H 标签相当于正文标题,是关键词优化的另一个页面元素,通常认为重要性仅次于页面Title。


H 标签按重要性分为六层,从 H1 ~ H6。一般出现 H1 与 H2 就行。


八、架构化数据

简单来说,结构化数据就是按一定的结构产生的一系列描述你网站内容的信息,它能帮助搜索引擎的爬虫更好地了解你网页中所要展现的内容,并在搜索结果中有更丰富得展现,而非千篇一律的链接:具体可以看「搜索引擎结果页面的类型」。