本文为阅读《SEO实战密码:60天网站流量提高20倍》过程的一些记录,非原创
0. 网站结构的优化比页面优化更重要
- 用户体验:良好的导航系统,适时出现的内部链接,准确的锚文字
- 收录:策划好分类或频道,在分类下加入产品页面,整个网站自然形成树形结构
- 权重分配:规划好网站所有页面的重要程度,通过链接结构把权重倾向重要页面
- 锚文字:锚文字是排名算法很重要的一部分
1. 搜索引擎友好的网站设计
- 有外部链接连到首页
- 所有页面可以通过可爬行的普通HTML链接达到
- 网站所有页面离首页点击距离不能太远,最好在四五次点击之内
- 被发现的URL必须是可以被抓取的。数据库动态生成、带有过多参数的URL、Session ID、整个页面是Flash、框架结构(frame)、可疑的转向、大量复制内容等都可能使搜索引擎敬而远之
- 关键词在页面重要位置的合理分布、重要标签的撰写、HTML代码精简、起码的兼容性等有助搜索引擎理解页面内容
2. 避免蜘蛛陷进
- Flash:搜索引擎是无法读取Flash文件中的文字内容和链接的。(站长可以使用SWFObject和sIFR等技术使Flash文件更易于被搜索引擎读取。)
- Session ID:建议跟踪用户访问应该使用cookie而不要生成Session ID。或者程序判断访问者是搜索引擎蜘蛛还是普通用户,如果是搜索引擎蜘蛛,则不生成Session ID
- 各种跳转:尽量不要使用301转向以外的跳转
301转向(或叫301重定向,301跳转)是用户或蜘蛛向网站服务器发出访问请求时,服务器返回的HTTP数据流中头信息(header)部分状态码的一种,表示本网址永久性转移到另外一个网址。网址转向还有其它方法:如302转向、JavaScript转向、PHPH/ASP/CGI程序转向、Meta Refresh等。301转向传递权重,Google会传递大部分权重,但不是百分之百,百度会传递所有权重。
若网站使用LAMP主机,可以使用.htaccess文件做301转向
- 框架结构:使用框架不利于搜索引擎抓取。因为搜索引擎无法判断框架中的页面内容应该属于框架,还是属于框架调用的文件
- 动态URL:尽量避免
- JavaScript链接:对于权重较低的网站,搜索引擎没必要处理JavaScript链接
- 要求登录:登录之后的内容搜索引擎无法看到。蜘蛛不能填写用户名、密码,也不会注册。
- 强制使用Cookies:搜索引擎蜘蛛相当于一个禁用了Cookie的浏览器
3. 物理及链接结构
- 网站物理结构(指的是网站真实的目录及文件所在的位置所决定的结构)。合理的物理结构有两种:
(1)扁平式(所有网页文件都存在网站根目录下)
(2)树形结构或金字塔形结构(根目录之下以目录形式分成多个产品分类,然后每一个分类下再放上属于这个分类的具体产品页面) - 链接结构或逻辑结构(是由网站内部链接形成的链接的网络图)。合理的是树形结构。
对搜索引擎来说更重要的是链接结构,而不是物理结构
4. 清晰导航
- 文字导航:使用最普通的HTML文字导航,不要使用图片、JavaScript、Flash做导航。导航系统链接是整个网站收录最重要的内部链接。
- 点击距离及扁平化:页面与首页点击距离越近越好。权重普通的网站,内页离首页不要超过四五次点击
- 锚文字包含关键词:导航系统中的分类名称应尽量使用目标关键词,2~4个字为宜
- 面包屑导航:建议使用,对用户和搜索引擎来说,是判断页面在网站整个结构中的位置的最好方法。
- 避免页脚堆积:避免在页脚堆积富含关键词的分类页面链接
5. 子域名和目录
- 搜索引擎会把子域名或二级域名当做独立站点看待
- 从SEO角度看,建议使用目录而非子域名。
- 具体选择还需看情况。若是百度,使用子域名或独立域名更有利,因为百度给网站首页权重更高,相比之下,Google给予网站首页、目录及内页大致相同的机会
6. 禁止收录机制
- 网站上不出现链接,或者使用JavaScript、Flash链接,使用nofollow等方法
- 使用robots文件或Meta Robots标签
(1)robots.txt用于指令搜索引擎禁止抓取网站某些内容或指定允许抓取某些内容
(2)meta robots标签是页面head部分meta标签的一种,用于指令搜索引擎禁止索引本页内容(ps:noindex meta robots禁止索引本页面,但允许蜘蛛跟踪页面上的链接,也可以传递权重)
7. nofollow的使用(可以不考虑)
- 链接的nofollow属性只适用于本链接。告诉搜索引擎这个链接不是经过站长自己编辑的,所以链接不是一个信任投票。搜索引擎看到这个标签就不会跟踪爬行链接,也不传递链接权重和锚文字
- 自动在评论和帖子的链接中加上nofollow
- 用于广告链接
- 应用在联系我们、隐私权政策、用户条款、用户登录等链接上。(若未使用nofollow,整站的链接权重会平等地流动到这些网页上。)
- 用于其它搜索价值不大因而不需要权重的页面
Google对nofollow链接权重传递算法做了改变,2008年之后,加了nofollow相当于浪费了PR和权重
8. URL静态化
- 使用服务器的URL重写模块
- 近两三年搜索引擎对动态URL的抓取有很大进步,URL中有两三个参数,对收录无大影响
- 2008年,Google明确建议不要将URL静态化。有能力抓取动态网址,动态网址有助于蜘蛛读懂URL
9. URL设计
- URL越短越好
- 避免太多参数
- 目录层次尽量少(这里指的是物理目录结构)
- 文件及目录名具
- URL中包含关键词
- 字母全部小写
- 连词符使用(建议使用短横线分割)
- 目录形式还是文件形式都可以(目录形式有点:更换语言,URL不必变化)
10. 网址规范化
- 网站首页应该是固定的,只有一个
- 确保使用的CMS系统只产生规范化网址,无论是否有静态化
- 所有内部链接保持统一,都指向规范化网址
- 在Google管理员工具中设置首选域
- 使用301转向,把不规范化URL全部转向到规范化URL
- 使用canonical标签
canonical标签相当于一个页面内的301转向,区别在于用户并不被转向,还是停留在原网址上,而搜索引擎会把它当做是301转向处理,把页面权重集中到标签中指明的规范化网址上。Google、雅虎、必应都支持,百度不支持。
- 提交给搜索引擎的XML网站地图中全部使用规范化网址
11. 消除复制内容
- 网址规范化,使用canonical标签
- 在页面中加入版权声明
12. 绝对路径和相对路径
- 各有优缺点
- 绝对路径有助于解决网址规范化,可以带来一些外部链接
13. 网站地图
- HTML网站地图
- XML网站地图
14. 内部链接及权重分配
- 重点内页链接放在首页
- 降低非必要页面的权重:只在首页显示链接,其他页面干脆取消链接;使这些页面的链接不能被跟踪或传递权重
- 大二级分类,提高其权重
- 翻页过多。根据产品数量和网站权重调节页面列出的翻页链接及链接之间的步长
- 单一入口还是多入口,需考虑域名权重、实际总页面数等
- 相关产品链接
- 锚文字分布及变化
- 首页链接NoFollow
- 深层链接。在具体产品页面建设一些外部链接
- 分类隔离。
15. CMS系统
- 页面标题客制化
- URL静态化及客制化
- meta标签客制化
- 正文撰写
- 分类页面说明文字
- 标签功能
- 消除复制内容
- 301转向
- 网站地图生成
- 正确生成H标签
16. 404页面
- 页面不存在时,一定要返回404代码
- 页面不存在时,不要返回任何转向代码
- 404页面要保持网站统一模板、设计风格、logo及名称;应在醒目位置显示错误信息,明确提示用户,要访问的页面不存在;错误信息下面还可以为用户提供几种点击选项,如网站地图,建议用户可以访问的页面,还可以加上站内搜索框
- 404错误与外链。将错误地址做301转向