2.网站结构优化

url地址优化:(详见笔记5)
1)url相对简单;
2)网站至始至终使用一个地址,可利用301重定向技术;
3)url大小写统一;
4)url尽量使用静态url,越短越好,可用伪静态技术;
5)url使用英文或者拼音最好;
6)url里最好不要超过3-5个关键词,太多会被降低权重;
目录结构:
1)最好用一级到二级,不要超过三级;
2)目录组织方式尽量采用:首页-栏目页-内容页;
3)目录名采用英文或拼音;
4)避免多层嵌套子目录;
robots.txt:
1)是存放在根目录下的文本文件,告诉爬虫哪些内容可否索引;
2)可以将不希望爬虫索引的内容放进此文件;
Sitemaps:(详见笔记4)
1)通知爬虫哪些网页是可以爬取的;
2)此文件通常是xml格式;
3)每个网址包含一个父标记条目,一个子标记条目;
4)网址应该以http开头,少于2048个字符;
5)可以通过各个站长平台提交,页可以将地址放在robots.txt文件中;在robots.txt最
后一行添加http://www.yours.com/sitemap.xml;
网站导航:
1)方便用户回到主页或者上一层结构页,首页-》栏目-》具体文章标题;
2)面包屑导航:路径型、位置型、属性型,一般控制在三层,不要超出四层;
3)面包屑导航尽量使用文字,不要用图片,js;
4)面包屑导航尽量出现关键字,把首页换成网站名称之类的;
Nofollow的使用:
1)当超级链接中出现nofollow标签时,搜索引擎不考虑此链接的权重,也不用与排
名;
2)写在meta标签上,告诉爬虫不要抓取网页上的外部和内部链接;
<meta name="robots” content="nofollow” />
3)写在超链接a标签中,告诉爬虫不要抓取特定的链接;

4)网站链上垃圾网站会降低权限,对可以的第三方链接使用nofollow标签;
5)网站版权、备案、站外链接都应该加nofollow标签;
404页面:
1)用户访问页面不存在显示404页面;
2)在404页面提供能回到首页或者热门页面的链接;
3)不要使用重定向将404页面跳转到首页,用户体验极差;
4)有些打不开的页面返回码并非404,需将状态码设置成404;
5)进入404页面后5s返回其他页面,不要立刻返回其他页面;
统计代码的使用:
1)放在网站的底部,用来分析用户及页面情况;
体验:
1)网站最多使用三屏;
2)css/js设置缓存时间;
<LINK rel=stylesheet type=text/css href="http://ssffx.com/Song-Index.css?
ver=20141015>
3)添加面包屑导航;

猜你喜欢

转载自blog.csdn.net/qq_36129701/article/details/104653222
2.