一对一免费咨询: 13913005726 025-66045668

高端网站建设

其实孤藤之前看过昝辉老师的《seo实战密码》,里面讲到的robots.txt只是,个人感觉还是很详细的,也没研究过大型网站都是怎么设置的,今天想起,来分析下国内微博新浪、腾讯、搜狐、网易4大平台各自的robots.txt文件的设置,robots怎么写。

1.新浪微博

说明:允许所有搜索引擎抓取

2.腾讯微博

说明:允许所有搜索引擎抓取,除了一些系统文件。而且加了两条网站地图,一个是认证会员个人微博主页底地址,另一个是微博留言的地址。xml格式网站地图有个限制是一个地图文件里最多只能罗列5万个url,一个文件最大不能超过10m,超多的话可以新建个网站地图放,孤藤特意去查了下 腾讯微博的第一个xml地图,地图文件里有41000左右的url,2m多大。过段时间再看看腾讯是不是也是新建网站地图处理过多的url的。

3.搜狐微博

搜狐微博是最有趣的,因为前几个月兴起的快速关键词排名借助的就是搜狐微博本身的高权重,后来传说搜狐微博屏蔽了百度蜘蛛,让我们来看看这robots.txt文件。第一个部分语句是允许百度蜘蛛抓取,第二个部分语句是允许搜狗抓取,第三个部分语句是禁止所有搜搜引擎抓取。

而根据百度官方学校网站规划设计书的文件说的需要特别注意宿迁网站建设公司的是Disallow与Allow行的顺序是有意义的,robot会根据第一个匹配成功的Allow或Disallow行确定是否访问某个URL。

因此最后一部分语句对百度和搜狗是无效的。也就是说搜狐微博只允许百度和搜狗来抓取页面。

这边还有一点是,我发现搜狐微博的robots.txt差不多在6月份左右时间做了修改,屏蔽出百度、搜狗外其他搜索引擎的抓取,但是其他搜索引擎确实照样索引,收录量也不断在增加,不同的是 谷歌、有道、bing仅仅只是索引,没湖州网站建设公司有收录。 搜索似乎不支持robot文件还是怎么,照样收录有快照、提取描述文字。雅虎也照样收录,只是快照看不到,不能判断是否是仅仅索引。

4.网易微博

网易微博找不到robots文件

再来看看四大博客平台的收录情况:

从上面可以看到腾讯微博的收录日收录量远超其他微博,日收录排名为 腾讯微博新浪微博搜狐微博网易微博。

今晚也是心血来潮,想说说这几个微博,该休息了,睡个几个小时,明早还的爬起来。本文泉州seo孤藤(www.gutengseo.com)个人愚见,欢迎拍砖。


 


 南京牧狼文化传媒有限公司简介:


      牧狼传媒,牧者之心,狼者之性,以牧之谦卑宽容之心待人,以狼之团结无畏之性做事!


  公司注册资金100万,主营众筹全案服务、网站营销全案服务、网站建设、微信小程序开发、电商网店设计、H5页面设计、腾讯社交广告投放以及电商营销推广全案等相关业务,致力于为客户提供更有价值的服务,创造让用户满意的效果!


  为百度官方及其大客户、苏宁易购、金山WPS秀堂、美的、创维家电、新东方在线、伊莱克斯、宝丽莱等国内国外知名品牌服务过,服务经验丰富!同时,公司也是南京电子商务协会会员单位、猪八戒网官方认证签约服务商、江苏八戒服务网联盟、南京浦口文化产业联合会会员单位,可以为您提供更好的服务!


  主营项目:众筹全案服务、网站营销全案服务、网站建设、微信小程序开发、电商网店设计、H5页面设计、腾讯社交广告投放、竞价托管、网站优化、电商代运营等


  合作客户:百度、苏宁易购、饿了么、美的、创维家电、新东方在线、宝丽莱、金山WPS秀堂、伊莱克斯


  资质荣誉:百度商业服务市场2017年度最佳图片服务商、南京电子商务协会会员单位、猪八戒网官方认证签约服务商、江苏八戒服务网联盟、南京浦口文化产业联合会会员单位、八戒通TOP服务商、"易拍即合杯"H5创意大赛"三等奖"。



致力于为客户创造更多价值
13913005726 025-66045668
需求提交
电话咨询
在线咨询