纷享阁资源网

 找回密码
 立即注册
查看: 564|回复: 0

如何查看网站被百度抓取的情况?

[复制链接]

5万

主题

-3

回帖

17万

积分

积分
170433
纷享阁资源网 发表于 2019-3-16 11:12:06 | 显示全部楼层 |阅读模式

加入纷享阁资源网VIP,更多资源任你下。

您需要 登录 才可以下载或查看,没有账号?立即注册

x
百度用于抓取网页的程序叫做Baiduspider - 百度蜘蛛,我们查看网站被百度抓取的情况主要是分析,网站日志里百度蜘蛛Baiduspider的活跃性:抓取频率,返回的HTTP状态码。
       
       
       
        如何查看网站被百度抓取的情况?
       
        查看日志的方式:
       
        通过FTP,在网站根目录找到一个日志文件,文件名一般包含log,下载解压里面的记事本,这即是网站的日志,记录了网站被访问和操作的情况。
       
        因为各个服务器和主机的情况不同,不同的主机日志功能记录的内容不同,有的甚至没有日志功能。
       
        日志内容如下:
       
        61.135.168.22 - - [11/Jan/2009:04:02:45 +0800] "GET /bbs/thread-7303-1-1.html HTTP/1.1" 200 8450 "-" "Baiduspider+(+http://www.baidu.com/search/spider.htm)"
       
        分析:
       
        GET /bbs/thread-7303-1-1.html 代表,抓取/bbs/thread-7303-1-1.html 这个页面。
       
        200 代表成功抓取。
       
        8450 代表抓取了8450个字节。
       
        如果你的日志里格式不是如此,则代表日志格式设置不同。
       
        很多日志里可以看到 200 0 0和200 0 64 则都代表正常抓取。
       
        抓取频率是通过查看每日的日志里百度蜘蛛抓取次数来获知。抓取频率并没有一个规范的时间表或频率数字,我们一般通过多日的日志对比来判断。当然,我们希望百度蜘蛛每日抓取的次数越多越好。
       
        在网站出现问题的情况下,通过查看网站日志,查看网站的HTTP返回值是否正常。

上一篇:百度统计推广来源账户,推广代码安装率数值代表的意思是什么
下一篇:301重定向怎么进行URL标准化设置?

Archiver|手机版|本站声明|纷享阁资源网 |网站地图

GMT+8, 2026-6-1 09:10 , Processed in 0.197998 second(s), 28 queries .

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表