网站不收录是怎们回事你知道吗,在内蒙古网络推广中,网站优化很重要的就是网站抓取,但是网站抓取异常你知道是什么原因吗?快跟着搜搜网络小编来看看!
爬取异常的原因是什么?
爬取异常的原因主要分为两类,一类是网站异常,一类是链接异常。在哪里看,在搜索资源平台(https://ziyuan.baidu.com)中添加数据统计后——在那里抓取异常。
一、网站异常的原因:
1.DNS异常
当蜘蛛(Baiduspider)无法解析您网站的IP时,就会出现DNS异常。可能是你的网站IP地址错误,或者你的域名服务商屏蔽了Baiduspider。您可以使用 WHOIS 或 host 来检查您网站的 IP 地址是否正确,是否可以解析。如果不正确或无法解析,请联系域名注册商更新网站IP地址。
2.连接超时
获取请求的连接超时。可能的原因是:服务器过载或网络不稳定。
3. 抓取超时
爬取请求连接建立后,页面下载速度过慢,导致超时。可能的原因是服务器过载,带宽不足。
4.连接错误
建立连接后无法连接或其他服务器拒绝。
2、链接异常的原因:
1.访问被拒绝
爬虫发起爬取,httpcode返回码为403。
2. 找不到页面
爬虫发起爬取,httpcode返回码为404。
3.服务器错误
爬虫发起爬取,httpcode返回码为5XX
4.其他错误
爬虫发起爬取,httpcode返回码为4XX,不包括403和404。
3、网站爬取异常的原因有哪些
网站爬取异常的原因主要包括以下五个方面:
1.服务器异常
不正常的服务器连接可能是网站服务器太大,超载,通过检查浏览器输入输入您的域名以进行正常访问。服务器异常会导致爬虫无法连接到网站服务器,导致爬取失败。
2.域名过期
域名过期的网站无法访问,域名解析无效。如果出现这种情况,你可以联系你的域名注册商,看看有没有被抢注或者可以续费。
3.网络运营商异常
电信和中国联通都是属于网络运营商的网站,蜘蛛无法访问。
如果电信或中国联通网络运营商出现问题,请联系网络服务运营商或购买CDN服务。
4.robots.txt文件设置问题
robots.txt的主要作用是屏蔽一些不重要的文件,告诉搜索引擎这些页面可能不会被抓取,但也可能有重要的页面需要屏蔽。 ,您可以检查机器人文件设置。