如何查找 404 错误
Posted: Mon Feb 17, 2025 9:21 am
当搜索机器人在爬行网站时报告检测到 10 到 20 个错误时,这就是一种情况。但如果这个数字每天都在增长,达到数十万呢?如果 404 错误的数量超过网站总页面数量的 10%,则需要紧急干预并解决问题。
也讀吧!
“为什么该网站卖不出去:客观原因和不那么客观的原因”
阅读更多
为什么会有这么多不存在的页面?原因有很多。但是,通常情况下,这种情况是由于代码错误而发生的(例如,如果样式在模板代码中,而不是在单独的文件中,则可以使用脚本和样式形成这些页面)。
错误 404
机器人抓取死页的另一个原因是病毒攻击的结果(例如,在网站上设置门户)。即使在阻止了攻击并且移除了门之后,机器人仍会在一段时间内尝试绕过创建的页面。这可能会导致大量 404 错误。
各种服务允许您通过此类链接控制转换,而不会遇到任何特别的困难。
为了跟踪用户到 404 页面的转换,使用了以下工具:
“Yandex.Metrica”
使用“Yandex.Metrica”中的“访 伯利兹号码数据 问参数”可以跟踪用户对链接的点击。您只需要在计数器代码中放置行“params:window.yaParams||{ }});”即可。
下面的JS代码应该直接输入到404页面的任意位置:
<脚本>
var url = document.location.路径名 + document.location.search
var url_referrer = document.referrer;
var yaParams = {error404:{page:url,来自:url_referrer}};
</script>
其中url是 404 页面的当前地址,url_referrer是该页面的来源地址。该代码允许您跟踪死链接及其所在的页面。
谷歌分析
要跟踪到 404 页面的转换,您需要输入以下代码:
<脚本>
ga('发送','pageview','404.html?page='+ document.location.pathname + document.location.search +'&from=' + document.referrer);
</script>
其中document.location.pathname + document.location.search是网站上不存在的页面的 URL; document.referrer – 用户导航到 404 页面的页面 URL。
Yandex.Webmaster 和 Google Search Console
网站管理员工具可以让您了解搜索机器人遇到的 404 错误。
“Yandex.网站管理员”
要查看页面,请转到索引 - 搜索中的页面 - 排除的页面。要选择具有所需错误的页面,请使用状态“HTTP 错误:404”过滤器。
Google 搜索控制台
要识别错误,请使用“扫描”——“扫描错误”——“错误 404”。
用于扫描网站中断开链接的工具
以下服务可帮助您研究互联网资源并识别其中的非活动链接:
尖叫青蛙 SEO 蜘蛛工具
分析整个站点后,“响应代码”选项卡中会出现包含 4xx 和 5xx 错误的页面以及放置在那里的链接的文档。该服务的唯一缺点是需要付费才能使用。
但也有免费工具可以检查死链接:
Netpeak Spider,
Xenu 的链接侦探,
Siteliner,
WildShark SEO 蜘蛛,
Webbee SEO 蜘蛛工具。
要检查站点地图页面的服务器响应,请使用 Map Broker XML Sitemap Validator。
也讀吧!
“为什么该网站卖不出去:客观原因和不那么客观的原因”
阅读更多
为什么会有这么多不存在的页面?原因有很多。但是,通常情况下,这种情况是由于代码错误而发生的(例如,如果样式在模板代码中,而不是在单独的文件中,则可以使用脚本和样式形成这些页面)。
错误 404
机器人抓取死页的另一个原因是病毒攻击的结果(例如,在网站上设置门户)。即使在阻止了攻击并且移除了门之后,机器人仍会在一段时间内尝试绕过创建的页面。这可能会导致大量 404 错误。
各种服务允许您通过此类链接控制转换,而不会遇到任何特别的困难。
为了跟踪用户到 404 页面的转换,使用了以下工具:
“Yandex.Metrica”
使用“Yandex.Metrica”中的“访 伯利兹号码数据 问参数”可以跟踪用户对链接的点击。您只需要在计数器代码中放置行“params:window.yaParams||{ }});”即可。
下面的JS代码应该直接输入到404页面的任意位置:
<脚本>
var url = document.location.路径名 + document.location.search
var url_referrer = document.referrer;
var yaParams = {error404:{page:url,来自:url_referrer}};
</script>
其中url是 404 页面的当前地址,url_referrer是该页面的来源地址。该代码允许您跟踪死链接及其所在的页面。
谷歌分析
要跟踪到 404 页面的转换,您需要输入以下代码:
<脚本>
ga('发送','pageview','404.html?page='+ document.location.pathname + document.location.search +'&from=' + document.referrer);
</script>
其中document.location.pathname + document.location.search是网站上不存在的页面的 URL; document.referrer – 用户导航到 404 页面的页面 URL。
Yandex.Webmaster 和 Google Search Console
网站管理员工具可以让您了解搜索机器人遇到的 404 错误。
“Yandex.网站管理员”
要查看页面,请转到索引 - 搜索中的页面 - 排除的页面。要选择具有所需错误的页面,请使用状态“HTTP 错误:404”过滤器。
Google 搜索控制台
要识别错误,请使用“扫描”——“扫描错误”——“错误 404”。
用于扫描网站中断开链接的工具
以下服务可帮助您研究互联网资源并识别其中的非活动链接:
尖叫青蛙 SEO 蜘蛛工具
分析整个站点后,“响应代码”选项卡中会出现包含 4xx 和 5xx 错误的页面以及放置在那里的链接的文档。该服务的唯一缺点是需要付费才能使用。
但也有免费工具可以检查死链接:
Netpeak Spider,
Xenu 的链接侦探,
Siteliner,
WildShark SEO 蜘蛛,
Webbee SEO 蜘蛛工具。
要检查站点地图页面的服务器响应,请使用 Map Broker XML Sitemap Validator。