提交 XML 站点地图可为搜索引擎提供您希望其索引的站点每个页面的完整分类。因此,这是您的搜索引擎优化 (SEO) 策略中的重要一步。但是,为了获得最佳结果,您需要使用站点地图验证器来确保您没有发送错误的文件。

在这篇文章中,我们将讨论站点地图验证器是什么以及它们是如何工作的。然后,我们将指导您解决使用站点地图验证器时可能遇到的常见错误以及如何修复这些错误。开始吧!

什么是站点地图验证器?

站点地图是一个文件,其中包含您希望搜索引擎索引的网站上每个网址的列表。站点地图采用 XML 或 HTML 格式,前者是最受欢迎的选项。

从技术上讲,您不需要向 Google 或其他搜索引擎提交您网站的站点地图。这些平台使用爬虫来浏览您的网站、识别每个 URL 并将这些页面编入索引。但是,创建站点地图可以让您完全控制哪些 URL 被搜索引擎索引以及哪些 URL 不应被索引(例如私人或冗余内容)。

在大多数情况下,您将使用自动生成的站点地图。如果您使用 WordPress,像 Yoast 这样的 SEO 插件可以帮助您创建一个可以提交到 Google Search Console 的站点地图:

站点地图验证器是一种可以处理这些 XML 或 HTML 文件并确保它们不包含错误的工具。 “错误”是指:

  • 搜索引擎无法抓取的页面
  • 404错误
  • 401错误
  • Sitemap Too many
  • 非规范 URL 中的 URL

如果您的站点地图包含任何这些错误,搜索引擎可能无法索引您列出的每个页面。手动读取 XML 文件来查找问题可能会花费很长时间,并且您还需要测试 URL。幸运的是,站点地图验证器使您能够跳过所有工作并开始修复它们识别出的任何错误。

如何使用站点地图验证器

使用站点地图验证器很简单。根据您使用的工具,您可能需要上传 XML 文件或提供站点站点地图的 URL。如果您使用类似 XML 站点地图验证器的东西。

/ p>

输入您要检查的站点地图的 URL,该工具将返回一份报告,其中包括它发现的任何错误。

如果你得到一份干净的报告没有问题,搜索引擎可以索引站点地图中的 URL。您可以安全地将您的站点地图提交给 Google、Bing、Yandex 或任何您想要的地方,不用担心。但是,如果遇到错误,则需要知道如何修复它们。这将我们带到下一节。

5 个常见的站点地图错误以及如何修复它们

不幸的是,有些站点地图无法完美验证,但我们将介绍一些站点地图验证器,它们可以帮助您将站点地图提交给 The在他们的文件中发现的最常见的错误。先说爬虫的“问题”。

1.存在抓取问题的页面

抓取问题是验证器返回的最常见问题之一。此错误表示该服务无法抓取您站点地图中的页面。

通常,当验证器或搜索引擎无法抓取页面时,这意味着以下情况之一:

  • 页面加载时间过长。如果您的网站加载时间过长,与爬虫的连接将会超时。这意味着某些页面可能未被编入索引。
  • 您的网站使用了过多的重定向。如果重定向设置不正确,您的网站可能会进入重定向循环。这意味着搜索引擎将无法抓取它。
  • 该网站阻止搜索引擎对其进行抓取。您可以将 WordPress 配置为阻止爬虫(使用 noindex 标记),这样您的网站就不会被编入索引。通常,您可能会在构建站点或创建私人页面时执行此操作。
  • 该页面返回了 404 或 401 以外的错误代码。站点地图验证器可以解析 404 错误。但是,其他 HTTP 错误代码将导致“抓取问题”警告。

“抓取问题”错误可能不明确。但是,您可以通过访问有问题的 URL 来确定确切的问题。如果您的页面加载快速且正确,您的网站可能会阻止搜索引擎抓取它。

如果页面加载没有错误,我们建议测试您网站的加载时间,看看是否存在任何性能问题。否则,您应该会看到特定的错误代码或多个重定向实例。

2. 404 错误

站点地图中的 404 错误很容易解决。如果该页面不再存在,您可以手动从站点地图中删除该条目或为其设置重定向。您的最佳选择将取决于该页面是否仍在获得访问量。

来自 Google Search Console 和其他服务的站点分析将显示 404 页面是否仍在接收访问者。在这种情况下,最好的办法是设置重定向到最近的相关页面或帖子,这样您就不会错过该流量。只要您使用单个重定向,就不会导致站点地图验证错误。

3. 401 错误

站点地图中的 401“未经授权”错误意味着抓取工具无法访问特定页面,因为它们没有必要的权限。当您在需要用户登录的页面上工作时,通常会弹出此错误。

解决此错误的唯一方法这是通过从站点地图中删除需要授权的页面来完成的。任何只对登录用户可见的页面不应被编入索引。否则,在搜索引擎结果页面 (SERP) 中单击它的访问者会发现自己面临 401 错误。

4.站点地图中的网址过多

搜索引擎可以抓取包含数千页的大型网站。但是,根据我们的经验,如果您列出接近(或超过)50,000 个页面,站点地图就会开始显示错误。

如果这是您的情况,那么感谢您的努力。 50,000 页很多。但是,大多数页面超过 50,000 的站点可能有多个来自用户生成内容的 URL。在这种情况下,您希望优先考虑网站上最重要的页面,同时删除用户可能不想在 SERP 中看到的站点地图条目。

5.站点地图中的非规范网址

有时,当搜索引擎看到同一页面的多个版本的网址时,它们会感到困惑。例如,您可以使用以下任何 URL 访问一个简单的博客页面:

  • http://yourwebsite.com
  • http://www. yourwebsite.com
  • https://yourwebsite.com
  • https://www.yourwebsite.com

其实所有这些URL 可以指向同一页面(如果您将 HTTP 流量重定向到 HTTPS)。但是,搜索引擎可能会将这些 URL 视为站点地图中的四个不同条目,从而导致验证错误。

解决此问题的一种简单方法是为您的 WordPress 网站指定规范 URL。 Yoast 等 SEO 插件会自动为您的网站分配规范 URL。如果您使用的是 SEO 插件生成的 XML 文件,则在使用站点地图验证器时不应遇到“非规范”错误。

结论

随着您网站的发展,使用站点地图变得更加重要。站点地图可让您告诉搜索引擎他们应该索引哪些页面以及忽略哪些页面。此外,使用站点地图验证器将帮助您发现错误,这样爬虫就不会在为您的站点编制索引时出现问题。

回顾一下,站点地图验证器可能遇到的五个最常见错误是:

  1. 存在抓取问题的页面:您需要检查加载时间、重新定位和访问您的网站页面以确定确切的问题。
  2. 404 错误:此错误意味着您应该从站点地图中删除不存在的页面或为其设置重定向。
  3. 401 错误:考虑从站点地图中删除受限制的页面。
  4. 您的站点地图中的 URL 太多:您可能希望对站点地图中的页面有选择性,并删除不太有用的页面。
  5. 站点地图中的非规范 URL:我们建议为特定页面设置规范 URL。

您对使用 Sitemap Validator 有任何疑问吗?让我们在下面的评论部分讨论它们!

精选图片来自 hanss / shutterstock.com

来源