请选择 进入手机版 | 继续访问电脑版
查看: 282|回复: 0

XML站点地图与SEO的一百个秘密

[复制链接]

161

主题

168

帖子

787

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
787
发表于 2020-6-23 09:40:18 | 显示全部楼层 |阅读模式
      这是有关生成和优化XML站点地图所需的指南和建议。随着网络的发展,Google和SEO也在发展。在昨天可能是好的建议,而今天却不是。
      对于站点地图尤其如此。
      当每个人都在博客和社交媒体上发表看法和建议时,需要花费点时间从中整理出有价值的建议。因此,尽管我们大多数人都认为向谷歌控制台Google Search Console提交站点地图很重要,但您可能不知道如何以SEO最佳的方式构建地图。
      本文涵盖:
      什么是XML站点地图
      ◆ XML站点地图格式
      ◆ XML站点地图类型
      ◆ XML站点地图优化
      ◆ XML站点地图最佳做法清单

      1. 什么是XML站点地图
      简而言之,XML站点地图是您网站URL的列表。它充当了路线图,告诉搜索引擎哪些内容可用以及如何到达。
      
       在上面的示例中,搜索引擎可以一次性在该站点地图中找到所有九个页面。在网站上,它必须跳过五个内部链接才能找到第9页。
      XML站点地图协助爬网程序更快地建立索引的功能对于以下网站尤其重要:
     (1)具有数千个页面和深层的网站架构
     (2)经常添加新页面
     (3)经常更改现有页面的内容
     (4)内部链接效果不明显、存在孤立页面
     (5)缺乏强大的外部配置文件
      旁注:如果有许多网址不想被收录,提交带有“noindex”网址的站点地图比在谷歌控制台Google Search Console中删除URL更为有效。但请谨慎使用,并确保仅将此类URL临时添加到站点地图中。即使没有地图,搜索引擎也能找到您的URL地址。提交地图也不能保证爬网,但通过XML站点地图肯定会增加爬网的机会。

      2. XML 站点地图格式
     仅有一页的网站将其所有的标记放入XML站点地图:
     

     但是所有的元标记都有些什么含义和价值?
     (1)Loc(位置)标签
      它是一个必不可少的标签,展示域名地址。它应该准确反映您的站点协议(http或https),以及您是否选择包含或排除www。
      对于国际网站,您可以使用“hreflang”属性。通过使用“xhtml:link”指示每个URL的语言和区域变体,可以减少页面加载时间,而<head>或HTTP头部标签的“link”则无法实现。
     (2)Lastmod(最后一次修改)标签
      一个可选的但强烈推荐的标签,用于传达文件的最后修改日期和时间。
      约翰·米勒(John Mueller)承认谷歌Google确实使用lastmod标记来了解页面的上次更改时间以及是否对其进行爬网。


      网址+上次修改日期是我们关心的。
       - 约翰(@JohnMu)2017年8月17日


     上次修改时间对于网站内容尤其重要,因为它可以帮助谷歌Google了解您是原始发布者。但是请确保仅在进行一定更改后才更新修改日期。
     (3)Changefreq(更改频率)标签
     用这个标签告诉Google此链接可能会出现的更新频率。但是  穆勒指出,“更改频率在站点地图中并没有真正起到重要作用”,并且““最好直接指定时间戳要好得多”。
     (4)优先标签(Priority Tag)
     来指定此链接相对于其他链接的优先权比值,此值定于0.0 - 1.0之间。充其量,这只是对搜索引擎的提示,约翰·米勒明确表示他们忽略此标签。


      我们忽略站点地图中的优先级。
      - 约翰(@JohnMu)2017年8月17日


     旁注:您的网站需要XML站点地图,但不一定需要优先标签和更改频率标签。正确使用lastmod标记,并确保您提交了正确的URL。

     3. 站点地图的类型
     站点地图有许多不同类型,让我们看看那些您实际需要的。
    (1)XML 站点地图索引
     XML网站地图有两个限制:

     最多50,000个URL。
     压缩前的文件大小限制为50MB。

     可以使用gzip压缩站点地图(文件名将类似于sitemap.xml.gz)以节省服务器带宽。但是,站点地图仍不能超过以上两个限制。
     如果您是个大型网站,需要超出以上限制,则可以将您的URL分成多个XML站点地图。然后将这些站点地图置于一个XML站点地图索引文件,通常称为sitemap-index.xml。
     如果您是一个超大型网站,您还可以创建多个站点地图文件。例如:

     sitemap-index-articles.xml
     sitemap-index-products.xml
     sitemap-index-categories.xml

     但是请注意,您不能嵌套站点地图索引文件。
     为了使搜索引擎一次找到每个站点地图文件,您将需要:

     将您的站点地图索引提交到谷歌控制台Google Search Console和必应Bing网站管理员工具。
     在robots.txt文件中指定站点地图索引网址。直接将搜索引擎指向您的站点地图。

     您也可以通过使用Ping工具提交站点地图
     但要注意:

     Google不再留意“未经验证的站点地图”中的hreflang条目,汤姆·安东尼(Tom Anthony)指出,特别是那些通过Ping提交的。

    (2)XML图片站点地图
     图像站点地图旨在改善图像内容的索引。但是,在当今的SEO中,图像嵌入在页面内容中,因此将与页面URL一起进行爬网。此外,最好是利用JSON-LD schema.org/ImageObject标记向搜索引擎调用图像属性,因为它提供的属性比图像XML站点地图更多。
     因此,大多数网站都不需要XML图片站点地图。包含图片站点地图只会浪费抓取预算。但是也有例外,例如股票照片网站或电子商务网站从Google Image搜索获得产品页面会话。
     请注意:图像不必与您的网站位于同一域中。您可以使用CDN(内容分发网络),只要已在搜索控制台Search Console中对其进行了验证。

    (3)XML视频站点地图
     与图像类似,如果视频对您的业务至关重要,请提交XML视频站点地图。如果不是,则不需要视频站点地图。

    (4)Google新闻站点地图
     只有在谷歌Google新闻中注册的网站才可以使用此站点地图。谷歌Google新闻站点地图不支持图片URL,建议使用schema.org图片或og:image为谷歌Google新闻指定文章缩略图。

    (5)HTML网站地图
     XML网站地图可以满足搜索引擎的需求。HTML网站地图旨在帮助用户查找内容。
     问题是,如果您拥有良好的用户体验和精心设计的内部链接,是否需要HTML网站地图?
     在Google Analytics(谷歌数据统计)中检查HTML网站地图的网页浏览数(很可能比较低,如果不是,则表明您需要改善网站导航)。
     HTML网站地图通常在网站页脚中链接。从网站的每个页面传递链接权重。
     这是否为链接权重的最佳使用方式?或者,是否只是作为对传统网站布局的认可?
     如果很少人使用它,并且您已经具有强大的内部链接和XML网站地图,那么该HTML网站地图是否存在理由?我会说否。

    (6)动态XML网站地图
     使用诸如Screaming Frog之类的工具可以轻松创建静态站点地图。
     问题是,一旦创建或删除页面,您的站点地图就会过时。如果您修改页面的内容,站点地图将不会自动更新lastmod标记。因此,最好避免使用静态站点地图,除非您喜欢一个个手动创建并上传站点地图。
     另一方面,动态XML网站地图会由您的服务器自动更新,以反映相关的网站更改。
     要创建动态XML网站地图,请执行以下操作:
     ▲ 请您的开发人员编写自定义脚本的代码,并确保提供清晰的参数
     ▲ 使用动态站点地图生成器工具
     ▲ 为CMS(内容管理系统)安装插件,例如Yoast SEO插件
     提示:
     (1)动态XML网站地图和XML网站地图索引是最佳做法。
     (2)仅在需要时,才使用图像,视频和Google新闻站点地图。

      4. XML 站点地图优化
      这是关键。
      在XML网站地图中仅纳入SEO相关页面,XML网站地图是您建议要爬网的页面列表,不一定是网站的每个页面。搜索蜘蛛会以您网站的配额为限进行抓取。XML站点地图表明您认为地图中的URL比其他没有列入进来的URL更重要。您使用它来告诉搜索引擎“如果您特别关注这些URL,我将非常感谢。”
      它可以帮助您有效地利用配额。它也可以帮助搜索引擎更智能地抓取您的网站,从而获得更好地收录您的网站。
      您应该避免:
      页面重复
      ✘ 分页页面
      ✘ 基于参数ID或会话ID的URL
      ✘ 站点搜索页面
      ✘ 在URL中堆砌关键词
      ✘ 任何重定向(3xx),缺少页面(4xx)或服务器错误页面(5xx)。
      ✘ 被robots.txt阻止的页面。
      ✘ “noindex”页面
      我想分享一个关于优先化页面的示例:
      假设您的网站有1000页。这1,000页中的475页是SEO相关内容。您可以在XML网站地图中突出显示这475个页面,实质上是要求Google取消对其余部分的索引编制优先。
      现在,假设Google抓取了这475个页面,并通过算法确定175个“ A”等级,200个“ B +”等级和100个“ B”或“ B-”等级。这是一个很高的平均分数,可能表明它可以将用户吸引到一个高质量的网站。
      相比之下,通过XML网站地图提交所有1,000个页面。谷歌Google查看发现超过50%的页面是“ D”或“ F”页面。这会影响到您的用户访问。
      但是请记住,Google只会将您的XML网站地图用作您网站上重要内容的线索。不在您的XML网站地图中,并不一定意味着谷歌Google不会为这些页面编制索引。对于SEO,整体网站质量是关键因素。要评估您的网站质量,请转到Google Search Console(GSC)中查看与站点地图相关的报告。

      5. 充分利用站点地图报告
      新版Google Search Console中的Sitemaps部分没有提供像以前那样丰富的数据。
      
       现在的主要用途是确认您的站点地图索引已成功提交。在新的GSC中,对于SEO而言,更有价值的区域是“索引覆盖率”报告。
      该报告为“所有已知页面”。在这里您可以:
      
      发现和解决“错误”或“警告”。这些通常源于相互冲突的robot协议。
     查看索引趋势。大多数网站都在不断增加有价值的内容,因此“有效”页面(又称谷歌Google索引的页面)在稳步增加。了解任何急剧变化的原因。
     选择“Valid”,然后在“Indexed, not submitted in sitemap”详细信息中查找。这些页面上您和谷歌Google在其价值上存在分歧。例如,您可能尚未提交您的URL,但谷歌Google已将该页面编入索引。在这种情况下,您需要寻找的是由于不良的分页处理,不良的参数处理,重复的内容或遗漏在站点地图之外的URL。
     然后,通过将下拉列表更改为“All submitted pages”,将报告限制为您包含在站点地图中的SEO相关URL。然后检查所有“被排除”页面的详细信息。
     排除站点地图URL的原因可以分为以下四个组:
     (1)速效方案:针对重复的内容,使用canoncials指令,robots指令,针对40X HTTP状态代码,重定向或合法性问题,请进行适当的修复。
     (2)调查页面:对于“提交的URL已删除”和“爬网异常”问题,请使用谷歌Google抓取方式工具进行进一步调查。
     (3)改善页面:对于“已爬网-当前未建立索引(Crawled – currently not indexed)”页面,请查看页面内容和内部链接(通常是因为有许多类似页面或相近URL)。也可能是内容单薄,非原创或页面孤立的问题。
     (4)改善域名:对于“已发现-当前未建立索引(Discovered – currently not indexed)”的页面,谷歌Google指出说是因为它们“试图抓取URL但超出负荷”,实际上是由于内部链接不佳或从域名中看到的内容质量低下,因此谷歌Google觉得不值得进行爬网。如果您看到更多此类页面,请查看通过站点地图提交的页面(或页面类型)的SEO值,着重于优化抓取预算,并从链接和内容中完善信息架构(包括参数)。
      评估站点地图优化工作的最佳指标是“所有提交的页面”索引率——有效页面与所有可被发现页面的比例,努力使这一比例达到80%以上。
      为什么不100%?
      因为如果您将所有精力都集中在确保对当前拥有的每个SEO相关URL进行索引,那么您可能会错失扩大内容覆盖的机会。
      注意:如果您是一个较大的网站,并选择将其网站分为多重站点地图索引,则可以按这些索引进行过滤。这样可以使您:
      概览图表会更加详细。
      ▶ 调查排除类型时,可以参阅大量相关示例。
      ▶ 一节一节地处理索引优化。
     旁注:在索引覆盖率报告( Index Coverage report )上,除了可以看到“错误”和“警告”之外,还可以作为XML站点地图的排查工具检查索引问题

    6. XML 站点地图最佳做法清单
     ✓在XML网站地图中包含hreflang标签
     ✓包括<loc>和<lastmod>标签
     ✓使用gzip压缩站点地图文件
     ✓使用站点地图索引文件
     ✓动态生成XML网站地图
     ✓确保所有URL仅包含在一个完整站点地图中
     ✓使用robots.txt
     ✓将站点地图索引提交到谷歌搜索控制台Google Search Console和必应Bing网站管理员工具
     ✓在XML网站地图中仅包含SEO相关页面
     ✓修复所有错误和警告
     ✓分析有效页面的趋势和类型
     ✓计算提交页面的索引率
     ✓解决被排除页面的问题

     现在,检查您自己的站点地图,并确保您做对了。
     

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

为你推荐

SEO写作:掌握组合艺术的47个技巧
2020-06-23 / wmj
SEO撰写要点: 1.首先考虑关键字 2.像艺术一样进行关键字研究 ...<详情>
联盟营销从入门到精通(3)——Offer产品与
2020-08-22 / jackhh
为了全面分析offer,我们需要:⊹ 确定offer的目标受众⊹ 写下of ...<详情>
Instagram注册和使用有什么注意的吗?
2020-09-10 / 2859111460
请问一下instagram注册和使用的时候是不是会像Fackbook 那样子容 ...<详情>
不同类型的国际运输方式——该如何选择?
2020-09-12 / JHxx
在电商行业中,跨境运输是一个棘手的问题。不同运输方式的计费 ...<详情>
如何通过做一些真正具有新闻价值的事情来赢
2020-07-01 / wmj
进行实际上具有新闻价值的活动可以帮助您获得宣传,增强权威并获 ...<详情>
微信公众号 ( 9:00—18:00 ) Huntusd

扫一扫关注我们,了解更多最新动态

快速回复 返回顶部 返回列表