什么是html快照(谷歌爬虫)



我一直在寻找一个"HTML快照"的例子,为谷歌机器人爬虫,但我仍然不知道什么是"快照"像?从我的理解方式,我认为这是我的网页的html放在一起成一个大字符串?

非常感谢!

你说得对,就是这样。HTML快照是你希望谷歌在抓取你的网站时找到的静态HTML代码。10年前,它和HTML源代码差不多。今天,特别是在SPA(单页面应用程序)中,HTML的更改不需要重新加载页面。这意味着并不总是有一个适当的URL与每个可能的HTML相关联。快照就是你想要呈现给Google的那种生成的HTML。

这就是为什么你可以找到像https://ajaxsnapshots.com/这样的产品这是一个Javascript代码,采取"图片"你的HTML页面,因为他们被生成,以确保由谷歌机器人获取的代码是有意义的。

最新更新