小贝子编程

如何使用robots.txt阻止机器人爬行分页

本文关键字：机器人爬行分页何使用 robots txt seo pagination robots.txt
更新时间 : 2023-08-31
英文 : How to stop robots crawling pagination using robots.txt?

我的网站上有各种分页，我想停止谷歌和其他搜索引擎对我的分页索引进行爬网。

已爬网页面示例：

http://www.mydomain.com/explore/recently-updated/index/12

我如何使用robots.txt拒绝机器人对任何包含/index/的页面进行爬网？

Disallow: /*?page=
Disallow: /*&page=

我相信，如果您在根web目录中创建robots.txt文件，并使用以下内容：

User-agent: *
Disallow: /explore/recently-updated/index/

尝试一下，然后使用某人（可能是谷歌的）机器人检查器来确保它被阻止。

最新更新

android WebView:复制到剪贴板[https://poe.com]
为什么我的web scraper将所有内容写在一行中?
无法获取…的applicationId项目类型:PROJECT_TYPE_LIBRARY
实例化prefab内部的对象
如何在html文本区的左上角放置按钮?
如何使用Nodejs API获取数据
为什么"需要'原生'"在 opalrb 中抛出异常？
c -结构体中char指针的内存分配
Azure功能应用程序与自托管集成运行时相结合
类型 'String' 不是类型转换中 'List<String>' 类型的子类型？
__init__是一个类属性吗?
如何格式化LocalDateTime yyyy-MM-dd HH:mm到dd-MM-yyyy HH:mm作为字符串的整个
为什么客户端组件不工作- NextJS 13.3.0实验特性
跨行扩展字典，维护其他列- python
如何将open()加载的数据编码为UTF-8?
这个Golang程序中的同步问题
如何使用Caliburn在MVVM中重用新视图.微观和微观
如何np.用张量连接列表?
基于文件名移动文件
Toast消息不显示当我点击按钮
r语言 - 如何在环境中运行任意表达式，并将所有结果存储在环境中?
Picutre 未显示在警报对话框中
如何在SQL Server中赋予用户CREATE DATABASE的权限?
选项importsNotUsedAsValues已弃用
在c# WinForms中不维护更改鼠标指针
Rust执行类型转换在运行时或在编译静态?
我如何在log4net中指定一个绝对文件路径，使用datePattern?
如何在服务端使用pubnub w/ nodejs作为服务，并从不同的客户端连接到该nodejs服务器
用下划线替换其中任意一个字符
Typescript在访问映射的Proxy对象时丢失了键类型的特定性

如何使用robots.txt阻止机器人爬行分页

相关内容

最新更新

热门标签：