互联网机器人——填写表格



网络机器人如何在网站上随机填写表单?我猜他们下载HTML源代码并找出表单的存在。但他们到底是如何填写表格并提交信息的呢?

我知道许多表单使用验证码,但许多系统也使用检测鼠标运动,键盘事件等技术来区分人类和机器人。机器人也能打败他们吗?

基本上,我想知道是否有任何方式机器人可以跟踪代码中的Javascript变化,即页面的动态变化?

p。S:我正在把这些信息用于一个关于打败机器人技术的研究生项目。

像Watir这样的一些测试平台实际上执行鼠标和键盘操作,而不仅仅是HTTP请求(因此可以避免在Javascript中使用任何僵尸预防方法)。这意味着基本上不可能区分机器人和人类。像验证码这样的东西依赖于机器人无法正确识别图像中的一个或多个单词,但即使是这样,有时也可以用OCR来打破。

基本上,你可以采取很多措施来阻止机器人,但如果它们勤奋的话,几乎不可能阻止它们。

您并不需要总是下载源代码。您可以手动查找表单字段,然后构建一些东西(几乎任何东西,例如Python脚本)来提交。

<form action="submit.php" method="post">
<input name="url" />
<input name="name" />
<input type="submit" />
</form>

然后使用任何语言发送POST请求到site.com/submit.php。一般为"url=xxx&name=xxx"。

基于标签,虽然它不太可能,你可以用JS或HTML。

看看脚本语言的有状态浏览器。Python有一个模块叫做mechanize

最新更新