我对网络编程不太了解,但我在编程(C/C++、Assembly、Lisp等)方面经验丰富,并且知道一些基本的HTML和Javascript。我需要一个好的库,可以用来制作程序,可以
- 扫描(并解析)HTML文件
- 填写表格并选择单选按钮
- 通过链接打开其他页面
- 提交填写好的表格
- 绕过captcha(只是开玩笑;D)
如果它是跨平台的,那会更好,但如果不是,那仍然可以(只要它在Linux上运行)。
您可能还想尝试一下请求:http://docs.python-requests.org/en/latest/index.html
有些人认为这是urllib2的一个更好的替代方案。主要是语法更人性化。参考:http://pydanny.blogspot.com/2011/05/python-http-requests-for-humans.html
我认为最简单的解决方案是使用urllib2Python标准库:
http://docs.python.org/library/urllib2.html
它提供了一种简单的方法来生成各种HTTP请求并解析其响应。在C++中,许多大型库(例如Qt)都有HTTP库。
您还应该将它与curl结合起来,使用这些工具来操作和发送表单。