状态页面如下所示:
http://h20000.www2.hp.com/bc/docs/support/SupportDocument/c00002742/c00004781.gif
你看到设备状态标题下面的文字了吗?这就是我想要刮的。
导航到时,状态页面将更新。我已经从页面上提取了这个来源:
<form id="deviceStatusPage" method="post" action="this.LCDispatcher?nav=hp.DeviceStatus">
我似乎不明白它到底在做什么,所以很难制定出一个好的刮削策略。我确信这个解决方案会很琐碎,但我似乎根本无法开始。
应该说我一直在玩机械化和美丽汤。前者似乎能实现我想要的,但我不确定如何实现。
使用一个抓取库。BeautifulSoup
是一个很好的例子。CCD_ 2和CCD_。