如何使用机械化刮取HP打印机状态页



状态页面如下所示:

http://h20000.www2.hp.com/bc/docs/support/SupportDocument/c00002742/c00004781.gif

你看到设备状态标题下面的文字了吗?这就是我想要刮的。

导航到时,状态页面将更新。我已经从页面上提取了这个来源:

<form id="deviceStatusPage"   method="post" action="this.LCDispatcher?nav=hp.DeviceStatus">

我似乎不明白它到底在做什么,所以很难制定出一个好的刮削策略。我确信这个解决方案会很琐碎,但我似乎根本无法开始。

应该说我一直在玩机械化和美丽汤。前者似乎能实现我想要的,但我不确定如何实现。

使用一个抓取库。BeautifulSoup是一个很好的例子。CCD_ 2和CCD_。

最新更新