我不知道如何从文档访问HTML表。
我正在使用此链接:丰业银行就业
这个想法是点击"下一页"按钮几次,然后将所有的小HTML表集中到一个表中。
当我用WWW::Mechanize::Firefox
打开链接时,我可以用获得整个文档(以及第一页HTML表)
my $cont= $mech->content( format => 'html' );
之后,我用点击"下一页"按钮
my $id="search_result_next_page_link";
$mech->click({ xpath => qq{//*[@id="$id"]}, synchronize => 0 });
我可以多次单击按钮,文档中的表正在更改,但我不能再使用$mech->content
了,因为URL是相同的,内容没有更改。
我在尝试类似的东西:
my $tt= $mech->xpath('/html/body/form/div[4]/div/main/div/div[3]/section/div/div/table/text()');
print $tt;
但它打印的是"0"。
我有一种感觉,我很接近,知道如何在每次点击后获得HTML表吗????
最后。。。。我不得不麻烦WWW::Mechanize::Firefox
模块的作者,他提供了如何获得该表的HTML代码的解决方案。脚本应该是这样的:
@tt= $mech->selector('.tableSearchResults');
$HTMLtable= $tt[0]->{innerHTML};
别忘了,每次点击后都需要等待(或者创建一个循环,等待元素出现)。