如何使用WWW::Mechanical::Firefox从文档中获取HTML表

我不知道如何从文档访问HTML表。

我正在使用此链接：丰业银行就业

这个想法是点击"下一页"按钮几次，然后将所有的小HTML表集中到一个表中。

当我用WWW::Mechanize::Firefox打开链接时，我可以用获得整个文档（以及第一页HTML表）

 my $cont= $mech->content( format => 'html' );

之后，我用点击"下一页"按钮

my $id="search_result_next_page_link"; 
$mech->click({ xpath => qq{//*[@id="$id"]}, synchronize => 0 });

我可以多次单击按钮，文档中的表正在更改，但我不能再使用$mech->content了，因为URL是相同的，内容没有更改。

我在尝试类似的东西：

my $tt= $mech->xpath('/html/body/form/div[4]/div/main/div/div[3]/section/div/div/table/text()');
print $tt;

但它打印的是"0"。

我有一种感觉，我很接近，知道如何在每次点击后获得HTML表吗？？？？

最后。。。。我不得不麻烦WWW::Mechanize::Firefox模块的作者，他提供了如何获得该表的HTML代码的解决方案。脚本应该是这样的：

@tt= $mech->selector('.tableSearchResults'); $HTMLtable= $tt[0]->{innerHTML};

别忘了，每次点击后都需要等待（或者创建一个循环，等待元素出现）。

相关内容