我下载了html表单,用htmlCleaner清理它。最初它看起来像这样(现在它的格式很好,但我不知道如何简单地显示它,我希望,这是足够的):
...
<form action="complete" method="POST" enctype="multipart/form-data">
Please fill in your username:
<input type="text" name="employee" />
</BR>
Reason:
<BR/>
<textarea cols="50" rows="5" name="reason"></textarea>
</BR>
<input type="submit" value="Complete">
</form>....
是否有XPath表达式提取"请填写您的用户名"one_answers"原因",但在两个单独的字符串?此外,htmlCleaner不支持所有表达式,这里是->列表<-可能的表达式
谢谢
你需要的只是:
//input[@name="employee"]/@value
//input[@name="reason"]/@value
或者(如果需要<form>
元素中的文本):
//form/text()[1]
//form/text()[2]
你不能,因为你想提取的两段文本都是FORM的子元素,如果它们都被一个SPAN或div包装,你可以分别访问它们。
你可以分别使用'child'和position