我想从网络漫画RSS提要中过滤描述,并使用Yahoo Pipes提取所有具有特定链接文本的链接。例如,对于文本"本章从这里开始"和包含以下内容的说明:
<a href="http://example.com/1234.html">This chapter began here</a>.
<a href="http://cuteoverload.com/">Here are some great kitten pictures</a>
我希望输出是
http://example.com/1234.html
我最好的猜测是这将涉及正则表达式,但经过 45 分钟的研究,我真的不确定从哪里开始。我没有看到如何使用正则表达式来提取文本而不仅仅是替换它。
正
则表达式应该可以解决问题。
A) "替换"参数
(.*<a href=")(http://example.com/[^"]*)(.*)
将描述切成 3 部分
(.*<a href=")
(http://example.com/[^"]*)
(.*)
B) "With"参数,用第二部分替换整个描述
$2