将URL结构与Anemone匹配



现在,我正在使用Anemone执行以下操作:

Anemone.crawl("http://www.findbrowsenodes.com/", :delay => 3) do |anemone|
  anemone.on_every_page do | page |

但我愿意

Anemone.crawl("http://www.findbrowsenodes.com/", :delay => 3) do |anemone|
   anemone.on_pages_like() do | page |

相反,只从如下URL爬网:

http://www.findbrowsenodes.com/us/Apparel/1036682http://www.findbrowsenodes.com/us/Apparel/1040664http://www.findbrowsenodes.com/us/ArtsAndCrafts/2617942011http://www.findbrowsenodes.com/us/Baby/165797011

有什么想法吗?

您可以使用类似的正则表达式

/http://www.findbrowsenodes.com/us/.+/[d]*/

相关内容

  • 没有找到相关文章

最新更新