所以,假设我是一名记者,他想通过某种方式轻松发布我写的故事的链接,这些故事发布在我的报纸网站上。遗憾的是,我的报纸的网站不提供用户级的RSS订阅源(实际上,用户级的任何东西都适合记者)。
运行搜索(即。,http://www.calgaryherald.com/search/search.html?q=Rininsland)按相反的时间顺序显示我所做的一切(尽管有一些重复;暂时忽略,稍后处理)有什么方法可以将其解析为RSS提要吗
看起来像雅虎!管道可能是一种简单的方法,但我对任何事情都持开放态度。
谢谢!
通常这将是Yahoo Pipes的一个很好的用途,但您引用的搜索页面似乎有一个robots.txt文件,Pipes对此表示尊重。这意味着管道不会从页面中提取数据。
有关更多信息:"如何阻止管道访问我的网页?"
http://pipes.yahoo.com/pipes/docs?doc=troubleshooting#q14
您必须自己编写一个scraper,向该URL发出HTTP请求,解析响应,并将RSS作为输出写入。这可以在许多服务器端环境中完成,如PHP、Python等。
EDIT:Feedity提供了一种将网页抓取为提要的服务。以下是您的搜索url的Feedity提要:http://feedity.com/rss.aspx/calgaryherald-com/UFJWUVZQ
然而,除非您注册订阅(3.25/mo),否则此订阅源将受到以下限制:
已创建免费订阅源没有帐户的限制为5项目和10小时的更新间隔。在没有帐户的情况下创建的免费订阅源自动从我们的系统处于非活动状态30天后。
如果你只需要链接和每篇文章的时间戳,那么雅虎管道搜索模块将返回Herlad网站搜索索引中最新的10个。