如何找到特定新闻源的提要或XML



我想获得特定新闻源的xml文件,如果有任何项目将html新闻转换为xml,解析页面并在单个xml或类似类型的文件中标记其各种特征,如日期,作者姓名,标题,内容等。例如,请看这个链接:http://daily.bhaskar.com/article/NAT-TOP-yeddyurappa-breaks-venkaiah-naidus-laptop-slaps-minister-reports-2318460.html我怎么能提取内容,作者,日期等从这个网页。或者如果我能找到这个网页的提要,我可以很容易地做到这一点。但是我怎么搜索呢

您使用的是哪种技术?

如果它是一个纯粹的客户端/web解决方案,那么你会在之前的StackOverflow问题中找到js选项。如果你在服务器端,你可以使用WebClient/LINQ点击ATOM提要并解析它

要知道一个页面是否有提要,请在HTML中扫描一个特定的

reltype属性:
<link rel="alternate" type="application/rss+xml" title="Page as RSS"
 href="http://example.com/page/feed">

提要URL存储在href属性中。这个机制叫做RSS自动发现

相关内容

  • 没有找到相关文章

最新更新