是否有一个(客户端)JavaScript库来做可读性/instapaper风格的整理HTML?ie将HTML用于整个网页,并通过删除标题,边栏等来整理它,只留下核心文章,使用一些启发式方法。我正在寻找的东西像清洁(htmlPageString)。
我认为可读性本身是在JavaScript中实现的,但是没有相应的库
我认为这个JavaScript库是沿着你正在寻找的路线。它是用于生成Firefox Reader View的库的独立版本。
https://github.com/mozilla/readability下面是可读性,封装在一个node模块中:node- readable。它工作得很好,但不是在所有情况下。我目前正在寻找替代品。
根据我的阅读,它内置在javascript+JSON中,以JSON的形式将用户的阅读列表存储在队列中。它跟踪网页请求以及时间,日期和其他一些特定信息。