Java Goose不能在Android上提取内容



我正在尝试建立一个小型Android应用程序,该应用程序使用Goose库从网页中提取内容。因为这个库是用Scala编写的,所以我使用的是我在这里找到的.jar。问题是,当我试图从页面中提取内容时,它什么也不返回。我成功地使用我需要的URL创建了一个Article对象,但是该对象的值(title、domain、topImage等)都是null。我尝试使用不同的url,看看问题是否被隔离到单个网站,但似乎不是这样。

我用来设置Goose实例的代码如下:
gooseDir = context.getCacheDir();
Configuration config = new Configuration();
config.setLocalStoragePath(gooseDir.getAbsolutePath());
Goose goose = new Goose(config);

然后像这样创建Article实例:

Article article = goose.extractContent(url);

任何建议吗?

实际上你不能在Android上使用Goose库,因为不兼容,但你可以使用我的Android版本:https://github.com/milosmns/goose

它的功能与Goose几乎相同,只是在Android上运行良好。

最新更新