我正在运行crawler4j,输出到目录/frontier/
。这个目录中的文件是
- 00000000.jdb
- je.info.0
- je.info.lck
- je.lck
.jdb文件是唯一一个包含数据的文件,其他三个文件的字节数为零。我不知道该怎么处理这些数据。java程序捕获了我想要的数据,但现在我不知道如何浏览我检索到的数据。(我在Mac上,所以任何跨平台或适用于OSX的东西都是最好的)
我查看了crawler4j的源代码,它看起来像是在使用Berkeley DB。有关如何访问这些文件的详细信息,请搜索StackOverflow。