使用胶水爬行器读取json返回UNKNOWN分类



我有一个json文件,其格式如下

{"result": [{"key1":"value1", "key2":"value2", "key3":"value3"}]}

当我使用爬网程序时,创建的表具有UNKOWNN分类。我做了一些研究,如果你用JsonPath$[*]制作一个自定义分类器,你应该能够得到整个数组。不幸的是,至少对我来说,这不起作用。我在创建分类器后创建了一个新的爬虫,因为如果用分类器更新旧的爬虫,它就不会工作。

有人遇到这个问题并能提供帮助吗?

您的JSONPath假设根是一个集合,例如

[{"result ..},{}]

由于您的根不是集合,请尝试以下JSONPath:

$.result

这假设整个对象是你想要的值,你可能也想这样做:

$.result[*]

这将把结果集合中的每个条目作为一个单独的对象。

我找到了一个解决方法。。

在我的python脚本中;结果";大堆换句话说,我没有";结果";键。然后,我可以使用带有以下JsonPath$[*]的分类器。这个变通方法对我来说效果很好。

祝你过得愉快!

相关内容

  • 没有找到相关文章

最新更新