我有一个json文件,其格式如下
{"result": [{"key1":"value1", "key2":"value2", "key3":"value3"}]}
当我使用爬网程序时,创建的表具有UNKOWNN分类。我做了一些研究,如果你用JsonPath$[*]制作一个自定义分类器,你应该能够得到整个数组。不幸的是,至少对我来说,这不起作用。我在创建分类器后创建了一个新的爬虫,因为如果用分类器更新旧的爬虫,它就不会工作。
有人遇到这个问题并能提供帮助吗?
您的JSONPath假设根是一个集合,例如
[{"result ..},{}]
由于您的根不是集合,请尝试以下JSONPath:
$.result
这假设整个对象是你想要的值,你可能也想这样做:
$.result[*]
这将把结果集合中的每个条目作为一个单独的对象。
我找到了一个解决方法。。
在我的python脚本中;结果";大堆换句话说,我没有";结果";键。然后,我可以使用带有以下JsonPath$[*]的分类器。这个变通方法对我来说效果很好。
祝你过得愉快!