我有一个自定义的火花数据源,并提供了来自Java库的数据。有些字段是ArrayType,偶尔是无效的。我尝试将数组字段设置为无,null,lit(null),option(null)以及可能的其他几个变体,在每种情况下,催化剂都在尝试解决数组字段时都会抛出NPE。
我可以告诉我,Catalyst在ArrayConverter的TocatalyStimpl()方法中都没有检查NULL(来自CatalystTypeconverters.scala)。这是催化剂错误,还是还有其他一些用于dataFrame arrayType字段的空编码?
我的不好,我发现了这个问题(被砍成错误的代码)。最终答案似乎是"选项(null)"。我没有尝试并点亮(null:),但两者都丢了异常。