是否可以用unicode列实例化DataFrame



我正在尝试创建一个DataFrame,它有一个存储unicode数据的列,而不是标准的python string,因为我的语言有一些额外的重音字母,例如ñ, á, é和其他字母。

我尝试了以下方法。

x = sqlContext.createDataFrame([u"A", u"B", u"C"], ["letters"])

并显示了下一个例外。

TypeError:无法推断类型的架构:<。类型'unicode'>

然后我阅读了类型文档,没有找到兼容的数据类型,因此我问是否有人知道是否可以实现这一点?

问题在于如何提供元素而不是unicode数据。即使只有一列,每个元素都应该是支持的类型,如Rowlisttuple:

df = sqlContext.createDataFrame([(u"A", ), (u"B", ), (u"C", )], ["letters"])

相关内容

  • 没有找到相关文章

最新更新