我正在尝试创建一个DataFrame
,它有一个存储unicode
数据的列,而不是标准的python string
,因为我的语言有一些额外的重音字母,例如ñ, á, é
和其他字母。
我尝试了以下方法。
x = sqlContext.createDataFrame([u"A", u"B", u"C"], ["letters"])
并显示了下一个例外。
TypeError:无法推断类型的架构:<。类型'unicode'>
然后我阅读了类型文档,没有找到兼容的数据类型,因此我问是否有人知道是否可以实现这一点?
问题在于如何提供元素而不是unicode
数据。即使只有一列,每个元素都应该是支持的类型,如Row
、list
或tuple
:
df = sqlContext.createDataFrame([(u"A", ), (u"B", ), (u"C", )], ["letters"])