小贝子编程

为什么 DataFrame Row.getAs[Vector] 会失败

本文关键字：Vector 失败 getAs DataFrame Row apache-spark dataframe apache-spark-sql
更新时间 : 2023-09-09
英文 : why does DataFrame Row.getAs[Vector] fail?

我有一个Spark DataFrame，其中有两列类型为String和org.apache.spark.ml.linalg.SparseVector，这工作正常：

data.map(r => r(1).asInstanceOf[Vector])

但是得到

data.map(r => r.getAs[Vector](1))

失败与

错误：找不到数据集中存储类型的编码器。原始类型(整数、字符串等(和产品类型(案例类(为导入spark.implicits._支持支持序列化其他类型将在将来的版本中添加。

你能解释一下为什么吗？

试试这个：

data.rdd.map(r => r.getAs[Vector](1))

有关Encoder和Dataset的更多信息，您可以阅读此

SO问题

最新更新

调试错误!Abort()已被调用.Visual Studio中的错误
查询查找具有给定权重的商品的订单
OpenID连接-授权代码流与新的谷歌身份JS API
如何将列表转换为单独的字符串?
Git克隆错误:RPC失败- curl 28操作太慢
无法将"可观察"类型的类型值<Store>转换为预期的参数类型"可观察<存储？>
使用 pybing11 覆盖 python 内置'print'
是否有一种方法可以通过mysqlworkbench更改存储过程所需的权限?
将这些变量按顺序排序(将单词转换为与其长度相等的数字).(使用条件)
为什么 Python 无法为我识别"kivy"模块？
在联合收割机中链接n个请求
如何通过回调管理生存期
左连接返回的行数少于左表上的select * ?
"List index out of range" for Django Steam API
Java正则表达式从Jasper文本字段的HTML标签中删除样式
在python中更改列表中的变量(回溯)
Laravel/PHP:条件日期过滤器
多个yaml文件在ros2启动
与来自无线电和复选框的JS一起添加两个值以获得总数
Python -仅显示4位序列的圆锥序列
在使用Zeep通过代理访问SOAP时更改服务URL
无法导入节点模块
VueJs 3 - Vuex: Uncaught TypeError: store不是函数
Textarea视觉元素?
日志记录不输出调试和信息日志
试图在R上安装地球引擎;Python =3.1不可用
如何在我的代码中添加一些项目，例如"Favorite"？
获取python中从1开始的值的特定索引
BeautifulSoup美化编码非英语(西里尔字母)字符奇怪
为什么' rev().rev() '工作，但' rev().skip(1).rev() '不工作? &

为什么 DataFrame Row.getAs[Vector] 会失败

相关内容

最新更新

热门标签：