小贝子编程

Spark 的 Row 和 InternalRow 类型之间的差异

本文关键字：之间类型 InternalRow Row Spark apache-spark apache-spark-sql apache-spark-dataset
更新时间 : 2023-09-09
英文 : Differences between Spark's Row and InternalRow types

目前Spark有两个Row实现：

import org.apache.spark.sql.Row
import org.apache.spark.sql.catalyst.InternalRow

两者兼

而有之有什么必要？它们是否表示相同的编码实体，但一个在内部使用（内部 API），另一个与外部 API 一起使用？

Row 是（well..）的稳定版本实现。排。。。但是，顾名思义，InternalRow将在Spark SQL内部使用。我在下面引用了InternalRow的文档：

/**
 * An abstract class for row used internally in Spark SQL, which only contains the columns as
 * internal types.
 */
abstract class InternalRow extends SpecializedGetters with Serializable {

最新更新

SwiftUI：Foreach in List - 有什么优势？
如何加载所有转储附加的字典在python pickle?
Jmeter语言 - 当前活动线程
Java作用域问题:try-catch块，解析字符串到日期
如何在主应用中获得UWP应用服务的通知?
复选框的定位
弹簧启动-采用与2个ymls不同的属性
Symfony 5.3+翻译提供商Crowdin不更新本地文件
从文本文件(.txt)中读取字节数组
如何下载完整的雅典娜查询结果到CSV文件
pyspark:在执行join - restrict相同列名选择时设置别名
如何在Eclipse RCP中隐藏/删除Preferences对话框中的导入/导出按钮
在自定义jackson反序列化器中以响应式方式从db加载实体
使用RestSharp从API返回JSON数据
OAuth同意屏幕不显示正确的AppName
使用ByRef更新记录集字段
提取多个XML文件中所有标签之间的文本，并将提取的文本复制到csv文件中
在Laravel和Vue之间共享数据的糟糕方式
可以在Azure Devops中找到需求文本文件
如何在tensorflow keras中引用ground truth变量?
Json解析并分配给DTO
如何通过不重复结果来正确地循环一个范围
给出零最优值的AMPL程序
再次出现身份验证问题，GCP源存储库使用publickey
打印添加到数据库的记录数有问题
如何插入一行到一个表在sql是完全相同的另一个表，但只有一个列不同?
如何在jupyter notebook中导入两个或多个包?
对product类型的访问器进行泛型迭代
如何在 react 中"remember"昂贵的递归函数中先前计算的值？
在eclipse IDE上使用Tomcat服务器在本地机器上修复eclipse上的编译错误，我能做些什么?

Spark 的 Row 和 InternalRow 类型之间的差异

相关内容

最新更新

热门标签：