小贝子编程

在使用Spark写入Parquet文件时，如何添加额外的元数据

本文关键字：添加元数据何添加 Spark 写入 Parquet 文件 apache-spark apache-spark-sql parquet
更新时间 : 2023-09-10
英文 : How to add extra metadata when writing to parquet files using spark

默认情况下看起来像spark。但是，如果我想将一些随机的元数据（例如版本= 123）写入Spark产生的镶木文件？

这不起作用：

df.write().option("version","123").parquet("somefile.parquet");

我正在使用Spark版本1.6.2

列级元数据，是的，请参阅我的评论。

表级评论/用户元数据：请参阅https：//issues.apache.org/jira/browse/browse/spark-10803

可悲的是，还没有

最新更新

在Python中删除列表中某些单词的第一个字符
TypeORM获取id在jsonb数组中的数据
userAccountControl attribute for OpenLdap
discord bot分片，并从数组结果中处理对象
python patoolib可执行文件句柄无效
测试时间序列数据中未戳的分钟数
如何在cloud Foundry的内部域中(apps.internal)为运行的应用创建用户提供的服务
在Jupyter Notebook中显示未显示在if-else块内的HTML类
如何控制可变的输入量- React
从json文件中创建gcloud配置
为用户代理(即操作系统)设置值的自定义代码
当我在c++中使用类中的类时得到警告
ImageMagik图片渲染不正常，白色方块布满图片
崩溃时，解构boost io_service
None typeobject in success_url django
在amazon eks kubernetics环境之外运行的Ignite厚客户端是否有可能访问amazon eks ku
Jest (ESM)在单元测试中会从React Native加载文件
Optimize Spark Shuffle Multi Join
如何把不同的图像和重定向用户到ListView Builder的其他页面?
在Thingsboard k8s部署版本，我怎么能改变' JWT_TOKEN_EXPIRATION_TIME ' ?&l
生成可变分钟间隔
如何将动画添加到可编写脚本的对象?
是春季安全ACL应该是可用的WebSecurityExpressionHandler?
在python中处理全局变量
Cypress:代码进入无限循环，当满足条件时无法打破循环
如何在Django中使用本地SQLite3数据库进行测试和MSSQL数据库进行生产?
绘制没有插值的动画
Javascript动画只占屏幕的一半
Ansible - 模板字符串时列出比较问题：预期的令牌"："，'}'
()->() 不能符合形状样式

在使用Spark写入Parquet文件时，如何添加额外的元数据

相关内容

最新更新

热门标签：