小贝子编程

具有病例敏感的数据框架，而不是插入蜂巢表中

本文关键字：插入蜂巢框架有病数据 apache-spark hadoop hive pyspark bigdata
更新时间 : 2023-09-13
英文 : DataFrame having case sensitive and not inserted in hive table

面对一个方案，其中dataFrame具有案例敏感，并且在将此数据框架插入蜂巢表中时，列出了误差，因为列是歧义

E.g:daframe_test.columns[ABC, abc]

我们可以在运行时动态处理的列中两个值，而不会投掷错误

通过设置spark.set.conf("spark.sql.caseSensitive", "true")

尝试使用一个解决方案

但是，在添加此属性后将此数据框架插入蜂巢表中时，将错误/异常作为模因开销和堆积空间等问题。而且不希望实时项目中此属性设置

Hive不支持案例敏感列名称。您将必须重命名列，以确保它们符合Hive中的命名方案。

最新更新

这个Golang程序中的同步问题
如何使用Caliburn在MVVM中重用新视图.微观和微观
如何np.用张量连接列表?
基于文件名移动文件
Toast消息不显示当我点击按钮
r语言 - 如何在环境中运行任意表达式，并将所有结果存储在环境中?
Picutre 未显示在警报对话框中
如何在SQL Server中赋予用户CREATE DATABASE的权限?
选项importsNotUsedAsValues已弃用
在c# WinForms中不维护更改鼠标指针
Rust执行类型转换在运行时或在编译静态?
我如何在log4net中指定一个绝对文件路径，使用datePattern?
如何在服务端使用pubnub w/ nodejs作为服务，并从不同的客户端连接到该nodejs服务器
用下划线替换其中任意一个字符
Typescript在访问映射的Proxy对象时丢失了键类型的特定性
r语言 - 时间序列由长到宽
如何获得Traefik的dnsChallange的"www.*.example.org"证书？
用Rxjs构建一个初始化器
我在JavaScript文件变量中定义html代码的一部分时出错
嵌入式Jetty服务器的JNDI查找失败
是否可以在构造函数的成员初始化列表中使用结构化绑定?
如何在CDK中为CloudFront函数添加环境变量?
如何修复docker-compose中的FileNotFoundError
在一个显示中组合多个线性梯度
r语言 - 计算数据帧内组行的频率
模型在不同平台上输出略有不同是否正常?
ag-Grid在列cellRenderer上禁用多列排序
根据条件返回不同的df
在inline onclick属性中使用one()
TS2304：找不到名称'RTCErrorEvent'

具有病例敏感的数据框架，而不是插入蜂巢表中

相关内容

最新更新

热门标签：