Impala中的
我想将一个数据帧解析为sql表中的两个预定义列。sql中的模式是:
abc(varchar(255))
def(varchar(255))
使用这样的数据帧:
df = pd.DataFrame(
[
[False, False],
[True, True],
],
columns=["ABC", "DEF"],
)
sql查询是这样的:
with conn.cursor() as cursor:
string = "INSERT INTO {0}.{1}(abc, def) VALUES (?,?)".format(db, table)
cursor.execute(string, (df["ABC"]), (df["DEF"]))
cursor.commit()
因此查询(字符串(看起来是这样的:
'INSERT INTO my_table(abc, def) VALUES (?,?)'
这将创建以下错误消息:
pyodbc.Error: ('HY004', '[HY004] [Cloudera][ODBC] (11320) SQL type not supported. (11320) (SQLBindParameter)')
因此,我尝试在Impala编辑器中对以下内容使用直接查询(而不是通过Python(:
'INSERT INTO my_table(abc, def) VALUES ('Hey','Hi');'
并生成以下错误消息:
AnalysisException: Possible loss of precision for target table 'my_table'. Expression ''hey'' (type: `STRING) would need to be cast to VARCHAR(255) for column 'abc'`
为什么我甚至不能在表中插入简单的字符串,比如"嗨"?我的模式设置正确吗?
STRING
类型的大小限制为2GB。VARCHAR
的长度是您定义的长度,但不超过64KB。因此,如果隐式地将一个数据转换为另一个数据,则可能会丢失数据。
默认情况下,文字被视为类型STRING
。因此,为了在VARCHAR
字段中插入一个文字,您需要适当地CAST
它。
INSERT INTO my_table(abc, def) VALUES (CAST('Hey' AS VARCHAR(255)),CAST('Hi' AS VARCHAR(255)));