超级基本的python问题，如何将数据集变量分配为雪花SQL查询以进行建模

我是一个python新手(显然(。我只是有一个简短的问题。如何将 sql 查询定义为变量？目标是将此数据库表用作建模目的的数据集，但我不知道如何将表或查询定义为变量语法。请帮忙！

import pandas as pd
import numpy as np
import snowflake.connector
OKTA_USER = 'username'
OKTA_PASSWORD = 'pw!'
con = snowflake.connector.connect(
user=OKTA_USER,
password=OKTA_PASSWORD,
account='account',
authenticator='account link',
)
cur = con.cursor()
cur.execute("USE WAREHOUSE WH_GENERAL")
dataset = 'SELECT * FROM table LIMIT 10'

要将表数据提取到Python数据结构中，您可以执行以下操作：

cur.execute("SELECT * FROM table")
column_names = list(map((lambda(x) : x[0]), cur.description))
print column_names 
table  = list()
row = cur.fetchone()
while row is not None:
table.append(row)
row = cur.fetchone()
print table

表结构将是元组列表，其中每个列表元素都是一行，元组的每个部分都是列元素。

如果你想将数据读入熊猫，我建议在互联网上搜索。
我发现这个：SQL到熊猫数据帧在第一次尝试...

您是否正在尝试替换SQL的一部分，如果是这样，我们可以使用replace()函数，或者如果您有任何模板，那么您可以使用jinja模板来格式化您的SQL。

相关内容

最新更新

热门标签：