超级基本的python问题,如何将数据集变量分配为雪花SQL查询以进行建模



我是一个python新手(显然(。 我只是有一个简短的问题。 如何将 sql 查询定义为变量? 目标是将此数据库表用作建模目的的数据集,但我不知道如何将表或查询定义为变量语法。 请帮忙!

import pandas as pd
import numpy as np
import snowflake.connector
OKTA_USER = 'username'
OKTA_PASSWORD = 'pw!'
con = snowflake.connector.connect(
user=OKTA_USER,
password=OKTA_PASSWORD,
account='account',
authenticator='account link',
)
cur = con.cursor()
cur.execute("USE WAREHOUSE WH_GENERAL")
dataset = 'SELECT * FROM table LIMIT 10'

要将表数据提取到Python数据结构中,您可以执行以下操作:

cur.execute("SELECT * FROM table")
column_names = list(map((lambda(x) : x[0]), cur.description))
print column_names 
table  = list()
row = cur.fetchone()
while row is not None:
table.append(row)
row = cur.fetchone()
print table

表结构将是元组列表,其中每个列表元素都是一行,元组的每个部分都是列元素。

如果你想将数据读入熊猫,我建议在互联网上搜索。
我发现这个:SQL到熊猫数据帧在第一次尝试...

您是否正在尝试替换SQL的一部分,如果是这样,我们可以使用replace()函数,或者如果您有任何模板,那么您可以使用jinja模板来格式化您的SQL。

最新更新