我想使用Google BigQuery分析大约50GB的数据(不断增长的数据)。但是我对bigquery的定价和分析有两个疑问。
数据内容(每行)
COLUMN | ROW
USER_ID——比;唯一用户ID(例如zc5zta5h7a6sr)
BUY_COUNT——比;INT (e。g 35)
TOTAL_CURRENCY——比;美元(如500美元)
等。
我想在图表中显示的东西;总货币$1-999和1000-10,000+$的唯一用户数量。
我知道在分析中处理的每1TB有5美元的定价,但是;
1-)每天将有1gb的新数据添加到BigQuery表中。我想在每个新数据上创建一个实时图表。Google bigquery会每天只收取1GB的分析费用,还是它会重复分析50GB的数据,并为每个新数据收取50+1GB的费用?
2-)具有相同id的数据可以添加到我不断更新的数据集中。有可能自动组合它们吗?例如;当id为zc5zta5h7a6sr的用户进行新购买时,我可以更新表id中的BUY_COUNT列吗?如果可能的话,我将如何收费?
谢谢。
每次运行查询时都会发生BigQuery分析计费。关于你的观点:
-
如果查询每次都扫描所有表,则每次查询运行时都会根据表的当前大小向您收费。有一些方法可以优化这一点,如物化视图,分区表,构建聚合表等。
-
如果您的聚合不是很复杂,物化视图可以帮助您解决这一点。例如,您可以有一个包含未聚合数据的
raw
表和一个按用户聚合BUY_COUNT的物化视图。您将为自动维护期间扫描的字节数以及每次在视图上运行查询时扫描的字节数付费。
关于定价的更多信息:https://cloud.google.com/bigquery/pricing