使用发布/订阅和云函数将数据从网站发送到 BigQuery



这就是我要完成的

  1. 访问者登陆我的网站
  2. Javascript收集一些信息并发送命中
  3. 匹配被处理并插入到大查询中

这是我计划如何解决它

  1. 命中被发送到 Cloud Functions HTTP 触发器(使用 Ajax(
  2. 云函数向发布/订阅发送消息
  3. 发布/订阅使用
  4. 发布/订阅触发器将数据发送到另一个云函数
  5. 第二个云函数将命中处理到Biguery行中,并将其插入到BigQuery中

有没有更简单的方法可以解决这个问题?

需要考虑的其他一些细节

  • 每天大约有100万次点击
  • 不想使用云数据流,因为它会膨胀成本
  • 不能(可能(跳过 Pub/Sub,因为当一个人离开网站时会发送一些点击,并且请求可能没有足够的时间来处理所有内容。

您可以执行大查询流式处理,这一次更便宜,并且您可以避免达到每天每个表 1000 个加载作业配额。

另一种选择是,如果您不介意数据花费大量时间加载,则可以将所有信息存储在Cloud Storage存储桶中,然后通过传输加载所有数据。您可以对其进行编程,以便每天上传数据。此解决方案专注于批处理环境,在该环境中,您将所有信息存储在一侧,然后将其传输到最终目的地。如果您只想流式传输您提到的解决方案是可以的。

由您选择更适合您的特定用途的选项。

最新更新