Azure POS 和天气数据分析策略



我有一个关于Azure解决方案方法的问题。问题是如何决定使用哪些技术以及如何找到它们的最佳组合。

假设我有两个数据集,它们每天都在增长:

  1. 我有一个CSV文件,每天都会发送到我的ADL商店,其中包含所有可能的Lattitudes和Longtitudes组合的天气数据以及它们的邮政编码,以及50种不同的天气变量。

  2. 我还有另一个带有 POS(销售点)的数据集,它也作为每日 CSV 文件提供给我的 ADL 存储。它包含所有零售位置的销售数据。

所需的输出是将文件"切碎",以便为基于天气的 AzureML 销售预测准备数据,并且预测按零售位置完成,并通过 PowerBI 仪表板交付给每个零售位置。要求是不允许其他位置查看任何其他位置的预测。

我的问题是:

  1. 如何选择正确的技术集?
  2. 如何附加传入的每日数据?
  3. 如何为每个位置创建单独的 ML 预测结果?

赞赏有关体系结构主题的任何一般指导,并感谢有关比较不同合适解决方案的任何更具体的想法。

这是一个广泛的问题。

我只会回答您的 ADL 特定问题 #2,并为您提供与 Azure ML 无关的 #3 提示(因为我不知道该格式是什么):

  1. 如果仅使用文件,请将日期/时间信息添加到文件路径名(在文件夹或文件名中)。然后使用 U-SQL 文件集查询感兴趣的范围。如果使用 U-SQL 表,请使用PARTITIONED BY。有关更多详细信息,请参阅U-SQL 参考文档。

  2. 如果需要创建多个文件作为输出,则有两个选项:

    a. 您知道所有文件名,为每个文件编写一个 OUTPUT 语句,只为其选择相关数据。

    b. 您必须动态生成脚本,然后执行它。与此类似。

相关内容

  • 没有找到相关文章

最新更新