通过 Power BI 上的 Spark Thrift 服务器连接/访问 Hive 数据



我对多个平台上的数据连接相当陌生,我在这里的要求很简单,我需要能够通过 Power BI 访问 Spark Thrift 服务器,任何人都可以指导我完成相同的步骤吗?

我必须集成相当多的大数据和分析工具,并且对Spark有丰富的经验。

通常我会在 Tableau 文档中查找它https://onlinehelp.tableau.com/current/pro/desktop/en-us/examples_sparksql.html

或工具的文档
https://powerbi.microsoft.com/en-us/blog/power-bi-desktop-november-feature-summary/#spark

但我偏爱这些文档
https://github.com/oracle/learning-library/blob/master/workshops/journey2-new-data-lake/files/18.1.4/pdf/Connecting%20DVD3%20and%20Spark.pdf

您需要确保已spark-thift并侦听打开的端口。然后,您将需要不同的信息和您使用的连接类型(jdbcodbc...

这是假设你有一个预览版的 DirectQuery
https://learn.microsoft.com/en-us/power-bi/desktop-directquery-data-sources