基于Web的数据可视化应用程序,后端spark



我正在寻找一个数据可视化工具,这是开源的,并使用apache Spark作为后端。我做了一些研究,可以缩小到Apache Zeppelin,在那里我可以根据Spark SQL创建的表生成图表/图形等,但这是我的问题,会有非技术用户查看数据视觉效果,我不认为他们会知道如何编写SQL等。所以我想看看是否有人知道更好的方法/工具。一些可以让他们拖放而不需要编码的东西,最小的学习曲线。请给出建议。

谢谢Pradeep

这可能不完全符合您的需求。

有一些商业工具支持拖放。

  • Tibco Spotfire
  • SAS Visual Analytics

问题是一个用户友好的拖放工具是非常昂贵的构建。

如果我们有一个数据工程师精心设计的齐柏林笔记本,功能如下

  • 将数据加载到spark

  • 用动态表单探索数据的一些段落

  • 发布结果

那么也许大量的用例已经可以解决了。

基于修改代码比编写代码容易得多。假设我们有以下代码来分析齐柏林笔记本中的spark-highcharts并绘制图表。

import org.apache.spark.sql.functions._
import com.knockdata.spark.highcharts._
import com.knockdata.spark.highcharts.model._
highcharts(bank
  .series("x" -> "age", "y" -> avg(col("balance")))
  .orderBy(col("age"))).plot()

然后我们可以有一个简短的指导,如

marital, job, education,…可以代替age

sum, min, max…替换avg

我强烈建议你可以试试这个网站https://rawgraphs.io;这个在线工具真的帮助了我。它基于D3js,这是非常流行的。但是,这个过程非常简单,上传数据,选择样式,然后拖动属性。web将生成svg、png和pdf文件供您下载。

相关内容

最新更新