我正在寻找一个数据可视化工具,这是开源的,并使用apache Spark作为后端。我做了一些研究,可以缩小到Apache Zeppelin,在那里我可以根据Spark SQL创建的表生成图表/图形等,但这是我的问题,会有非技术用户查看数据视觉效果,我不认为他们会知道如何编写SQL等。所以我想看看是否有人知道更好的方法/工具。一些可以让他们拖放而不需要编码的东西,最小的学习曲线。请给出建议。
谢谢Pradeep
这可能不完全符合您的需求。
有一些商业工具支持拖放。
- 表
- Tibco Spotfire
- SAS Visual Analytics
问题是一个用户友好的拖放工具是非常昂贵的构建。
如果我们有一个数据工程师精心设计的齐柏林笔记本,功能如下
-
将数据加载到spark
-
用动态表单探索数据的一些段落
-
发布结果
那么也许大量的用例已经可以解决了。
基于修改代码比编写代码容易得多。假设我们有以下代码来分析齐柏林笔记本中的spark-highcharts并绘制图表。
import org.apache.spark.sql.functions._
import com.knockdata.spark.highcharts._
import com.knockdata.spark.highcharts.model._
highcharts(bank
.series("x" -> "age", "y" -> avg(col("balance")))
.orderBy(col("age"))).plot()
然后我们可以有一个简短的指导,如
有
marital
,job
,education
,…可以代替age
有
sum
,min
,max
…替换avg
我强烈建议你可以试试这个网站https://rawgraphs.io;这个在线工具真的帮助了我。它基于D3js,这是非常流行的。但是,这个过程非常简单,上传数据,选择样式,然后拖动属性。web将生成svg、png和pdf文件供您下载。