如何开始学习大数据?作为开发人员,我需要专注于哪些模块



我打算学习大数据。我刚刚浏览了教程,但我有点困惑从开发人员的角度来看我需要专注于哪些模块。目前我正在研究Java。我希望您的回复对我的大数据之旅的下一步有所帮助。

首先,我建议熟悉这个术语,大数据是一个有点蓬松和有争议的术语,更多的是营销口号而不是技术规范,涵盖了广泛的技术。

从这个开始,我会尝试确定哪个方面(物联网,构建/运行数据中心,etl/数据集成/仓储,分析/统计/机器学习......(或者你感兴趣的应用领域(零售,生物信息学......(,以及从就业的角度来看哪个是合理的。我也会考虑你想处理的技术堆栈(Scala,Python......(。

逆向工程工作机会实际上可能是获取该信息的一种方式。

数据科学家配置文件(etl + 机器 learing + 可视化(获得了广泛的接受,并包含某些技能集,也可以找到大数据分析师和出价数据工程师,可以说有一个不太明确的配置文件。

如今,人们可以在数据科学中获得完整的MSC(这是对它的个人评估(,但也许您也可以在一条不那么花哨的路线上踏入大门。Trainigs的质量可能参差不齐,我发现Andy Ngs机器学习和深度学习(大神经网络(MOOC令人惊叹,来自EPFL-Scala方面的一切都(如果你想走这条路的话(在技术上是优越的,从演示文稿来看还可以(我尝试了Scala和Spark的大数据分析(。

最新更新