大数据案例研究或用例示例



我读了很多关于不同类型的行业如何使用大数据分析的博客文章。但是这些文章大多没有提到

  1. 这些公司使用了什么样的数据?数据的大小
  2. 他们用什么样的工具技术来处理数据
  3. 他们面临的问题是什么,他们获得的数据如何帮助他们解决问题。
  4. 他们如何选择工具技术来满足他们的需求。
  5. 他们从数据中识别出什么样的模式&他们从数据中寻找什么样的模式。

我想知道是否有人可以为我提供所有这些问题的答案或至少回答一些问题的链接。

如果有人能分享一下金融行业是如何利用大数据分析的,那就太好了。

你的问题很大,但我将尝试用我自己的经验来回答

1 -这些公司使用什么样的数据?

Hadoop的优势之一是你可以使用一个非常大的数据源。它可以是。csv/。txt文件,json, mysql,照片,视频…
它可以包含市场营销,社交网络,服务器日志等数据

数据的大小

这没有规定。它可以从50 - 60到1Po开始。这取决于数据和公司。

2 -他们用什么样的工具技术来处理数据

没有规定。这取决于需要。他们使用Hadoop、Hive和Pig来组织和处理数据。为了查询数据,他们想要一些短的响应时间,所以他们使用NoSQL/内存数据库和更短的数据集(由Hadoop改进)。在某些情况下,公司使用像Talend这样的ETL是为了更快。

3 -他们面临的问题是什么,他们从数据中获得的洞察力如何帮助他们解决问题。

公司面临的主要问题是数据的增长。目前,数据太大,无法用Mysql或其他传统工具进行处理。所以他们开始使用Hadoop。

4 -他们如何选择工具技术来满足他们的需求。

我认为这是一个内部问题。公司选择他们的工具是因为许可证的价格,他们自己的技能,他们的最终需要……

5 -他们从数据中识别出什么样的模式&他们从数据中寻找什么样的模式

我不太明白这个问题

我认为得到你想要的是一个困难的工作,从不同的资源一点一点地获得数据。一定要访问这些链接:

一堆免费报告。我正在研究名单。http://www.oreilly.com/data/free/

和著名的麦肯锡报告:http://www.mckinsey.com/~/媒体/麦肯锡/网络/见解% 20和% 20酒吧/MGI/研究/技术% 20和% 20创新/% 20大数据/MGI_big_data_full_report.ashx

最新更新