我正在研究一个从网络中提取数据并将其转换为有意义的东西的系统,以便外行能够理解。
但我连起点都找不到。
你能给我一些指导吗?从哪里开始,java中的哪些工具可以帮助我设计和开发这个系统。
谢谢。。。。
您有两个问题:从web中提取数据,并将其转换为有意义的内容。第一个可以使用网络爬虫来完成。
然后是转换数据的部分。你需要非常具体地了解
- 所需的数据类型
- 您希望存储的方式
- 您希望应用于它的挖掘类型
例如,
- 霍格莫德市民的天气信息
- 一个包含最低/最高温度、湿度和雨雪信息等的数据库
- 根据过去40年的天气预测降雨量
如果可以的话,试着提供一些上下文。