首页 -> 数据资讯 -> 正文

地震大数据项目关键流程解析


更新时间:2018-06-13 来源:科技信息室

      一个完整的地震大数据项目离不开下面几个关键流程:信息采集、数据清洗、数据融合、数据挖掘、数据可视化。

      信息采集:基于内部的共享机制收集原始地震信息,无法通过共享直接取得的数据,可通过网络爬虫来采集数据;

      数据清洗:主要就是把一些无效的脏数据找出来剔除或者替换,任务量其实很大,主要是脏数据比较多;

      数据融合:就是把收集的多源、异构的地震数据进行统一处理,为后续数据挖掘做好准备;

      数据挖掘:就是把融合好的地震数据通过数据挖掘算法,去研究之前设定好的影响因子之间的因果关系,主要的分类算法有决策树、贝叶斯分类、基于规则的分类、神经网络、支持向量机、推荐算法、进化算法等;

      数据可视化:顾名思义就是把地震数据挖掘的成果可视化展示,这样可以直观的看到地震数据之间的关系,并利用数据分析和开发工具发现其中未知信息的处理过程。



网站备案号:陕ICP备06008731号 版权所有:中国地震局第二监测中心
地址:陕西省西安市西影路316号 邮编:710054
电话:029-85506506 E-mail:ec_data@126.com