留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

基于Hadoop与Storm的日志实时处理系统研究

上一篇

下一篇

李洋,吕家恪. 基于Hadoop与Storm的日志实时处理系统研究[J]. 西南师范大学学报(自然科学版), 2017, 42(4). doi: 10.13718/j.cnki.xsxb.2017.04.019
引用本文: 李洋,吕家恪. 基于Hadoop与Storm的日志实时处理系统研究[J]. 西南师范大学学报(自然科学版), 2017, 42(4). doi: 10.13718/j.cnki.xsxb.2017.04.019
LI Yang,LV Jia-ke. Research on Log Data Real-Time Processing System Based on Hadoop and Storm[J]. Journal of Southwest China Normal University(Natural Science Edition), 2017, 42(4). doi: 10.13718/j.cnki.xsxb.2017.04.019
Citation: LI Yang,LV Jia-ke. Research on Log Data Real-Time Processing System Based on Hadoop and Storm[J]. Journal of Southwest China Normal University(Natural Science Edition), 2017, 42(4). doi: 10.13718/j.cnki.xsxb.2017.04.019

基于Hadoop与Storm的日志实时处理系统研究

Research on Log Data Real-Time Processing System Based on Hadoop and Storm

  • 摘要: 日志数据记录着丰富的信息, 具有较高的实用价值, 但在当今大数据时代环境下, 数据量的陡增为日志数据的处理带来了挑战. 为了有效地解决海量日志数据处理面临的瓶颈问题, 本文整合Hadoop和Storm分布式框架, 构建一种融合了实时计算与离线计算的分布式日志实时处理系统. 系统架构由数据服务层、 业务逻辑层和Web展示层组成, 数据服务层使用Flume实时采集日志数据, 并分别采用Kafka与HBase完成实时日志流数据的缓冲和系统数据的持久化存储;业务逻辑层利用Storm对实时日志流数据进行实时分析, 并使用Hadoop的计算引擎MapReduce结合数据挖掘技术完成对海量历史日志数据的离线分析, 离线分析的结果为实时分析提供支持、 参考;Web展示层负责日志数据及其分析结果的展示. 实验结果表明, 系统能有效地解决日志数据的采集存储、 实时日志流数据的实时分析和历史日志数据的离线分析等问题, 并成功地融合了Hadoop与Storm各自的优势, 为日志数据的采集和分析系统的构建提供新的技术参考.
  • 加载中
  • 加载中
计量
  • 文章访问数:  994
  • HTML全文浏览数:  665
  • PDF下载数:  69
  • 施引文献:  0
出版历程

基于Hadoop与Storm的日志实时处理系统研究

  • 西南大学计算机与信息科学学院,重庆,400715 ; 西南大学计算机与信息科学学院, 重庆 400715;重庆市数字农业重点实验室, 重庆 400716

摘要: 日志数据记录着丰富的信息, 具有较高的实用价值, 但在当今大数据时代环境下, 数据量的陡增为日志数据的处理带来了挑战. 为了有效地解决海量日志数据处理面临的瓶颈问题, 本文整合Hadoop和Storm分布式框架, 构建一种融合了实时计算与离线计算的分布式日志实时处理系统. 系统架构由数据服务层、 业务逻辑层和Web展示层组成, 数据服务层使用Flume实时采集日志数据, 并分别采用Kafka与HBase完成实时日志流数据的缓冲和系统数据的持久化存储;业务逻辑层利用Storm对实时日志流数据进行实时分析, 并使用Hadoop的计算引擎MapReduce结合数据挖掘技术完成对海量历史日志数据的离线分析, 离线分析的结果为实时分析提供支持、 参考;Web展示层负责日志数据及其分析结果的展示. 实验结果表明, 系统能有效地解决日志数据的采集存储、 实时日志流数据的实时分析和历史日志数据的离线分析等问题, 并成功地融合了Hadoop与Storm各自的优势, 为日志数据的采集和分析系统的构建提供新的技术参考.

English Abstract

参考文献 (0)

目录

/

返回文章
返回