当前位置:首页 → 计算机类 → 软件水平考试 → 高级系统规划与管理师->()应用于大数据的数据采集阶段。
( )应用于大数据的数据采集阶段。
大数据涉及的技术有:
(1)HDFS:Hadoop分布式文件系统(HDFS)是适合在通用硬件上的分布式文件系统,能提供高吞吐量的数据访问,非常适合大规模数据集上的应用。
(2)HBse:是一个分布式、面向列的开源数据库,是一个适合于非结构化数据存储的数据库。是基于列的模式。
(3)MapReduce:是一种编程模型,用于大规模数据集的并行运算。
(4)Chukwa:是一个开源的用于监控大型分布式系统的数据收集系统。还包含了一个用于展示、监控和分析已收集的数据的工具集。









