Project Description

  • HDFS:hdoop分布式文件系统(HDFS)能提供高吞吐量的数据访问,非常适合大规模数据集上的应用。
  • HBase不同于一般的关系数据库,它是一个适用于非结构化数据存储的数据库、另外一个是基于列而不是基于行的数据。
  • MapReduce是一种编程模型,概念“map(映射)”和“reduce(规约)”和他们的主要思想都是从函数式编程语言里借来的;
  • chukw是一个开源的利用于监控大型分布式的数据收集系统。