• ETL(Extract/Transform/Loading,抽取/转换/加载):用户从数据源抽取所需的数据,经过数据清洗、转换,最终按照预告定义好的数据仓库模型将数据加载到数据仓库中去。
  • 元数据:是关于数据的数据。指在数据仓库建设过程中所产生的有关数据源的定义、目标定义、转换规则等相关的关键数据。同时元数据还包含关于数据含义的商业信息。典型的元数据包括:数据仓库表的结构、数据仓库表的属性、数据仓库的源数据(记录系统)、从记录系统到数据仓库的映射、数据模型的规格说明、抽取日志和访问数据的公用例行程序等。
  • 粒度:数据仓库的数据单位中保存数据的细化或综合程度的级别。细化程度超高,粒度级就越小;相反,细化程度越低,粒度级就越大。
  • 分割:相同结构的数据被分成多个数据物理单元。任何给定的数据单元属于且仅属于一个分割。
  • 数据集市:小型的面向部门或工作组级数据仓库。
  • ODS(Operation Data Store,操作数据存储):能支持企业日常全局的数据集合,是不同于DB的一种新的数据环境,是DW扩展后得到的一年混合形式。四个基本特点:面向主题的、集成的、可变的、当前的或接近当前的。

        数据源是数据仓库系统的基础。数据仓库的真正关键是数据的存储与管理。