当前位置:首页 > 王雪迎 >

王雪迎:Hadoop数据仓库实践

  • 2022年03月28日
  • 50 金币

下载完整pdf文档

试想一下,对于采用传统数据仓库的企业而言,大数据带来的机会就是能够利用过去无法通过传统仓库架构利用的数据, 但传统数据仓库为什么不能承担起这个责任?原因是多方面的。首先,数据仓库的传统架构方式采用业务系统中的结构化数 据,用它们来分析有关业务的方方面面,对这些数据进行清理、建模、分布、治理和维护,以便执行历史分析。无论是从结构 方面考虑,还是从数据摄取速率方面考虑,我们在数据仓库中存储的数据都是可预测的。相比之下,大数据是不可预测的。大 数据的结构多种多样,对于EDW来说数量过于庞大。尤其要考虑的是,我们更习惯于浏览大量数据来查找真正需要的信息。 不久之后可能又会决定丢弃这些数据,在某些情况下,这些数据的保存期限可能会更短。如果我们决定保留所有这些数据,则 需要使用比EDW更经济的解决方案来存储非结构化数据,以便将来使用这些数据进行历史分析,这也是将Hadoop与数据仓库 结合使用的另一个论据。

下载完整pdf文档

  • 关注微信

猜你喜欢