什么是数据湖

数据湖(Data Lake)是一个集中式存储库,一个以原生格式存储各种大规模原始数据集的数据库,它允许以任何规模存储所有结构化和非结构化数据 。数据湖的概念最初是由大数据厂商提出的 。从表面上看,数据被加载到基于HDFS的廉价存储硬件上,这些硬件可以扩展 。
什么是数据湖?

什么是数据湖


数据湖的价值一部分是将不同种类的数据聚集在一起,另一部分是在没有预定义模型的情况下分析数据 。
在商业智能和数据仓库尚未被淘汰的今天,大数据分析和大数据湖正在向更多类型的实时智能服务发展,这些服务可以支持实时决策 。
【什么是数据湖】使用数据湖可以在更短的时间内利用更多来源的更多数据,使用户能够以不同的方式协同处理和分析数据,从而做出更好更快的决策 。

    推荐阅读