跳至主要內容

数据湖介绍

张启忻大约 1 分钟datalakebigdata

数据湖是什么

数据湖可存储结构化和非结构化数据,是一种面向大规模、多来源、高度多样化数据的组织方法。 如今,数据湖越来越重要,尤其是对于业务用户和技术用户。他们希望开展广泛数据探索和数据发现,而将数据(或者大部分数据)整合到一个位置可以简化这一过程。 数据湖可极大简化数据探索和发现。它支持多种数据结构,例如非结构化数据和多结构化数据,能够帮助用户发挥数据的真正价值。

数据湖和数仓的区别

数据湖与数据仓库的主要区别在于数据湖可以非常快速地摄取数据,然后在用户访问时动态准备数据。
而对于数据仓库,用户首先要正确进行数据准备,然后才能将数据置入数据仓库。

数据湖的未来:数据湖仓一体

在挖掘更多数据价值的旅程中,企业不断拓展边界。在云计算的帮助下,企业常常将数据湖技术与数据仓库整合到一个架构中,即“湖仓一体”。 湖仓一体可带来更多优势,例如更紧密的集成、更少的数据移动、更出色的数据治理,以及支持更多使用场景。