ag88环亚娱乐-环亚娱乐ag88手机版【注册】

热门关键词: ag88环亚娱乐,环亚娱乐ag88手机版

ag集团官网:数据湖保留所无数据布局、半布局和

2018-10-24 21:19 来源:未知

  数据科学家凡是是在数据湖中拜候数据的人,由于他们有进行深切阐发的技术。从手艺上讲,数据湖能够支撑所有用户,并对所有用户开放。数据库由特定的营业用户利用,用于从数据库成立时定义的数据中演讲和提取特定寄义;对于需要逾越仓库鸿沟从数据中收集新阐发的数据科学家来说,它们凡是过分严酷。

  数据湖以非布局化的体例保留数据,在单个数据块之间没有条理布局或组织。它以最原始的形式保留数据,不进行处置或阐发。此外,数据湖接管并保留来自所无数据源的所无数据,支撑所无数据类型和模式(数据存储在数据库中的体例)仅在数据预备利用时使用。

  若是你把数据仓库想象成储存瓶装水的仓库--颠末清洗、包装,布局简单,便于消费--数据湖是一个更天然的洪流体。数据湖的内容从一个来历流入来填满湖,ag集团官网湖的各类用户能够来查抄,潜水,ag集团官网ag集团官网或取样。

  数据湖和数据库是用于分歧目标的分歧东西。若是您曾经成立了数据库,那么您可能会选择在它旁边实现一个数据湖,以处理您在数据仓库中碰到的一些束缚。要确定命据湖或数据库能否最适合您的需求,您该当从您试图实现的方针起头,并利用协助您实现方针的数据存储库。

  因为数数据湖缺乏布局,因而对模子和查询进行更改相对容易。数据湖愈加矫捷,能够按照需要对数据湖进行设置装备摆设和从头设置装备摆设。因为与数据库相联系关系的营业流程数量多,因而更改数据库的布局要麻烦得多,耗时也长。

  有些人错误地认为数据湖只是数据库的2。0版本。虽然它们类似,但它们是分歧的东西,该当用于分歧的目标。James Dixon是Pentaho的首席手艺官,他定名了数据湖的概念。ag集团官网他用了下面的比方!

  数据库以一种有组织的体例存储数据,所无数据都以一种定义的体例存档和排序。在开辟数据仓库时,在阐发数据源和理解营业流程的初始阶段会进行大量工作。对于要从仓库中包含息争除哪些数据,需要做出决策。只要在标识了数据的利用之后,数据才被加载到仓库中。

  若是你与大数据有一丝关系,你就会晓得,为每秒生成的数据量找到存储处理方案是至关主要的。当涉及到办理数据时,数据专业人员能够考虑利用数据仓库或数据湖作为数据存储库。为了确定什么对您的组织最有益,让我们起首定义它们是什么,然后比力它们。

  数据湖保留所无数据布局、半布局和非布局/原始数据。数据湖中的一些数据可能永久不会被利用。数据湖也保留着所有的数据。数据仓库只包含颠末处置(布局化)的数据,而且只包含演讲或回覆特定营业问题所需的数据。

TAG标签:
版权声明:转载须经版权人书面授权并注明来源