您的数据湖是否已经从原始的、清澈的水域变成了浑浊的、泥泞的沼泽?你不是一个人。在Gartner最近举行的数据分析峰会美洲会议上,分析师唐纳德·范伯格强调,许多公司现在发现自己处于这种情况下,努力拯救他们的数据湖。幸运的是,正如他详述的那样最近的这篇文章来自Datanami,他有一个救生员抛弃它们。

FEINBERG提供了一些用于清理他们的数据湖泊的提示:

避免巨大的实施项目

许多公司在早期就陷入了“数据湖”的困境,因为他们致力于一个长期项目,并将所有东西都投入到一个大数据湖中。一个更好的方法是从小处着手,最好是为单个业务单元实现一个数据湖。当然,重要的是要记住,这些小数据湖是更大的图景的组成部分,最终可能需要多个数据湖。但范伯格认为,让它们保持小规模和独立,至少在开始时,比尝试大规模的数据湖项目更有可能成功。

不要将拥有数据湖等同于拥有数据和分析策略

数据湖可能是更大的数据和分析策略的组成部分,但它本身并不是一种策略。据范伯格说,许多公司经常会陷入将两者混为一谈的陷阱,这导致混淆,并可能阻碍数据湖项目的成功。

关注业务价值

另一个重要的考虑因素是确保数据湖泊项目的预期业务价值总是最重要的。毕竟,如果您无法识别数据湖将为组织带来的实际业务价值,那么您在错误的湖泊中捕鱼就有很好的机会。

没有所谓的无限数据湖

由于数据湖的灵活性,公司倾向于存储由不同格式和来源组成的各种数据。Feinberg对这种“无限数据湖”的心态提出了警告,因为它经常导致严重的治理问题。

解决技能不足

范伯格认为,要避免数据湖失败,企业可以做的最重要的事情之一就是缩小人才缺口。找到并磨练正确的技能,将使组织能够从浑浊的水域中脱颖而出,并确定工具和技术,确保一旦清理干净,他们的数据湖永远不会再次变成沼泽。

想了解更多以上内容和范伯格的建议,请阅读全文Datanami文章