虽然数据科学计划确实可以为企业带来诸多好处,但重要的是要记住,这些项目不是故障安全的。当结果不如预期时,公司就会被浪费时间、金钱和资源。更糟糕的是,有缺陷的数据科学计划可能导致领导层对未来项目失去信心。

鉴于这些因素,认识到常见的数据科学项目失败并采取措施避免它们是至关重要的。最近的首席信息官文章Bob Violino概述了数据科学项目可能失败的一些原因,包括:

数据质量差

如果一家公司在数据科学项目中使用了不干净的数据,那么模型将被扭曲,输出将被关闭,而洞察将无助于推动业务向前发展。换句话说,在不确保数据质量的情况下开展数据科学活动完全是浪费时间。特别是对于大型企业,解决数据质量问题通常涉及评估整个基础架构并解决与遗留系统的不兼容性问题。

手头的问题不清楚

如果团队成员不理解他们试图解决的业务问题,那么数据科学项目就不太可能成功。从一开始就分配时间来定义问题及其范围,并确定解决问题所需数据的正确来源,这一点很重要。

缺乏相关数据

如上所述,如果您没有特定问题所需的正确数据,那么您的项目从一开始就注定失败。许多公司的经营假设是,大数据将带来巨大的洞察力,但通常情况并非如此。相反,智能、定制的数据集在生成健壮、可概括的模型方面往往更为有效。

缺乏数据透明度

数据项目失败的另一个常见原因是缺乏数据透明度。毕竟,如果人们不相信模型或不理解解决方案,他们就不太可能相信结果。维奥利诺与之交谈的专家强调,数据领导者必须能够“展示数学”,交流数据的来源,以及他们如何计算模型,非技术利益相关者很容易理解。

行政冠军缺席

为了确保数据科学项目获得足够的资源和支持,他们需要在C-suite中拥有一名冠军。理想情况下,这应该是首席信息官,他除了倡导数据科学投资外,还应该负责确保公司最大限度地利用其获取的信息。有关这些以及数据科学项目失败的其他常见原因的更多信息,您可以阅读首席信息官全文.

有关如何充分利用数据科学投资的更多信息,请查看前一页创新岗位顶点.