正如我们之前所写的创新顶点职位在美国,数据科学项目失败的主要原因是计划不周和对当前问题缺乏清晰认识。这些错误和其他错误可能需要几周或几个月的时间才能正确解决,从而限制了该计划的成功,并削弱了利益相关者对数据科学的整体信心。

为了避免这种情况,考虑以下提示来改进您的数据科学工作流:

1.设定正确的目标

机器学习算法擅长识别最佳解决方案,但它们不能确定你的公司是否在正确的时间最大化正确的东西。公司的优先事项和价值观随着公司的发展和变化而变化,确保你的目标职能反映了这些目标是很重要的。花点时间定期检查并做出必要的调整有助于确保您针对正确的问题进行了优化,并避免今后的头痛问题。

2.达成共识

另一个需要考虑的问题是,花时间以商业领袖容易理解的方式展示见解,以便他们花更少的时间翻译数据,花更多的时间实现数据。考虑以下句子之间的差异:“我们看到在10万个例子的测试集中准确率提高了100点,”与“如果我们有这些改进,我们将在上个季度节省2万美元。”只要有可能,用更贴近底线影响的短语代替技术行话。

3.为发现留出空间

数据科学中最大的突破往往来自于对新方法和机遇的探索。给数据科学家时间来尝试新的方法和研究不同的角度,可以带来新的功能、更好的模型和更快的结果时间。

4.与你的消费者对话

如果你不了解你的终端用户和他们想要解决的问题,就不可能建立一个有效的模型。因此,在投入时间设计模型之前,务必与用户进行交流,了解他们的关键痛点。

5.最优解往往是次最优的

高度优化的解决方案通常需要更高的实现和维护成本,而且往往缺乏灵活性。此外,优化的解决方案只有在目标函数完全准确且不太可能改变的情况下才会优化。正如上面所讨论的,考虑到业务发展的速度,这通常不是情况,这就是为什么尽可能构建更简单的解决方案通常是“最佳”选择。

VentureBeat有关上述考虑事项的更多信息。