世界上已经存在令人难以置信的数据,它只继续增长。IDC预测全球创建的数字数据总量将在未来四年内升起163个Zettabytes。为了挖掘这种大量信息,以满足关键洞察力的信息,公共和私营部门的公司正在批量他们的数据科学投资,并寻找加强其现有团队的方法。

考虑到这一点,Forrester最近发布的一份报告就不足为奇了,“科技执行官在数据科学,机器学习和AI上的入门”,“帮助IT领导跟上潮流。以下是该公司认为你应该了解的关于数据科学的5件最重要的事情:

1.如果它喜欢电影中,那可能不是ai。随着谚语所在,“如果它看起来太好了,可能是。”涉及人工智能(AI),实际上可以履行其承诺的产品具有有限的智力和自主权。这并不是说未来我们不会看到一个非常复杂的好莱坞的机器人,但这肯定不是技术今天的位置。

2.首先要担心人类。算法仅与它提供的数据一样好。因为人类是提供这些信息的人,因为在开发模型时重点关注人员组件很重要。我们写了关于以前的伦理AI担忧188 app 但是,种族和性别等社会问题不是唯一可以影响数据集的偏见。技术领导者必须了解这些问题,请确保适当筛选数据,并看到验证和测试模型。

3.随着时间的推移改善数据。不要推迟开始一个项目直到每个数据元素都是完美的。使用数据集使您能够了解需要哪些信息以及以何种形式提供。同样的建议也可以应用到算法中。

4。选择你可以实际执行和衡量的项目。不要开始任何事情,除非你能说明你想要实现什么,你将使用什么系统和过程来实现它,以及你打算如何衡量你的进展。

5.永远记住用户。你可以拥有最好的数据、最好的算法和最好的系统,但如果用户不知道或不关心使用它,它最终不会对你的业务有多大帮助。让用户从一开始就参与进来,确保为知识型员工设计的工具直观易懂,以加速数据驱动的洞察力。

对于额外的数据科学提示,请看看这一点TechReport文章