一个数据科学家的背景下,人工智能和机器学习的工作是什么?很多每天和这类项目打交道的专业人士都会说这个问题很难回答。更好的问题是:数据科学家不做什么?
科学家是AI或ML过程中不可或缺的一部分,因为所有这些项目都依赖于大数据或复杂的输入。数据科学家是基本的野心家,他们知道如何处理数据以产生结果。
但是,有一些方法可以讨论数据科学家的角色,他或她需要什么资格,以及他或她在这个过程中扮演的角色。
阅读:通过在线学习可以掌握的6个关键数据科学概念
各种定义,各种责任
许多描述数据科学家工作的专家说得很宽泛。
“在小公司或新市场工作时,数据科学家的角色是将相对新颖(但显而易见)的数据源转化为解决最终用户问题的东西,这在以前是不可能的,所用的技术也不存在,”Mercury Global Partners的客户经理安东尼奥希克斯(Antonio Hicks)说。"理想的候选人一半是数学家,一半是软件工程师,一半是企业家."
其他人回应了这一基本思想,并提到科学家需要解决建模项目的数据。
数据科学家经理Erin Akinci表示:“数据科学家需要的最重要的属性是他们对周围世界的深刻好奇心——无论他们是回答问题还是建立模型,理解面前问题的愿望是关键。在阿萨纳。“从那里,大多数人需要数学和编程方面的技能来找到解决方案,但数学和编程的具体类型根据数据科学领域的专业知识而有所不同。”
“优秀的科学工作更多地与科学家思考问题的方式有关,而不是他们用来解决问题的工具,”瓦尔基里智能公司的创始人兼首席执行官查理伯格因补充道。瓦尔基里是一家应用科学咨询公司,有令人印象深刻的项目,如Mark I,这是一种专门的网络设备,可以促进神经网络训练和测试,提高以前基于云的机器学习平台的可能性。
“市场需要精通Python开发、神经网络设计以及将数据存储库重塑为最新数据库架构的能力的科学家,”Burgoyne说。“然而,这些能力是天才科学家的赌注。不太明显的是科学家强烈的好奇心、积极的智力和坚持科学方法的能力。"
数据科学家的技能
所以,就实际技能而言,数据科学家在建模方面需要一定的创造力和精明。他们也可以从“硬技能”中受益匪浅,比如应用于ML项目的Python、C或其他常用语言的经验编码。
“Python和C对于将编码技能与数据分析和处理结合起来至关重要,而统计学是让数据科学家成为强有力的候选人或员工的核心技能,”在线模拟面试平台Pramp的Val Streif说。对于软件工程师、开发人员和数据部门“虽然一些编程技能可以通过将数据科学家和开发人员配对来解决,但如果从公司的角度来看,这两种技能结合起来会更容易。”
其他专家已经在列表中添加了R、Hadoop、Spark、Sas和Java以及Tableau、Hive和MATLAB等技术。
这些都是令人印象深刻的简历,但一些有招聘数据科学家经验的人表示,其他“人”的方面也很重要。
“传统上,受过多元化文科教育的人可以成为优秀的数据科学家,”伯格因说。他们区分建筑工程师和数据科学家,他们的工作可能更概念化。他继续说道:
传统STEM领域的专业知识与人文、艺术或商业领域的互补关注,造就了那些成为优秀行业导向型科学家的人的素质。必须指出的是,组织使用这些品质并以富有成效的方式塑造他们的热情和方法的能力同样重要。我观察过,当数据科学计划不成功时,组织可能和科学家一样有罪。科学家不是工程师。他们不会被驱使去执行和建造。他们被驱使去发现和理解。掌握了这种差异的组织,就可以很好地耕耘这两个领域。
至于科学家平时应用的数据,和公司的核心目标有关系。有些公司在追逐去中心化的互联网——有些公司在玩物联网或SaaS。其他人正试图开创“用户友好”或“道德”或“透明”的人工智能。
无论如何,数据科学家可能正在弥合他们使用的数据的硬度(无论他们在哪个技术堆栈中)与概念化AI/ML功能的自由工作之间的差距。
“我们雇佣数据科学家来管理数据收集和清理,并将这些数据转化为有意义的信息,”G2 Crowd的数据科学和分析经理Michael Hupp说。他详细解释道:
通常,这意味着管理驱动公司数据引擎的任何重要算法,并熟练掌握关键分析工具和语言,但近年来还包括自然语言处理、机器学习和其他形式的人工智能支持的分析等新兴领域。最成功的数据科学家是那些将他们的硬技能与快速学习的能力相结合的人,以及有效传达他们所发现的见解的能力,以便他们能够对自己的业务有意义。
通过这些类型的见解,年轻的专业人士或学生可以更容易地确定数据科学家是否适合他们,以及如何获得技能。STEM学习在全国各地的学校越来越容易,但对编码和技术的热情以及即时学习的能力是无法替代的。
标签:
免责声明:本文由用户上传,如有侵权请联系删除!