当前,数据科学领域中有三个顶级角色,分别是数据分析师,机器学习工程师和数据工程师。
这些角色中最著名的是数据分析师。数据分析师的角色具有学术渊源;因此,许多数据分析师具有扎实的数学和统计学技能,并且许多人将具有高级学位。他们具有商业头脑和分析能力,以及挖掘,清理和显示数据的能力。
但是,它们通常在许多现实世界的技能(例如数据源和编程)中较弱。我相信这种弱点将导致应用领域中数据科学的角色急剧缩减。
第二个角色是机器学习工程师。数据分析师使用编程语言来完成机器学习过程。在应用空间中处理数据的默认语言是SQL,它通常是公司在其机器学习工程师中寻求的最重要技能之一。机器学习工程师建立可以做出预测的模型。在应用领域中经常使用的两种编程语言是Python和R。机器学习工程师通常将负责性能,优化和协助将最终模型部署到生产中。机器学习工程师的弱点通常是统计和数学。
第三个角色是数据工程师。数据工程师以各种格式管理大量变化的数据。大多数公司都有结构化数据,例如关系数据库中的数据和非结构化数据,例如位于文件系统上的文本文件。数据工程师专注于数据管道和基础架构的开发,部署,管理和优化。数据工程师关注数据及其附带的所有内容的生产就绪性:格式,可伸缩性,弹性和安全性。从技能的角度来看,数据工程师将熟悉操作系统,SQL,大数据技术,存储系统和数据提取工具。他们通常是公司的数据管理员。
数据分析师经常将其中一个角色与混淆,即数据分析师的角色。
在应用空间中,数据分析师是使用SQL或其他第三方工具创建报告的人员。通常,此角色位于信息技术之外。
成为数据分析师所需的技术技能范围与数据科学,机器学习或数据工程所需的技能范围不同。但是,数据分析师角色为您提供了开始信息技术之旅所需的SQL技能。对于许多机器学习新手来说,最难的部分将是确保他们的第一个IT角色。机器学习工程师和数据工程师是技术含量很高的角色,需要大量的知识和技能。
本回答被网友采纳