Home Blog Book Learning About Me Non-technical Buy me a coffee

如何区分数据科学的不同职位?

我的分享对你有用吗?请我喝杯咖啡?

Buy me a coffeeBuy me a coffee

近年来数据科学的职位名称越来越多,比如说,数据构架师,数据工程师,定量分析师,数据科学家,研究科学家等等。是不是特别晕 😵?很多公司内部和数据相关的从业人员自己都觉得晕,身份危机普遍存在,而且可能会持续很长的时间。不仅仅是同一个公司不同的职位名称让人晕,同一个职位名称不同公司可能做的东西也不同😵,比如科技公司的数据分析师或者数据科学家和传统企业的数据分析师和科学家做的东西可能就很不一样。

那我们该如何区分这些职业名称,做出好的职业选择呢?上一讲我们说过数据科学是什么很难用一两句话去定义,最好去看看数据科学的从业人员都在做些什么。这里也一样,我建议大家不要太过在意职位的名称,而是把重心放在职位每天要做的事情,以及所需要的技能上。

这个表格显示了职位描述中的一些数据科学角色和常见技术关键词。这里的只是一般性的总结,不同公司不同部门要求可能会不一样。这里主要是希望给大家提供一个框架。可以看到sql是很多角色都需要的基本技能。

这些角色在以下关键方面有所不同:

数据构架师和数据工程师主要在数据工程的轨道,负责建设数据管道基础设施,他们通常是硬核的工程师,对商业知识的要求低,对工程技能要求高,处理频次比较高的数据。

BI工程师和数据分析师都和商业很近,需要将数据用更直观的方式展现,给出商业洞见,所以他们通常都是SQL的高手。不同的是,BI工程师着眼于自动化数据报表。数据分析师可能会通过做分析报告的方式给出洞见。但不是所有公司都区分这两个职位,有的科技公司有自己成熟的自动化报表系统,报表也是数据分析师生成的。

数据科学家这个职位是定义最不清晰的,因为由于数据科学家这个职位的流行,很多公司为了吸引分析人才直接把相关的职位名称都改成数据科学家,而没有考虑不同职位做的事情。一般说来,数据科学家和数据分析师之间最大的不同就是对数学和统计的要求,以及是否会需要用一些模型去深入研究数据,发现不容易看到的模式,或者做因果推断。

研究科学家通常有博士学位,有学术研究的背景。他们会做更加严格的数据分析,或者研究新的模型,他们也会去学术会议,发表论文。通常只有大公司有这样的职位。

有的公司为了加速模型从开发到部署的过程,创造出了应用科学家这一职位。应用科学家通常有一定的建模基础,同时有很好的软件工程技能,这样的技能组合让他们能够有效的理解研究科学家研发的模型,用高质量可部署的代码实现模型,这样一来数据工程师能够很容易将应用科学家的代码嵌入数据链中。

机器学习工程师和应用科学家有些类似,但是主要着眼于机器学习模型,他可以优化科学家的代码,并使它更有效和可扩展。他还能加入可能无关任务的结果,以进一步优化模型在部署环境中的性能。这个职位需要在机器学习和软件工程这两个领域都是专家的人。

这里只是对不同的职位按照一般情况分类,如前所述,相同职位的名称在不同公司做的事情也可能不同,所以最好的方式就是认真读工作描述,或者在面试的时候问问猎头或者面试官,这个职位日常的工作是什么,都和什么人合作。希望大家都能找到合适的职位!

Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 3.0 Unported License.