早在 2009 年 1 月,Google 首席经济学家 Hal Varian 就曾断言,“能够获取数据 —— 能够理解数据 —— 处理数据,从中提取价值,可视化并传达信息,这将成为未来几十年非常重要的技能……因为现在我们确实拥有基本上是免费和无处不在的数据。”
时下, 数据科学(Data Science)无疑是出国留学申请最为火热的专业之一,随着赴美国留学读Data Science的学生越来越多,美国数据科学专业申请竞争也日趋激烈。那么数据科学是什么?学什么?就业如何呢?小星为你一一道来
1、内容大纲
- 什么是数据科学
- 数据科学的核心技能
- 数据科学学什么
- 数据科学就业如何
- 美研数据科学申请要求
- 数据科学选校推荐
2、什么是数据科学
2003年,《数据科学杂志》曾提出:“所谓的‘数据科学’,指的是那些任何与数据相关的内容”。对此,我表示赞同,现在一切都无法与数据分割。
从最基本的角度来看,数据科学可以被定义为从数据中获得任何有价值的东西。在现实中,数据科学发展如此迅速,而且呈现出巨大可能性,因此一个更广泛的定义对于理解它是至关重要的。
如何从数据中获得有价值的东西呢?不管是用统计学,还是用机器学习;不管是做数据分析,还是做数据挖掘,都有可能达成这个目标。因此,具体问题需要具体分析。简而言之,针对具体的问题,从业务-数据-特征-算法-应用这些角度切入,做出对的思考和行动。
3、数据科学的核心技能
我之前听过一位斯坦福学长的课程,下图是他提到的数据科学需要具备的技能,总结来说就是数理能力、数据分析能力、软素质、沟通表达和可视化的能力。

总结来说:
--要有独立从各种各样的地方把数据化为己用的能力;
你就会用到SQL、Programming、Hadoop/parallel processing、Machine Learning、Data Mining、Modeling等等。
--你不光要理解what users say they want,你还需要真正的理解what they actually mean;
--数据科学家会跟公司的很多不同部门的人打交道,会比码农跟更有机会见到高层或者是 business领域的人,你需要知道区分什么是问题本质、什么是技术细节,要有能力给上层领导讲high level的分析和推荐,有能力给同事讲解和defend你的技术细节。
4、数据科学学什么?
了解了数据科学家需要具备的能力之后,数据科学学什么也就更加显而易见了。
以下是纽大数据科学的课程

数学方面有:数据科学入门;概率统计;机器学习与计算统计;大数据这些课程
计算机方面有:自然语言处理与表示论;自然语言理解与计算语义;推断与表示;深度学习;文本分析;自然语言处理等等。
5、数据科学就业如何?
美国企业与高等教育论坛(BHEF)与普华永道(PWC)近期发布重要报告称:
“数据分析的人才需求每年都在增长,而每年的高校毕业生数量远远无法满足行业需求。” 报告显示:只有23%的教育者认为毕业生会有数据分析技能,但69%的雇主都希望求职者真正具备数据分析技能。
在 Glassdoor 2019年新发布的《50份最佳就业》报告(50 best jobs in America)中,“数据科学家”在各个职业中名列最佳工作,职业满意度高,职缺多,且重要的是:薪水还很高。
著名求职网站 Indeed 今年 2 月的最新统计数据透露,全美平均数据科学家的平均年薪为 12 万 7981 美元,像科技巨头如 Facebook 等,薪资则会更高。

但是,尽管有这么高的评价与薪资,数据分析领域还是很缺人!
2018 年 8 月 Linkedin 发布的劳动力报告显示,全美有超过 151,000 个数据科学家工作空缺,所有主要城市都出现短缺。其中,纽约、旧金山和洛杉矶出现“急剧”短缺。“数据科学家”的职位自2013年12月以来“飙升了344%”,职缺的速度甚至大于“软件工程师”。
按照官方说法,美国劳工统计局甚至预测,到 2024 年,该领域的工作岗位将增加 11 个百分点。
6、美国数据科学申请要求?
美研申请一方面考察学生的学校,绩点,语言成绩,专业背景,另一方面会比较看重软性背景,也就是相关实习和项目经历。
专业背景方面,数学/统计或CS为佳,物理,经济学等强调数学能力的专业次之,其他理工专业再次之。转专业申请者,建议修过相关数学课程,如线性代数,概率论,数理统计,微积分等;计算机方面建议修过CS相关课程,如编程语言Python、R、Java、C++等。
以下是哥大DS项目官网的申请要求:
---哥伦比亚大学的MS in Data Science 项目处于美国数据科学硕士申请难度的第一梯队。该项目为期1年,学生共需修读30个学分,无需撰写毕业论文。
---该项目要求申请者拥有一定的数学及编程基础,最好学过微积分、线性代数、计算机编程等课程,没有强制性的工作经验要求,有的话也会为申请者加分。
---需要递交GRE成绩,托福100、雅思7.0,不可使用GMAT代替GRE成绩。
7、美国数据科学选校推荐
哈佛大学
MS Data Science 1年
专业背景:自然科学,数学,或工程专业学士学位
不接受GMAT代替GRE,不接受IELTS代替TOEFL
哥伦比亚大学
MS in Data Science 2年
专业背景:定量课程 (微积分,线性代数等);计算机编程
斯坦福大学
M.S. in Statistics: Data Science 5 Quarters(1年3个Quarters)
专业背景:较强的数学和计算机背景
不接受GMAT代替GRE,不接受IELTS代替TOEFL
杜克大学
Master in Interdisciplinary Data Science (MIDS) 2年
每年大约招收25-35个学生
布朗大学
Master's in Data Science
专业背景:先修课要求为1年的微积分,1学期的线性代数,1学期的概率与统计
乔治城大学
Master of Science in Data Science for Public Policy 2年
南加州大学
Master of Science in Computer Science (Data Science)
专业背景:工程学、数学或硬科学。
不接受GMAT代替GRE
卡耐基梅隆大学
MSPPM Data Analytics track 1.5年
业背景:较强的数学基础,有先修课要求
纽约大学
MS in Data Science 2年
专业背景:在数学、计算机科学和应用统计学方面有很强的背景。
不接受GMAT代替GRE
罗彻斯特大学
MS in Data Science 2学期
专业背景:科学、工程、数学或商业
数据科学(DS)
简单定义为:数据科学是从数据中提取有用知识的一系列技能和技术。
这些技能通常用德鲁·康威(Drew Conway)创造的维恩图(或它的变体)来表示:

三个圆圈分别代表三个不同的领域:编程领域(语言知识、语言库、设计模式、体系结构等);数学(代数、微积分等)和统计学领域;数据领域(特定领域的知识:医疗、金融、工业等)。
这些领域共同构成了定义中的技能和技术。它们包括获取数据、数据清理、数据分析、创建假设、算法、机器学习、优化、结果可视化等等。
数据科学汇集了这些领域和技能,支持和改进了从原始数据中提取见解和知识的过程。

什么是“有用的知识”?就是可以具有某种价值、可以解答或解决现实世界中问题的知识。
数据科学也可以定义为:研究应用数据处理和分析方面的进展,为我们提供解决方法和答案的领域。

版权声明:本文来自用户投稿,不代表【闪电鸟】立场,本平台所发表的文章、图片属于原权利人所有,因客观原因,或会存在不当使用的情况,非恶意侵犯原权利人相关权益,敬请相关权利人谅解并与我们联系(邮箱:dandanxi6@qq.com)我们将及时处理,共同维护良好的网络创作环境。