大家好,我是讯享网,大家多多关注。
译者|新月|编辑|吴
以下是翻译:
大学时,我的专业是机械工程师,所以毕业后就进入了钢铁行业。
我每天穿着厚重的钢靴,戴着塑料头盔,在高炉和轧钢厂周围冒险。虽然我们有一定的安全措施,但我知道一旦发生意外,谁也救不了我。跑鞋可能会有帮助,但是头盔,甚至钢铁在1370摄氏度都会变成水。
所以我一直处于恐惧状态,我意识到这份工作不适合我,所以我定了一个目标:2011年进入分析与数据科学领域。从此,大型网络公开课成为我学习新知识的首选。当然,我也参加过很多这样的课程,结果喜忧参半。
2020年,随着数据科学领域的快速变化,我们并不缺少学习数据科学的资源。但是初学者经常会遇到一个问题:应该从哪里开始,应该学什么?网上资源很多,鱼龙混杂。
巴里·施瓦茨曾在《选择的悖论:为什么多就是少》一书中指出,消除消费者的选择可以大大减少购物者的焦虑。数据科学课程也是如此。
所以正文的目的是为你这个迷茫的新手提供建议,为你的数据科学之旅指明方向。
首先,你需要学习一门编程语言。密歇根大学的以下课程解释了如何使用Python和创建自己的应用程序。
Python 3编程专门化:
https://www . coursera . org/specializations/python-3-programming?行动=注册& amprane aid = lvarvwc 5 BD 0 & amp;ranMID = 40328 & ampranSiteID = lvarvwc 5 BD 0-lpz 4 qovnorxvbcwvw 9 krqa & amp;siteID = lvarvwc 5 BD 0-lpz 4 qovnorxvbcwvw 9 krqa & amp;utm _ campaign = lVarvwc5BD0 & amputm_content=2。utm _ medium =合伙人& amputm_source=linkshare
在这门课中,你可以学到编程的基础知识(变量、条件语句、循环语句等。),以及一些中间知识,如关键字参数、列表派生、lambda表达式和类继承。
接下来,我们需要先了解一下机器学习。
密歇根大学以下课程讲解现代机器学习的基础知识。即使你没有掌握所有的知识,你也可以使用这些工具来建立模型。
Python专门化的应用数据科学:https://www . coursera . org/specializations/Data-Science-Python?ranMID = 40328 & amprane aid = lvarvwc 5 BD 0 & amp;ranSiteID = lvarvwc 5 BD 0-5 xcr 9 hs FAO 15 _ 9 pstk . 4 OA & amp;siteID = lvarvwc 5 BD 0-5 xcr 9 hs FAO 15 _ 9 pstk . 4 OA & amp;utm_content=2。utm _ medium =合伙人& amp链接共享。utm_campaign=lVarvwc5BD
本专业课程旨在拥有基本的python或编程背景,希望通过流行的Python工具包(如pandas、matplotlib、scikit-learn、nltk和networkx)应用统计学、机器学习、信息可视化、文本分析和社交网络分析技术,学习更多关于数据的知识。
完成以上课程后,即可顺利入门。
恭喜你!你对数据科学有基本的了解,也知道如何实现。
但是,你还没有完全理解这些模型背后的数学知识。
你需要知道clf.fit背后的细节如果你不知道模型背后的数学知识,那么你就不是数学科学家。
下面是斯坦福大学提供的一门机器学习课程,里面包含了很多机器学习算法背后的数学知识。
机器学习:
https://www.coursera.org/learn/machine-learning?兰米德= 40328 & amprane aid = lvarvwc 5 BD 0 & amp;ranSiteID = lvarvwc 5 BD 0-btd 7 xbdf 681 vkxre 2h _ Oyg & amp;siteID = lvarvwc 5 BD 0-btd 7 xbdf 681 vkxre 2h _ Oyg & amp;utm_content=2。utm _ medium =合伙人& amp链接共享。utm _ campaign = lVarvwc5BD0 & ampsource = post _ page-& amp;ranMID = 40328 & amprane aid = je 6 nubbo bpq & amp;ranSiteID = je 6 nubbobpq-delipy 0 w 03 upl 5 lvg _ ACYw & amp;siteID = je 6 nubbobpq-delipy 0 w 03 upl 5 lvg _ ACYw & amp;utm _ content = 10 & amputm _ medium =合伙人& amp链接共享。utm _ campaign = je6NUbpObpQ
我认为这是一门你必须上的课程,因为它激发了我对这一领域的兴趣,而且吴恩达是一位很棒的讲师。另外,这是我学的第一门课。
这门课程几乎包含了机器学习的所有内容:回归、分类、异常检测、推荐系统、神经网络以及很多优秀的建议。
这门推理统计学的课程是由杜克大学的etinkaya-Rundel教授的。这是最简单的入门课程。
推断统计学:https://www . coursera . org/learn/interestial-Statistics-intro?ranMID = 40328 & amprane aid = lvarvwc 5 BD 0 & amp;ranSiteID = lvarvwc 5 BD 0-yde VG 6k 5 kidzltnqbbvqvq & amp;siteID = lvarvwc 5 BD 0-yde VG 6k 5 kidzltnqbbvqvq & amp;utm_content=2。utm _ medium =合伙人& amp链接共享。utm_campaign=lVarvwc5BD0
etinkaya-Rundel是一位出色的讲师。她把统计推断的基础知识讲解的很好,这也是必修课。
在本课程中,您将学习假设检验、置信区间以及数字和分类数据的统计推断方法。
虽然创建模型,提出不同的假设是一种成就感,但是对数据的处理也不容小觑。
在ETL和数据准备任务中,SQL无处不在,所以基本的SQL知识大家都要知道。
此外,SQL已经成为Apache Spark等大数据工具的标准。下面在加州大学戴维斯分校的课程会教你SQL的专业知识,以及如何使用SQL进行分布式计算。
了解数据科学专业的SQL基础知识:
https://www . coursera . org/specializations/learn-SQL-basics-data-science?ranMID = 40328 & amprane aid = lvarvwc 5 BD 0 & amp;ranSiteID = lvarvwc 5 BD 0-mbezdihx 4 txzezrykss 6 xq & amp;siteID = lvarvwc 5 BD 0-mbezdihx 4 txzezrykss 6 xq & amp;utm_content=2。utm _ medium =合伙人& amp链接共享。utm_campaign=lVarvwc5BD0
课程介绍:通过四个数据科学应用难度递增的SQL项目,学习SQL的基础知识,数据排序,SQL分析,AB测试,使用Apache Spark的分布式计算等课题。
上面我们学的知识很简单(大家可能有不同看法),学习资料都是现成的,用到的数学知识非常有限。但是这些知识可以为下一步打下良好的基础。以下是由顶级Kaggle机器学习从业者和CERN科学家讲授的高级机器学习课程。它讲述了很多非常难的概念,可以带领你了解机器过去的工作方式,以及机器学习世界的最新发展。
高级机器学习专业化:
https://www.coursera.org/specializations/aml?兰米德= 40328 & amprane aid = lvarvwc 5 BD 0 & amp;ranSiteID = lvarvwc 5 BD 0-HW tri 7 XT 6 lsows 0g 2 lgnca & amp;siteID = lvarvwc 5 BD 0-HW tri 7 XT 6 lsows 0g 2 lgnca & amp;utm_content=2。utm _ medium =合伙人& amp链接共享。utm_campaign=lVarvwc5BD0
课程介绍:本课程介绍深度学习、强化学习、自然语言理解、计算机视觉和贝叶斯方法。顶级Kaggle机器学习从业者和CERN科学家将在课程中分享他们解决真实问题的经验,帮助你填补理论和实践之间的空鸿沟。
下面的深度学习课程含金量非常高。
深度学习专业化:
https://www.coursera.org/specializations/deep-learning?兰米德= 40328 & amprane aid = lvarvwc 5 BD 0 & amp;ranSiteID = lvarvwc 5 BD 0-m3 sbadpjeg 1 z 1 rwvng 39 OQ & amp;siteID = lvarvwc 5 BD 0-m3 sbadpjeg 1 z 1 rwvng 39 OQ & amp;utm_content=2。utm _ medium =合伙人& amp链接共享。utm_campaign=lVarvwc5BD0
讲师吴恩达用非常简单易懂的方式解释了非常难的概念。
课程介绍:了解深度学习的基础知识,如何构建神经网络,学习如何带领机器学习项目走向成功。您将了解卷积网络、递归神经网络(RNN)、长期和短期记忆网络(LSTM)、Adam、Dropout、批量标准化、Xavier/He初始化等等。此外,您将深入到医疗保健、自动驾驶、手语阅读、音乐生成和自然语言处理等案例研究中。
我平时从不提倡学习工具,但在这里推荐Pytorch。原因是不可思议,非常重要。如果你想了解Pytorch,你需要阅读最近许多研究论文中的代码。对于深度学习领域的研究人员来说,Pytorch已经成为默认的编程语言,这将使我们受益匪浅。
IBM提供的课程-使用Pytorch的深度神经网络:
https://www . coursera . org/learn/deep-neural-networks-with-py torch?ranMID = 40328 & amprane aid = lvarvwc 5 BD 0 & amp;ranSiteID = lvarvwc 5 BD 0-qsetzsahs 03 w9 yvhnwt _ QA & amp;siteID = lvarvwc 5 BD 0-qsetzsahs 03 w9 yvnwt _ QA & amp;utm_content=2。utm _ medium =合伙人& amp链接共享。utm_campaign=lVarvwc5BD0
课程介绍:本课程将首先介绍Pytorch张量和自动微分软件包。每章将涵盖不同的模型,从线性回归、logistic回归/softmax回归等基础知识开始。其次,前馈深度神经网络,不同的激活函数,标准化和辍学层的作用。然后将介绍卷积神经网络和迁移学习。最后,将介绍其他几种深度学习方法。
构建一个优秀的机器学习系统需要考虑很多因素。但是作为数据科学家,我们通常只担心项目的某些部分。
但是,我们有没有考虑过模型建立后如何部署?
我见过很多机器学习的项目,但是很多都是注定要失败的,因为这些项目从一开始就没有生产计划。在现实世界中,拥有一个好的平台并知道如何部署机器学习应用程序是至关重要的。以下AWS课程介绍如何使用AWS实现机器学习应用。
AWS机器学习入门:
https://www.coursera.org/learn/aws-machine-learning?兰米德= 40328 & amprane aid = lvarvwc 5 BD 0 & amp;ranSiteID=lVarvwc5BD0-Kfb17yr。B2kcW5gmdqpYjw & ampsiteID=lVarvwc5BD0-Kfb17yr。B2kcW5gmdqpYjw & amputm_content=2。utm _ medium =合伙人& amp链接共享。utm_campaign=lVarvwc5BD0
在本课程中,您将学到:
一、如何使用内置算法的亚马逊SageMaker和Jupyter笔记本实例建立、训练和部署模型。
二、如何使用亚马逊的AI服务(如Amazon understand、Amazon Rekognition、Amazon Translate等。)来构建智能应用。
算法和数据结构是数据科学不可或缺的一部分。虽然大部分数据科学家不学算法和数据结构,但都是必不可少的。
很多公司在招聘数据科学家的面试过程中,都会问到数据结构和算法。
数据结构和算法专业化:
https://www . coursera . org/specializations/data-structure-algorithms?ranMID = 40328 & amprane aid = lvarvwc 5 BD 0 & amp;ranSiteID = lvarvwc 5 BD 0-gfspwabzey 8 lf 9 dkwhbyyg & amp;siteID = lvarvwc 5 BD 0-gfspwabzey 8 lf 9 dkwhbyyg & amp;utm _ content = 10 & amputm _ medium =合伙人& amp链接共享。utm_campaign=lVarvwc5BD0
在这门课程中,你将学习解决各种计算问题的算法,并用你喜欢的编程语言实现大约100个算法编程问题。本课程提供的算法问题与你下次面试可能遇到的编程问题非常接近。
原文链接:https://towardsdatascience . com/top-10-2020年成为数据科学家的资源-99a315194701
作者:Rahul Agarwal,数据科学家@ WalmartLabs。
这篇文章是CSDN翻译的。转载请注明出处。
本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://51itzy.com/47443.html