没有合适的资源?快使用搜索试试~ 我知道了~
首页吴恩达深度学习课程V1.4中文笔记详解
吴恩达深度学习课程V1.4中文笔记详解
需积分: 10 4 下载量 96 浏览量
更新于2024-07-19
收藏 9.35MB PDF 举报
深度学习笔记v1.4是由黄海广主编的一份详细的学习资料,针对吴恩达在Coursera上开设的深度学习专项课程进行整理。这个课程特别适合那些具备基本编程知识,熟悉Python,并对机器学习有一定了解的计算机专业人士,旨在让他们深入了解和掌握深度学习这一热门技能,以期在人工智能领域开启职业生涯。 课程内容涵盖了深度学习的基础理论,包括卷积神经网络(CNN),递归神经网络(RNN),以及长短期记忆(LSTM)等核心网络结构。学生在课程中不仅能够构建自己的神经网络,还会通过实际项目应用所学知识,解决医疗、自动驾驶、自然语言处理等领域的问题,甚至包括音乐生成等创新应用。 课程使用Python编程语言和Google开源的TensorFlow框架,由深度学习领域的大师级人物吴恩达亲自授课,助教团队也来自著名的斯坦福大学计算机系。整个课程设计为5堂,预计学习周期大约3-4个月,完成后,Coursera会颁发DeepLearning Specialization结业证书,强调了课程的专业性和实用性。 由于Coursera的视频字幕不完整,对学习者造成困扰,黄海广博士和他的团队主动填补这一空白,他们不仅翻译了中英文字幕,还组织志愿者整理了完整的中文笔记,持续更新以帮助更多学员理解和消化课程内容。这份笔记对于那些希望通过Coursera深度学习课程提升自我,但受限于语言障碍的学生来说,无疑是一份宝贵的资源。
资源详情
资源推荐
第一门课 神经网络和深度学习(Neural Networks and Deep Learning)-第一周:深度学习引言(Introduction to
Deep Learning)
10
神经网络,然后让它输出文本记录。得益于深度学习,机器翻译也有很大的发展。你可以利
用神经网络输入英语句子,接着输出一个中文句子。
在自动驾驶技术中,你可以输入一幅图像,就好像一个信息雷达展示汽车前方有什么,
据此,你可以训练一个神经网络,来告诉汽车在马路上面具体的位置,这就是神经网络在自
动驾驶系统中的一个关键成分。
那么深度学习系统已经可以创造如此多的价值,通过智能的选择,哪些作为 x 哪些作为
y,来针对于你当前的问题,然后拟合监督学习部分,往往是一个更大的系统,比如自动驾
驶。这表明神经网络类型的轻微不同,也可以产生不同的应用,比如说,应用到我们在上一
个视频提到的房地产领域,我们不就使用了一个普遍标准神经网络架构吗?
也许对于房地产和在线广告来说可能是相对的标准一些的神经网络,正如我们之前见到
的。对于图像应用,我们经常在神经网络上使用卷积(Convolutional Neural Network),通常
缩写为 CNN。对于序列数据,例如音频,有一个时间组件,随着时间的推移,音频被播放出
来,所以音频是最自然的表现。作为一维时间序列(两种英文说法 one-dimensional time series
/ temporal sequence).对于序列数据,经常使用 RNN,一种递归神经网络(Recurrent Neural
Network),语言,英语和汉语字母表或单词都是逐个出现的,所以语言也是最自然的序列
数据,因此更复杂的 RNNs 版本经常用于这些应用。
对于更复杂的应用比如自动驾驶,你有一张图片,可能会显示更多的 CNN 卷积神经网
络结构,其中的雷达信息是完全不同的,你可能会有一个更定制的,或者一些更复杂的混合
的神经网络结构。所以为了更具体地说明什么是标准的 CNN 和 RNN 结构,在文献中你可能
见过这样的图片,这是一个标准的神经网络。
你也可能见过这样的图片,这是一个卷积神经网络的例子。
第一门课 神经网络和深度学习(Neural Networks and Deep Learning)-第一周:深度学习引言(Introduction to
Deep Learning)
11
我们会在后面的课程了解这幅图的原理和实现,卷积网络(CNN)通常用于图像数据。
你可能也会看到这样的图片,而且你将在以后的课程中学习如何实现它。
递归神经网络(RNN)非常适合这种一维序列,数据可能是一个时间组成部分。
你可能也听说过机器学习对于结构化数据和非结构化数据的应用,结构化数据意味着数
据的基本数据库。例如在房价预测中,你可能有一个数据库,有专门的几列数据告诉你卧室
的大小和数量,这就是结构化数据。或预测用户是否会点击广告,你可能会得到关于用户的
信息,比如年龄以及关于广告的一些信息,然后对你的预测分类标注,这就是结构化数据,
意思是每个特征,比如说房屋大小卧室数量,或者是一个用户的年龄,都有一个很好的定义。
相反非结构化数据是指比如音频,原始音频或者你想要识别的图像或文本中的内容。这
里的特征可能是图像中的像素值或文本中的单个单词。
第一门课 神经网络和深度学习(Neural Networks and Deep Learning)-第一周:深度学习引言(Introduction to
Deep Learning)
12
从历史经验上看,处理非结构化数据是很难的,与结构化数据比较,让计算机理解非结
构化数据很难,而人类进化得非常善于理解音频信号和图像,文本是一个更近代的发明,但
是人们真的很擅长解读非结构化数据。
神经网络的兴起就是这样最令人兴奋的事情之一,多亏了深度学习和神经网络,计算机
现在能更好地解释非结构化数据,这是与几年前相比的结果,这为我们创造了机会。许多新
的令人兴奋的应用被使用,语音识别、图像识别、自然语言文字处理,甚至可能比两三年前
的还要多。因为人们天生就有本领去理解非结构化数据,你可能听说了神经网络更多在媒体
非结构化数据的成功,当神经网络识别了一只猫时那真的很酷,我们都知道那意味着什么。
但结果也表明,神经网络在许多短期经济价值的创造,也是基于结构化数据的。比如更
好的广告系统、更好的利润建议,还有更好的处理大数据的能力。许多公司不得不根据神经
网络做出准确的预测。
因此在这门课中,我们将要讨论的许多技术都将适用,不论是对结构化数据还是非结构
化数据。为了解释算法,我们将在使用非结构化数据的示例中多画一点图片,但正如你所想
的,你自己团队里通过运用神经网络,我希望你能发现,神经网络算法对于结构化和非结构
化数据都有用处。
神经网络已经改变了监督学习,正创造着巨大的经济价值,事实证明,基本的神经网络
背后的技术理念大部分都离我们不遥远,有的是几十年,那么为什么他们现在才刚刚起步,
效果那么好,下一集视频中我们将讨论为什么最近的神经网络已经成为你可以使用的强大工
具。
本视频笔记整理(胡瀚文 firebook.t#qq.com)
第一门课 神经网络和深度学习(Neural Networks and Deep Learning)-第一周:深度学习引言(Introduction to
Deep Learning)
13
1.4 为什么神经网络会流行?(Why is Deep Learning taking
off?)
参考视频: 01-04-Why is Deep Learning taking off.mkv
本节视频主要讲了推动深度学习变得如此热门的主要因素。包括数据规模、计算量及
算法的创新。
深度学习和神经网络之前的基础技术理念已经存在大概几十年了,为什么它们现在才
突然流行起来呢?本节课程主要讲述一些使得深度学习变得如此热门的主要驱动因素,这将
会帮助你在你的组织机构内发现最好的时机来应用这些东西。
在过去的几年里,很多人都问我为什么深度学习能够如此有效。当我回答这个问题时,
我通常给他们画个图,在水平轴上画一个形状,在此绘制出所有任务的数据量,而在垂直轴
上,画出机器学习算法的性能。比如说准确率体现在垃圾邮件过滤或者广告点击预测,或者
是神经网络在自动驾驶汽车时判断位置的准确性,根据图像可以发现,如果你把一个传统机
器学习算法的性能画出来,作为数据量的一个函数,你可能得到一个弯曲的线,就像图中这
样,它的性能一开始在增加更多数据时会上升,但是一段变化后它的性能就会像一个高原一
样。假设你的水平轴拉的很长很长,它们不知道如何处理规模巨大的数据,而过去十年的社
会里,我们遇到的很多问题只有相对较少的数据量。
多亏数字化社会的来临,现在的数据量都非常巨大,我们花了很多时间活动在这些数字
的领域,比如在电脑网站上、在手机软件上以及其它数字化的服务,它们都能创建数据,同
时便宜的相机被配置到移动电话,还有加速仪及各类各样的传感器,同时在物联网领域我们
第一门课 神经网络和深度学习(Neural Networks and Deep Learning)-第一周:深度学习引言(Introduction to
Deep Learning)
14
也收集到了越来越多的数据。仅仅在过去的 20 年里对于很多应用,我们便收集到了大量的
数据,远超过机器学习算法能够高效发挥它们优势的规模。
神经网络展现出的是,如果你训练一个小型的神经网络,那么这个性能可能会像下图黄
色曲线表示那样;如果你训练一个稍微大一点的神经网络,比如说一个中等规模的神经网络
(下图蓝色曲线),它在某些数据上面的性能也会更好一些;如果你训练一个非常大的神经
网络,它就会变成下图绿色曲线那样,并且保持变得越来越好。因此可以注意到两点:如果
你想要获得较高的性能体现,那么你有两个条件要完成,第一个是你需要训练一个规模足够
大的神经网络,以发挥数据规模量巨大的优点,另外你需要能画到 x 轴的这个位置,所以你
需要很多的数据。因此我们经常说规模一直在推动深度学习的进步,这里的规模指的也同时
是神经网络的规模,我们需要一个带有许多隐藏单元的神经网络,也有许多的参数及关联性,
就如同需要大规模的数据一样。事实上如今最可靠的方法来在神经网络上获得更好的性能,
往往就是要么训练一个更大的神经网络,要么投入更多的数据,这只能在一定程度上起作用,
因为最终你耗尽了数据,或者最终你的网络是如此大规模导致将要用太久的时间去训练,但
是仅仅提升规模的的确确地让我们在深度学习的世界中摸索了很多时间。为了使这个图更加
从技术上讲更精确一点,我在 X 轴下面已经写明的数据量,这儿加上一个标签(label)量,
通过添加这个标签量,也就是指在训练样本时,我们同时输入 X 和标签 Y, 接下来引入一
点符号,使用小写的字母 m 表示训练集的规模,或者说训练样本的数量,这个小写字母 m
就横轴结合其他一些细节到这个图像中。
在这个小的训练集中,各种算法的优先级事实上定义的也不是很明确,所以如果你没有
大量的训练集,那效果会取决于你的特征工程能力,那将决定最终的性能。假设有些人训练
剩余160页未读,继续阅读
fdy200533
- 粉丝: 1
- 资源: 1
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- zlib-1.2.12压缩包解析与技术要点
- 微信小程序滑动选项卡源码模版发布
- Unity虚拟人物唇同步插件Oculus Lipsync介绍
- Nginx 1.18.0版本WinSW自动安装与管理指南
- Java Swing和JDBC实现的ATM系统源码解析
- 掌握Spark Streaming与Maven集成的分布式大数据处理
- 深入学习推荐系统:教程、案例与项目实践
- Web开发者必备的取色工具软件介绍
- C语言实现李春葆数据结构实验程序
- 超市管理系统开发:asp+SQL Server 2005实战
- Redis伪集群搭建教程与实践
- 掌握网络活动细节:Wireshark v3.6.3网络嗅探工具详解
- 全面掌握美赛:建模、分析与编程实现教程
- Java图书馆系统完整项目源码及SQL文件解析
- PCtoLCD2002软件:高效图片和字符取模转换
- Java开发的体育赛事在线购票系统源码分析
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功