高效炼丹必备:一文入门深度学习数学原理,还有吴恩达亲授课程
csdh11 2024-12-31 10:26 23 浏览
贾浩楠 发自 凹非寺
量子位 报道 | 公众号 QbitAI
哪个程序员不想高效“炼丹”?
尤其是深度学习算法开发人员,追求模型结构优化和提高编程效率是永远的目标。
但是,如果只做代码“搬运工”,不了解神经网络背后的数学原理,很难对项目有深刻全面的理解,debug反而会更难、耗时更长。
就以深度学习中常用的神经网络来说,典型模型包括多层感知机(DLP)、卷积神经网络(CNN)、循环神经网络(RNN)等等,不同的项目,对神经网络的调参需求也不相同。
下面的深度学习数学基础详解,以DLP为例,你读完后会对它的数学基础有全面的了解,并且熟悉用数学解释算法的基本思路。
除了DLP,文末还一并为你准备了RNN、CNN数学原理,以及吴恩达老师的AI数学基础课程。
一文实现AI数学基础入门,还在等什么?
多层感知机的数学表达
多层感知机的数学表达分为4个部分:学习算法、参数初始化、激活函数、优化函数。
学习算法
神经网络的学习过程可以看做是参数的权重在网络中经历的不同回归,也就是说我们的算法是要找出一个使参数得到最佳输出的回归方法,由此我们定义一个目标函数:损失函数L(loss function);还有一个参数J,它是训练集真实与估计值的量化表示。
我们通过正向和反向传播两种方法来使J最小化,学习算法可以表示为:
正向传播:
其中m是训练集的大小,i是参数在网络中的迭代次数,y是模型的输出,θ是模型参数。
反向传播:
参数初始化
零初始化:使所有参数的权重和偏差都为零。
随机初始化:不断将随机噪音赋值给参数。如果噪音过大,可能会造成某些激活函数溢出,并影响到后续的梯度计算。
Xavier方法:取值于正态分布的中心变量:
Glorot方法:同样取值于正态分布,方法不同。
激活函数
激励函数的功能是选择在网络中被传递的具体参数,更深一层的理解是,允许网络中被有效激活的神经元传递训练数据。
一下是一些常用的激活函数:
优化函数
风险,是神经网络中全部数据集的损失,是我们需要优化的对象,定义为:
其中,X是一个可观测的连续空间中,与Y有关的元素,p(X,Y)是在这一空间中观察到点(X,Y)的边缘概率。
经验风险
在没有全部数据集,或全部数据集过大的情况下,我们不考虑参数分布情况,仅将风险估计的范围限定在一个有代表性的数据集上,这种情况下,损失函数可以表示为:
m是代表数据集的大小。
于是可以得出:
梯度下降法
我们需要构造一个可微凸函数J,其任何一个局部的最小值都是整个函数的最小值,那么求这个函数的最小值就相当于解一个方程?J(θ)=0,设它的解为θ?,于是我们得到:
学习率递减
实践证明,随着数据迭代次数增加,模型会逐渐降低学习率。现在已经有许多成熟地描述学习率递减的公式。
优化函数还包含输入优化、网络数据丢失正则化、反向传播正则化等,限于篇幅将链接放在文末。
其他有关深度学习的数学基础的参考链接
DLP中的其他优化函数,以及参数正向、反向传播时损失函数详细推推导过程
https://www.ismailmebsout.com/deep-learning/
除了DLP,其他神经网络RNN、CNN等也有详细的数学表达推导过程
CNNhttps://www.ismailmebsout.com/Convolutional%20Neural%20Network%20-%20Part%201/
RNNhttps://www.ismailmebsout.com/recurrent-neural-networks/
deep learning数学基础入门
http://deeploria.gforge.inria.fr/cours/cours1.html#/definitions
Deep Learning Specialization. Master Deep Learning, and Break into AI,吴恩达
https://fr.coursera.org/specializations/deep-learning
Antoine Henrot的优化算法课程
http://www.iecl.univ-lorraine.fr/~Antoine.Henrot/english.html
相关推荐
- pdf怎么在线阅读?这几种在线阅读方法看看
-
pdf怎么在线阅读?我们日常生活中经常使用到pdf文档。这种格式的文档在不同平台和设备上的可移植性,以及保留文档格式和布局的能力都很强。在阅读这种文档的时候,很多人会选择使用在线阅读的方法。在线阅读P...
- PDF比对不再眼花缭乱:开源神器diff-pdf助你轻松揪出差异
-
PDF比对不再眼花缭乱:开源神器diff-pdf助你轻松揪出差异在日常工作和学习中,PDF文件可谓是无处不在。然而,有时我们需要比较两个PDF文件之间的差异,这可不是一件轻松的事情。手动逐页对比简直是...
- 全网爆火!580页Python编程快速上手,零基础也能轻松学会
-
Python虽然一向号称新手友好,但对完全零基础的编程小白来讲,总会在很长时间内,都对某些概念似懂非懂,每次拿起书本教程,都要从第一章看起。对于这种迟迟入不了门的情况,给大家推荐一份简单易懂的入门级教...
- 我的名片能运行Linux和Python,还能玩2048小游戏,成本只要20元
-
晓查发自凹非寺量子位报道|公众号QbitAI猜猜它是什么?印着姓名、职位和邮箱,看起来是个名片。可是右下角有芯片,看起来又像是个PCB电路板。其实它是一台超迷你的ARM计算机,不仅能够运...
- 由浅入深学shell,70页shell脚本编程入门,满满干货建议收藏
-
不会Linux的程序员不是好程序员,不会shell编程就不能说自己会Linux。shell作为Unix第一个脚本语言,结合了延展性和高效的优点,保持独有的编程特色,并不断地优化,使得它能与其他脚本语言...
- 真工程师:20块钱做了张「名片」,可以跑Linux和Python
-
机器之心报道参与:思源、杜伟、泽南对于一个工程师来说,如何在一张名片上宣告自己的实力?在上面制造一台完整的计算机说不定是个好主意。最近,美国一名嵌入式系统工程师GeorgeHilliard的名片...
- 《Linux 命令行大全》.pdf
-
今天跟大家推荐个Linux命令行教程:《TheLinuxCommandLine》,中文译名:《Linux命令行大全》。该书作者出自自美国一名开发者,兼知名Linux博客LinuxCo...
- PDF转换是难题? 搜狗浏览器即开即看
-
由于PDF文件兼容性相当广泛,越来越多的电子图书、产品说明、公司文告、网络资料、电子邮件选择开始使用这种格式来进行内容的展示,以便给用户更好的再现原稿的细节,但需要下载专用阅读器进行转化才能浏览的问题...
- 彻底搞懂 Netty 线程模型
-
点赞再看,养成习惯,微信搜一搜【...
- 2022通俗易懂Redis的线程模型看完就会
-
Redis真的是单线程吗?我们一般说Redis是单线程,是指Redis的网络IO和键值对操作是一个线程完成的,这就是Redis对外提供键值存储服务的主要流程。Redis的其他功能,例如持久化、异步删除...
- 实用C语言编程(第三版)高清PDF
-
编写C程序不仅仅需要语法正确,最关键的是所编代码应该便于维护和修改。现在有很多介绍C语言的著作,但是本书在这一方面的确与众不同,例如在讨论C中运算优先级时,15种级别被归纳为下面两条原则:需要的...
- 手拉手教你搭建redis集群(redis cluster)
-
背景:最近需要使用redis存储数据,但是随着时间的增加,发现原本的单台redis已经不满足要求了,于是就倒腾了一下搭建redistclusterredis集群。好了,话不多说,下面开始展示:...
- 记录处理登录页面显示: HTTP Error 503. The service is unavailable.
-
某天一个系统的登录页面无法显示,显示ServiceUnavailableHTTPError503.Theserviceisunavailable,马上登录服务器上查看IIS是否正常。...
- 黑道圣徒杀出地狱破解版下载 免安装硬盘版
-
游戏名称:黑道圣徒杀出地狱英文名称:SaintsRow:GatOutofHell游戏类型:动作冒险类(ACT)游戏游戏制作:DeepSilverVolition/HighVoltage...
- 一周热门
- 最近发表
- 标签列表
-
- mydisktest_v298 (34)
- document.appendchild (35)
- 头像打包下载 (61)
- acmecadconverter_8.52绿色版 (39)
- word文档批量处理大师破解版 (36)
- server2016安装密钥 (33)
- mysql 昨天的日期 (37)
- parsevideo (33)
- 个人网站源码 (37)
- centos7.4下载 (33)
- mysql 查询今天的数据 (34)
- intouch2014r2sp1永久授权 (36)
- 先锋影音源资2019 (35)
- jdk1.8.0_191下载 (33)
- axure9注册码 (33)
- pts/1 (33)
- spire.pdf 破解版 (35)
- shiro jwt (35)
- sklearn中文手册pdf (35)
- itextsharp使用手册 (33)
- 凯立德2012夏季版懒人包 (34)
- 冒险岛代码查询器 (34)
- 128*128png图片 (34)
- jdk1.8.0_131下载 (34)
- dos 删除目录下所有子目录及文件 (36)