原机器学习与深度学习系列连载：第二部分深度学习(一）神经网络

企业开发 2018-10-21 05:11:13 阅读次数: 0

神经网络

自2012年CNN的imagenet 上的突破，以神经网络网络为基础的深度学习开始风靡学界和工业界。我们来看一张图片，关于google 内部深度学习项目的数量。而且应用领域极广，从Android 到药品发现，到youtube。
在这里插入图片描述
我们从一起回顾下神经网络的额前世今生：
• 1958: Perceptron (linear model)
• 1969: Perceptron has limitation
• 1980s: Multi-layer perceptron
• Do not have significant difference from DNN today
• 1986: Backpropagation
• Usually more than 3 hidden layers is not helpful
• 1989: 1 hidden layer is “good enough”, why deep? • 2006: RBM initialization (breakthrough)
• 2009: GPU
• 2011: Start to be popular in speech recognition
• 2012: win ILSVRC image competition

深度学习是机器学习的一个分支，目前讲是最重要的一个分支。怎么学好深度学些呢？其实还是关键的三步：

选择神经网络
定义神经网络的好坏
选择最好的参数集合

以下是神经网络的示意图：

所有的 $\theta$ 和 b 都在神经元内

1 全连接网络（Fully Connection）

在这里插入图片描述

2 深度网络 DEEP

深度 = 很多层
在这里插入图片描述

那么有人就会问：

到底多少层深度合适？每层多个神经元？
答：这个看经验和实验的结果，不断调整。
结构能被自动设定吗？
答：可以通过进化网络实现。
我们能自己设计网络结构吗？
答： CNN 就是设计出来的网络结构。

3 定义神经网络的好坏Loss

我们以minist 数字识别为例，一组数字识别为例
在这里插入图片描述

4 选择最好的神经网络（找到参数集）

核心方法：

Gradient Descent
BackPropagation

在这里插入图片描述

在这里插入图片描述

深度学习基本知识点了解到了，但是为什么越Deep，效果会越好？以前都是做类比思考，比如电路模型，但是近期的lpaper上在理论上有严格的证明，我们后续博客会介绍

猜你喜欢

转载自blog.csdn.net/dukuku5038/article/details/83217542

原机器学习与深度学习系列连载：第二部分深度学习(一）神经网络

机器学习与深度学习系列连载：第二部分深度学习（十七）深度神经网络调参之道（learn to learn）

机器学习与深度学习系列连载：第二部分深度学习（十六）循环神经网络 4（BiDirectional RNN， Highway network， Grid-LSTM）

机器学习与深度学习系列连载：第二部分深度学习（十五）循环神经网络 3（Gated RNN - GRU）

机器学习与深度学习系列连载：第二部分深度学习（十四）循环神经网络 2（Gated RNN - LSTM ）

机器学习与深度学习系列连载：第二部分深度学习（十三）循环神经网络 1（Recurre Neural Network 基本概念）

机器学习与深度学习系列连载：第二部分深度学习（十一）卷积神经网络 2 Why CNN for Image？

机器学习与深度学习系列连载：第二部分深度学习（十）卷积神经网络 1 Convolutional Neural Networks

机器学习与深度学习系列连载：第二部分深度学习(二）梯度下降

机器学习与深度学习系列连载：第二部分深度学习（七）深度学习技巧4（Deep learning tips- Dropout）

机器学习与深度学习系列连载：第二部分深度学习（六）深度学习技巧3（Deep learning tips- Early stopping and Regularization）

机器学习与深度学习系列连载：第二部分深度学习（五）深度学习技巧2（Deep learning tips- Relu）

机器学习与深度学习系列连载：第二部分深度学习（四）深度学习技巧1（Deep learning tips- RMSProp + Momentum=Adam）

机器学习与深度学习系列连载：第二部分深度学习（八）可以自己学习的激活函数（Maxout）

机器学习与深度学习系列连载：第二部分深度学习（十二）卷积神经网络 3 经典的模型（LeNet-5，AlexNet ，VGGNet，GoogLeNet，ResNet）

spring学习笔记（第二部分）

java mysql学习第二部分

JS学习第二部分

【Java学习记录第二部分】

JavaEE学习的第二部分

机器学习与深度学习系列连载：第二部分深度学习（十八) Seq2Seq 模型

机器学习与深度学习系列连载：第二部分深度学习（九）Keras- “hello world” of deep learning

机器学习与深度学习系列连载：第二部分深度学习（十九) 注意力机制 Attention

卷积神经网络学习——第二部分：卷积神经网络训练的基本流程

tensorflow 2.0 深度学习（第二部分 part1）

PaddlePaddle 深度学习实战（第二部分）

Keras - Python深度学习（第二部分）

网络--http（第一天--第二部分学习）

机器学习之第二部分：词向量

Java语言高级（第二部分）常用API第二部分集合 -＞（个人学习记录笔记）

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)