【AI】那么火的人工智能到底是什么?看这一篇就够了!

写在前面:学了近一年的AI基础知识 最近在整理AI学习的大框架 整理完思路清晰了很多 分享出来希望可以帮到更多人 内容还会继续继续填充

01 前言

1.1基础科普

1.1.1 人工智能应用场景

商业场景:个性化推荐 精准营销 客户细分/用户画像 预测建模
模式识别 数据挖掘 统计学习 语音识别 自然语言处理 计算机视觉

1.1.2 人工智能 机器学习 深度学习的关系

关系

1.1.3 机器学习流程

在这里插入图片描述

1.2 模型评估

1.2.1 模型评估依据

在这里插入图片描述
模型评估

1.3 数学基础

1.3.1 函数

常见函数:常函数 一次函数 二次函数 指数函数 对数函数 幂函数
导数、梯度(求导的方式、导数/二阶导数/偏导数/梯度的含义/作用)
Taylor公式

1.3.2 概率

古典概率、联合概率、条件概率、全概率公式、贝叶斯公式
期望、方差、协方差( Cov(X,Y) >=<0)
大数定理、中心极限定理
最大似然估计(MLE)

1.3.3 向量

向量、矩阵的运算
向量、矩阵的求导
SVD、QR分解

01 工具及框架

1.1 工具

1.1.1 numpy

数据处理工具NumPy(Numeric Python)提供了许多高级的数值编程工具,如:矩阵数据类型、矢量处理,以及精密的运算库。专为进行严格的数字处理而产生

Numpy

1.1.2 pandas

数据处理工具pandas是基于NumPy 的一种工具,用于解决数据分析任务 ,提供了高效地操作大型数据集所需的工具。提供了大量能使我们快速便捷地处理数据的函数和方法

在这里插入图片描述

1.2 框架

1.2.1 Scikit-Learn

机器学习框架Scikit-Learn库包含了常见的机器学习算法 作为python机器学习功能强大的支持包,它已经把底层的脏活、累活都默默完成了,使用者能够将宝贵的注意力和精力集中在解决问题上,极大地提高产出效率

在这里插入图片描述

1.2.2 Tensorflow

一个端到端开源机器

Tensorflow

02 机器学习

机器学习核心思想:梯度下降
梯度下降分类:批量梯度下降(BGD) 随机梯度下降(SGD) 小批量梯度下降(MBGD)

2.1 机器学习常用算法总结

机器学习常用算法总结

2.2 常用算法原理

2.2.1 Linear-Regression

历史数据–> 拟合平面计算式–>损失函数(误差)分析–>目标函数最小值参数seita–>回归模型–> 预测值

Linear-Regression

2.2.2 Loglstic

特征数据–>线性回归方程–>进行sigmoid激活–>输出的得分值–>比较不同预测结果的得分值

Logistic

2.2.3 SVM

两类数据点–>决策方程(w /b)–>最大化点与决策边界的距离–>距离倒数的极小值(拉格朗日乘子/核函数)–>最优决策方程 (找到区分两类的hyper plane 超平面 使得边际margin 最大)

SVM

2.2.4 Decide-Tree

整个数据集(根节点)–> 通过条件(信息增益//信息增益率)–> 判断合适的前进方向–>达到不可再分的节点 --> 最终的决策结果

Decide-Tree

2.2.4.1 C4.5
2.2.4.1 CART

2.2.5 Random-Forest

训练数据集–> 随机数据采样 (第一重随机)AND 随机特征采样(第二重随机) -->训练数据集–> 建立决策树模型–>综合(平均/投票/多数结果法)–>最终结果

Random-Forest

2.2.6 集成学习

Adboost

2.2.6.1 Adboost

训练数据集–>一次划分–>更新权重–>二次划分–>更新权重–>三次划分–>更新权重–>对每次预测结果根据准确率(作为权重)乘以a–>综合相加–>最终结果

2.2.6.1 Xgboost

内部决策树用的回归树–>构造出第一棵树–>选择策略–>第二棵树–>选择策略–>第三棵树

2.2.7 K-Means

一堆数据–>初始化 k 个质心点-- >按质心算距离 聚类 --> 迭代更新质心–> 依次继续更新

KMeans

2.2.8 KNN

带标签的训练数据集和待分类测试数据–>测试对象到训练集中每个对象的距离–>按距离大小排序–>选取K个与测试对象最近的标签数据–>多数表决预测

KNN

2.2.9 NaiveBayes

2.2.10 EM

03 深度学习

3.1 基础

3.1.0 Tensorflow

Tensorflow

3.1.1 深度学习应用

· 人脸识别,手机解锁和高铁通行验证 扫脸支付
· 医疗影像诊断:放射性拍片-提升超分辨率
· 工业4.0: 预测性维护是指用连续的数据收集来预测设备故障
· 无人零售 · 深度强化学习(Alpha zero等)
· AUTOML-机器学习自动化
· 自动驾驶:(百度Apollo,Google的Waymo)
· 自动辅助系统
· 跟车系统
· 高速自动巡航系统
· 自动泊车系统 自动运输卡车
· 农作物监测:管理杀虫剂、发现问题,预测天气变化如何影响农业
· 药物发现:缩短药物发现周期

3.1.2 基本概念

  • 感知机模型
  • 反向传播
  • 正向传播
  • 多层反向传播

3.2 CNN(convolutional Neural Networks)

卷积神经网络

结构

  • 数据输入层:Input Layer (图片)
  • 卷积计算层:CONV Layer
  • ReLU激励层:ReLU Incentive Layer (激活)
  • 池化层:Pooling Layer (下采样)
  • 全连接层:FC Layer

3.3 RNN(Recurrent Neural Network)

循环神经网络

3.4 GANS(Generative Adversarial Networks)

生成对抗神经网络

04 计算机视觉

大规模(大数据量)图片识别(聚类/分类),如人脸识别,车牌识别,OCR
以图搜图,图像分割 目标检测,如自动驾驶的行人检测,安防系统的异常人群检测

目标检测 图像定位

  • Alex Net
  • SPP Net
  • CNN-VGGNet
  • Fast R-CNN
  • Fast R-CNN RPN
  • Faster RCNN
  • R FCN
  • YOLO
  • YOLO v1
  • YOLO v2
  • YOLO v3
  • SSD
  • Cascade R-CNN

图像分类

  • VGG
  • GoogleNet
  • RestNet

3D目标检测

  • Anchor Free
  • Anchor Free_UnitBox
  • Anchor Free_FSAF
  • Anchor Free_FCOS
  • Anchor Free_CenterNet
  • Anchor Free_CornerNet
  • Anchor Free_CornerNet-Lite
  • Anchor Free_GA RPN

05 自然语言

语音识别,语音合成自动分词,句法分析,语法纠错,关键词提取,文本分类/聚类,
文本自动摘要,信息检索(ES,Solr)知识图谱,机器翻译,人机对话,机器写作
推荐系统,高考机器人 信息抽取,网络爬虫,情感分析,问答系统

分词

词向量

常用工具

  • Jieba
  • HanLP
  • Gensim

算法

  • Seq2Seq
  • 自编码神经网络
  • RNN LSTM
  • Attention
  • Transformer
  • Bert

06 语音识别

猜你喜欢

转载自blog.csdn.net/weixin_43988131/article/details/106954500