让一部分企业先学到真知识!

叶梓:人工智能“最强模型”transformer详解

叶梓老师叶梓 注册讲师 411查看

课程概要

培训时长 : 2天

课程价格 : 扫码添加微信咨询

课程分类 : 人工智能

课程编号 : 10018

面议联系老师

适用对象

理工科本科以上,或至少了解一种编程语言。

课程介绍

【课程简介】

Transformer 是迄今为止人工智能领域的最新和最强大的模型类别之一。它几乎正在凭借一己之力来推动深度学习的又一波重大进步。Transformer 模型充分运用了称为注意力和自注意力机制,以检测系列(或图像)中元素相互影响和相互依赖的微妙关系。本课程通过2天时间的详细介绍,可使学习者初步了解Transformer的原理、应用场景、最新发展等。

 

【课程收益】

  • 掌握深度学习框架:TensorFlow、pytorch等;
  • 理解“自监督学习”在当代AI领域的核心作用;
  • 掌握Transformer背景知识、相关理论与实践;
  • 理解Transformer在NLP领域和CV领域的应用场景;
  • 为学员的后续项目应用提供针对性的建议。

 

【课程特点】

本课程力图理论结合实践,强调从零开始,重视动手实践;课程内容以原理讲解为根本,以应用落地为目标。课程通过大量形象的比喻和手算示例来解释复杂的理论,既能将原理充分讲懂讲透,也避免了繁复而枯燥的公式推导。

 

【课程对象】

理工科本科以上,或至少了解一种编程语言。

 

时间内容案例实践与练习

第一天上午

 

深度学习知识

 

BP神经网络

  1. 人工神经元及感知机模型
  2. Sigmoid激活函数
  3. 前向神经网络的架构
  4. 梯度下降
  5. 误差反向传播详解

 

深度学习基础

  1. 连接主义的兴衰
  2. 深度学习与神经网络
  3. 目标函数与激励函数
  4. 学习步长
  5. 权重初始化
  6. 权重衰减(Weight Decay)
  7. 梯度下降的方法

案例实践:

  1. 手算神经网络BP算法
  2. 只用numpy,手推BPNN
  3. 深度BP网络实现手写数字的识别
  4. 各种梯度下降方法的实战效果

直方图

描述已自动生成http://images.cnblogs.com/cnblogs_com/LeftNotEasy/WindowsLiveWriter/1_1270E/image_22.png

第一天上午

 

CV初步

 

CNN

  1. 图像分类概述
  2. AlexNet与ZF-Net
  3. VGG(5层变为5组)
  4. 迁移学习
  5. GoogLenet 
  6. 模型退化与ResNet
  7. DenseNet(充分利用特征)
  8. 最新的efficientnet

 

VAE与GAN

  1. 图像生成模型
  2. AE与VAE
  3. DAE
  4. GAN
  5. 改进的GAN

案例实践:

  1. VGG各层的可视化展现
  2. 迁移学习:猫狗大战
  3. VAE生成的数字
  4. StyleGAN

屏幕上的猫

描述已自动生成日历

描述已自动生成

第二天上午

 

RNN与W2V

 

 

循环神经网络

  1. RNN基本原理
  2. LSTM、GRU
  3. 双向循环神经网络
  4. 编码器与解码器结构
  5. seq2seq模型
  6. 初识Attention
  7. NIC模型

 

词向量基础(word2vec)

  1. W2V:CBOW
  2. W2V:skip-gram
  3. W2V:Hierachical Softmax
  4. W2V:Negative Sampling

 

案例实践:

  1. 股票交易数据的预测;
  2. 谁和小鱼儿最相似?
  3. SnowNLP:褒义的中性词
  4. Word2vec代码解读

 

图表, 折线图, 直方图

描述已自动生成图表, 气泡图

描述已自动生成

第二天下午

 

Transformer以及发展

 

Transformer

  1. 所有你需要的仅仅是“注意力”
  2. Transformer中的block
  3. 自注意力机制
  4. 多头注意力
  5. 位置编码(抛弃RNN)
  6. Batch Norm与Layer Norm
  7. 解码器的构造

 

BERT

  1. BERT整体架构
  2. Masked-LM
  3. Next Sentence Prediction
  4. 改造下游任务
  5. WordPiece作为输入

 

CV领域的Transformer

  1. iGPT
  2. Vision Transformer(ViT)
  3. BEiT
  4. MAE令人惊奇的效果
  5. MAE详解
  6. 未来可期:MaskFeat等

 

案例实践:

  1. 手推Transformer
  2. BERT代码解读
  3. BERT下游任务的改造
  4. BEiT的效果

 

形状

描述已自动生成图示

描述已自动生成

叶梓老师的其他课程

• 叶梓:强化学习与深度强化学习
【课程简介】强化学习是当前最热门的研究方向之一,广泛应用于机器人学、电子竞技等领域。本课程系统性的介绍了强化学习(深度强化学习)的基本理论和关键算法,包括:马尔科夫决策过程、动态规划法、蒙特卡罗法、时间差分法、值函数逼近法,策略梯度法等;以及该领域的最新前沿发展,包括:DQN及其变种、信赖域系方法、Actor-Critic类方法、多Agent深度强化学习等;同时也介绍大量的实际案例,包括深度强化学习中最著名的工程应用:Alpha Go。 【课程对象】计算机相关专业本科;或理工科本科,具备初步的IT基础知识的人员 第一天 强化学习 第一课 强化学习综述1.强化学习要解决的问题2.强化学习方法的分类3.强化学习方法的发展趋势4.环境搭建实验(Gym,TensorFlow等)5.Gym环境的基本使用方法 第二课 马尔科夫决策过程1.基本概念:马尔科夫性、马尔科夫过程、马尔科夫决策过程2.MDP基本元素:策略、回报、值函数、状态行为值函数3.贝尔曼方程4.最优策略案例:构建机器人找金币和迷宫的环境 第三课 基于模型的动态规划方法1.动态规划概念介绍2.策略评估过程介绍3.策略改进方法介绍4.策略迭代和值迭代案例:实现基于模型的强化学习算法 第四课 蒙特卡罗方法1.蒙特卡罗策略评估2.蒙特卡罗策略改进3.基于蒙特卡罗的强化学习4.同策略和异策略案例:利用蒙特卡罗方法实现机器人找金币和迷宫 第五课 时序差分方法1.DP,MC和TD方法比较2.MC和TD方法偏差与方差平衡3.同策略TD方法:Sarsa 方法4.异策略TD方法:Q-learning 方法案例:Q-learning和Sarsa的实现 第二天 从强化学习到深度强化学习 第一课 基于值函数逼近方法(强化学习)1.维数灾难与表格型强化学习2.值函数的参数化表示3.值函数的估计过程4.常用的基函数 第二课 基于值函数逼近方法(深度学习与强化学习的结合)1.简单提一下深度学习2.深度学习与强化学习的结合3.DQN 方法介绍4.DQN变种:Double DQN, Prioritized Replay, Dueling Network案例:用DQN玩游戏——flappy bird 第三课 策略梯度方法(强化学习)1.策略梯度方法介绍2.常见的策略表示3.常见的减小方差的方法:引入基函数法,修改估计值函数法案例:利用gym和tensorflow实现小车倒立摆系统等 第四课 Alpha Go(深度学习与强化学习的结合)1.MCTS2.策略网络与价值网络3.Alpha Go的完整架构 第五课 GAN(深度学习)1.VAE与基本GAN2.DCGAN3.WGAN案例:生成手写数字的GAN 第三天 深度强化学习进阶 第一课 AC类方法-11. PG的问题与AC的思路2. AC类方法的发展历程3. Actor-Critic基本原理 第二课 AC类方法-21. DPG方法2. DDPG方法3. A3C方法案例:AC类方法的案例 第三课 信赖域系方法-11.信赖域系方法背景2.信赖域系方法发展路线图3.TRPO方法案例:TRPO方法的案例 第四课 信赖域系方法-21.PPO方法2.DPPO方法简介3.ACER方法案例:PPO方法的案例 第五课 多Agent强化学习1.矩阵博弈2.纳什均衡3.多人随机博弈学习4.完全合作、完全竞争与混合任务5.MADDPG案例:MADDPG的案例等
• 叶梓:计算机视觉的深度学习实践
【课程简介】在所有人工智能的应用方向上,计算机视觉/机器视觉图像处理的落地应用最为成熟,近两年的技术发展是最为迅猛。以互联网巨头为代表的企业正在开展如:基于识别的智能机器人,无人驾驶,人脸识别、图像搜索,图像处理,游戏界面等;专门从事视觉、图像处理的新兴公司正在发力于人脸识别,检测,跟踪,安防等领域。只有对计算机视觉这个领域有了一个初步的全面了解才能在这些领域进行研究,一步步深入下去。 【课程目标】计算机视觉领域的重点研究问题。由浅入深得 讲解数字图像的存储、预处理、特征提取,以及在深度学习兴起之前计算机视觉领域所取得的成就。专门介绍深度学习的基础理论知识,包括神经 网络的基本原理,以及深度学习对于传统神经 网络的关键改进。重点介绍深度学习模型在计算机视觉领域的应用。具体涉及在计算机视觉领域如何应用卷积 神经网络(CNN)、区域卷积网络(R-CNN) 全卷积网络(FCN)、循环神经网络(RNN)、 长短时记忆单元(LSTM)、生成对抗网络 (GAN)等解决图像应用的难点 课程将使用Python语言及Tensorflow、Keras 深度学习框架等进行案例实践教学。 第一讲 课程概述1、计算机视觉的研究意义2、计算机视觉的难点3、当前研究的主要热点问题(分类、目标检测、实例分割、图说等)4、本课程的主要内容介绍5、相关开源库介绍(OpenCV、Tensorflow、Keras、pyTorch等)6、应用案例:搭建tensorflow+opencv的环境 第二讲 图像预处理1、图像平滑与去噪(高斯滤波、中值滤波等)2、基于直方图的对比度增强:CLAHE3、边缘检测算子(Sobel、拉普拉斯等)4、形态学处理(腐蚀、膨胀、开闭运算等)5、高斯金字塔与拉普拉斯金字塔6、频域分析及变换(卷积计算、傅里叶变换、小波变换)7、应用案例:平滑、边缘检测、CLAHE、FFT等 第三讲 图像特征提取1、颜色特征(量化直方图、聚类直方图)2、几何特征(Edge、Corner、Blob等)3、Harris角点与FAST角点4、基于关键点的特征描述子(SIFT、SURF、ORB)5、其他特征提取(LBP、Gabor)6、应用案例:SIFT、图像拼接等 第四讲 未有深度学习之前1、基于灰度的图像分割(阈值分割、区域生长、分水岭等)2、基于图论:graph-cut与grab-cut3、用于人脸检测的Haar-like特征与级联分类器4、用于行人检测的HOG+SVM5、用于行人检测的多尺度形变部件模型(DPM)6、应用案例:人脸识别、行人识别 第五讲 神经网络与误差反向传播算法1、人工神经元及感知机模型2、目标函数(MSE)3、激励函数(sigmoid、tanh)4、误差反向传播算法的推导5、应用案例:可以手算的BP神经网络6、深度学习与神经网络的区别与联系 第六讲 深度学习基础1、深度学习中的目标函数与激励函数2、深度学习中的求解方法(Adagrad、RMSprop、Adam等)3、深度学习中的技巧(dropout、BN、weights decay等)4、应用案例:利用tensorflow实现的手写数字识别5、卷积神经网络介绍6、卷积层的误差反向传播7、池化层的误差反向传播 第七讲 图像分类1、竞赛中的分类问题2、CNN的发展概述3、开山之作:AlexNet4、5层变为5组:VGG5、组合所有可能的模型:GoogLeNet6、残差网络:ResNet7、深与宽之外的改进方向:ResNext6、应用案例:VGG、ResNet 第八讲 图像检索1、检索特征(基于颜色,纹理,形状,局部特征)2、特征相似度度量(EMD)3、建立基于深度学习的检索索引4、知识点:迁移学习的一种实现(fine-tune)5、索引加速:KD-tree6、大数据条件下的索引加速:Locality Sensitive Hash7、应用案例:CBIR的应用 第九讲 目标检测(上)1、目标检测任务概述2、区域卷积神经网络:R-CNN3、共享卷积层与多尺度:SPP-Net4、多任务的目标函数:Fast R-CNN5、SS改成RPN:Faster R-CNN6、其他数据集介绍:行人检测、人脸检测7、应用案例:Faster R-CNN 第十讲 目标检测(下)1、之前方法的总结2、ROI-wise子网继续共享:R-FCN3、回归解决一切:YOLO v14、八大改进:YOLO v25、构建语义树:YOLO 90006、多尺度预测:YOLO v37、应用案例:Darknet实现的YOLO 第十一讲 通用场景下的图像分割1、语义分割2、全卷积网络语义分割:FCN3、知识点:反卷积、转置卷积与空洞(膨胀)卷积4、DeepLab v1(含CRF)5、DeepLab v2(多尺度)6、DeepLab v3与v3+(多尺度级联)7、PASCAL VOC、MS COCO、Cityscapes等数据集介绍8、应用案例:DeepLab、denseCRF 第十二讲 医疗影像分割1、医学影像分析任务概述与数据集2、U-Net3、3D U-NET与V-Net4、FC-DenseNet5、病理切片分析任务概述与数据集6、病理切片分析的实现7、应用案例:利用U-Net实现的器官分割 第十三讲 图像描述(图说)1、深度学习的语言模型(RNN)2、知识点介绍;LSTM与GRU3、图说模型原理与结构4、模型增强:注意力机制5、图说效果的评判标准6、数据集介绍(MS COCO, Flickr等)7、应用案例:RNN简单示例,图像描述:show and Tell 第十四讲 图像生成1、变分自编码器(VAE)2、生成对抗网络(GAN)3、知识点:KL散度与JS散度4、改进的GAN:DCGAN5、从根本上解决训练的困难:Wasserstein GAN6、超分辨率问题:SRGAN7、应用案例:GAN与DCGAN等
• 叶梓:计算机视觉
【课程对象】理工科本科及以上,且至少了解一门编程语言。 【课程大纲】(培训内容可根据客户需求调整)时间内容案例实践与练习Day1上午准备工作 准备工作决策树准备工作(1)概念与术语Python(Anaconda)的安装Pycharm的安装与使用Jupyter Notebook的安装与使用Tensorflow与pytorch的安装Opencv、Sklearn工具包的运用 Python开发简介(2)Python的基本语法引入外部包常用的数据结构定义函数Python中的面向对象编程文件读写 决策树(3)分类和预测熵减过程贪心法ID3与C4.5其他改进方法决策树剪枝案例实践:Anaconda安装Pip install的技巧Tensorflow-GPU的安装pytorch的安装Jupyter Notebook的使用Opencv的基本例子Day1下午基础模型 聚类BP神经网络性能评价指标聚类(4)监督学习与无监督学习K-meansk-medoids判断最优聚类个数的调参方法基于层次、密度、网格的方法 BP神经网络 (5)人工神经元及感知机模型Sigmoid激活函数前向神经网络的架构梯度下降误差反向传播详解 性能评价指标(6)精确率;P、R与F1ROC与AUC对数损失泛化性能评价:k折验证验证案例实践:验证一下:聚类算法是不稳定的手肘法分析NBA球队的最佳聚类个数各种聚类方式的图形化展示皮马印第安人糖尿病风险:验证多种模型绘制ROC并计算AUC手算神经网络BP算法只用numpy,手推BPNNDay2上午深度学习基础 支持向量机集成学习 支持向量机 (1)“双螺旋”问题基本模型与惩罚项求解对偶问题核函数:映射到高维从二分类到多分类用于连续值预测的支持向量机 集成学习(2)bagging与boostingRFGBDTXgboost最新的模型案例实践:SVM实现人脸识别应用通过深度BP网络实现手写数字的识别各种梯度下降方法的实战效果Batch normalization的实战效果Day2下午深度学习 深度学习基础知识图像分类CNN深度学习基础知识(3)连接主义的兴衰深度学习与神经网络的区别与联系目标函数与激励函数学习步长权重初始化权重衰减(Weight Decay)梯度下降的方法:Adagrad \ RMSprop \ Adam避免过适应 图像分类CNN(4)图像分类概述AlexNetZF-Net卷积层的误差反向传播池化层的误差反向传播VGG(5层变为5组)迁移学习GoogLenet和Inception模块模型退化与ResNetDenseNet(充分利用特征)最新的efficientnet 案例实践:VGG各层的可视化展现迁移学习:识别猫和狗Resnet用于图像分类Day3上午目标检测 二阶段目标检测与一阶段目标检测 二阶段目标检测(1)目标检测项目介绍R-CNNSPPNET(全图卷积、SPP层)Fast-RCNN(多任务)Faster-RCNN(RPN) 一阶段目标检测(2)YOLO-v1(一切都是回归)YOLO -v2(9000)YOLO -v3(多尺度)YOLO -v4YOLO -v5  案例实践:基于Faster-RCNN的通用目标检测示例基于YOLO v3的通用目标快速检测示例 Day3下午深度学习进阶 图像分割人体姿态识别与GAN 图像分割(3)全卷积网络(FCN)上采样的三种实现方式膨胀卷积CRFDeepLab V1~V3 人体姿态识别(4)早期人体姿态识别AlphaPoseOpenPoseRMPE GAN(5)生成对抗网络(GAN)KL散度与JS散度改进的GAN:DCGAN加上约束:infoGAN根本上解决:Wasserstein GAN案例实践:DeepSOCIALRMPE的演示 

添加企业微信

1V1服务,高效匹配老师
欢迎各种培训合作扫码联系,我们将竭诚为您服务