【课程内容】
本课程包含大数据、机器学习、深度学习、知识图谱、强化学习与深度强化学习的相关知识。
【课程时长】
7天(7小时/天)
【课程对象】
理工科本科及以上,且至少了解一门编程语言。
【课程大纲】(培训内容可根据客户需求调整)
时间 | 内容 | 案例实践与练习 |
Day1上午 准备工作 | 准备工作 1.概念与术语 2.Python(Anaconda)的安装 3.Pycharm的安装与使用 4.Jupyter Notebook的安装与使用 5.Tensorflow与pytorch的安装 6.Opencv、Sklearn工具包的运用
贪婪决策过程 1.熵与熵减过程 2.贪婪法 3.ID3与C4.5 4.其他改进方法 5.决策树剪枝 | 案例实践: 1.Anaconda安装 2.Pip install的技巧 3.Tensorflow-GPU的安装 4.pytorch的安装 5.Jupyter Notebook的使用 6.Opencv的基本例子 |
Day1下午 经典模型 | 经典无监督学习 1.监督学习与无监督学习 2.K-means 3.k-medoids 4.判断最优分组个数的调参方法 5.基于层次、密度、网格的方法
BP神经网络 1.人工神经元及感知机模型 2.Sigmoid激活函数 3.前向神经网络的架构 4.梯度下降 5.误差反向传播详解
性能评价指标 1.精确率; 2.P、R与F1 3.ROC与AUC 4.对数损失 5.泛化性能评价:k折验证验证 | 案例实践: 1.验证:K-means是不稳定的 2.手肘法分析NBA球队的档次 3.绘制ROC并计算AUC 4.手算神经网络BP算法 5.只用numpy,手推BPNN
|
Day2上午 进阶模型 | 支持向量机 1.“双螺旋”问题 2.基本模型与惩罚项 3.求解对偶问题 4.核函数:映射到高维 5.从二分类到多分类 6.用于连续值预测的支持向量机
集成学习 1.集成学习的思路 2.bagging与boosting 3.随机森林 4.GBDT 5.XGboost 6.最新的集成学习算法
| 案例实践: 1.SVM实现人脸识别应用 2.通过深度BP网络实现手写数字的识别 3.皮马印第安人糖尿病风险 4.Xgboost、GBDT等方法的比较
|
Day2下午 深度学习初步 | 深度学习基础知识 1.连接主义的兴衰 2.深度学习与NN的区别与联系 3.目标函数与激励函数 4.学习步长 5.权重初始化 6.权重衰减(Weight Decay) 7.各种梯度下降的方法 8.避免过适应
卷积神经网络CNN 1.CNN概述 2.AlexNet与ZF-Net 3.VGG(5层变为5组) 4.迁移学习 5.GoogLenet和Inception模块 6.模型退化与ResNet
| 案例实践: 1.各种梯度下降方法的实战效果 2.VGG各层的可视化展现 3.迁移学习:猫狗大战 4.Resnet用于分类
|
Day3上午 目标检测 | 二阶段目标检测 1.目标检测任务介绍 2.R-CNN 3.SPPNET(全图卷积、SPP层) 4.Fast-RCNN(多任务) 5.Faster-RCNN(RPN)
一阶段目标检测 1.YOLO-v1(一切都是回归) 2.YOLO-v2(9000个分类) 3.YOLO-v3(多尺度) 4.YOLO-v4 5.YOLO-v5
| 案例实践: 1.基于Faster-RCNN的通用目标检测 2.改造成“血细胞识别”系统 3.基于YOLO v3的通用目标快速检测
|
Day3下午 图谱技术准备-I | 循环神经网络
词向量初步 1.Word2Vec:CBOW 2.Word2Vec:skip-gram 3.Hierachical Softmax 4.Negative Sampling 5.其他词向量技术
|
案例实践: 1.RNN的基础实践 2.股票交易数据的预测 3.《绝代双骄》人物关系分析
|
Day4上午 图谱技术准备-II | 隐马尔科夫模型 1.HMM形式化定义 2.向前向后算法解评估问题 3.Viterbi算法处理解码问题 4.鲍姆韦尔奇算法解学习问题
条件随机场
| 案例实践: 1.出现这种情况可能吗? 2.今天身体怎么样? 3.DenseCRF获得精细的轮廓 |
Day4下午 知识图谱基础 | 知识图谱基础 1.知识图谱基本概念 2.知识图谱的发展史 3.实体的属性与关系 4.知识图谱的相关技术介绍 5.典型应用案例
词向量进阶(Transformer) 1.所有你需要的仅仅是“注意力” 2.Transformer中的block 3.自注意力机制 4.多头注意力 5.位置编码(抛弃RNN) 6.Batch Norm与Layer Norm 7.解码器的构造 | 案例实践: 1.Neo4j工具的使用 2.知识图谱项目展示 3.Transformer实现的机器翻译 |
Day5上午 知识图谱进阶 | 知识抽取 1.实体抽取 2.关系抽取 3.事件抽取 4.知识抽取及其相关工具 5.实体消歧与链接 6.知识规则挖掘 7.知识图谱表示学习
基于知识图谱的问答 1.知识问答技术概述 2.知识问答系统简史 3.知识问答的评测数据集 4.KBQA基本概念及挑战 5.知识问答主流方法介绍 | 案例实践: 1.实体关系抽取案例 2.基于图谱的领域问答 |
Day5下午 强化学习
| 强化学习初步 1.agent的属性 2.马尔科夫奖励/决策过程 3.exploration and exploitation 4.状态行为值函数 5.Bellman期望方程 6.最优策略
强化学习经典方法 1.策略迭代与价值迭代 2.动态规划法:DP 3.蒙特卡洛法:MC 4.时序差分法:TD 5.DP、MC、TD的关系
| 案例实践: 1.财宝在右 2.格子世界 3.谷底的小车 4.倒立摆
|
Day6上午 深度强化学习 | 深度强化学习(DQN) 1.值函数的参数化表示 2.值函数的估计过程 3.基础的DQN 方法 4.Double DQN 5.Prioritized Replay 6.Dueling Network
深度强化学习(PG) 1.策略梯度方法介绍 2.常见的策略表示 3.减小方差的方法 4.引入基函数与修改估计值函数
| 案例实践: 1.自我进化的井字棋 2.笨鸟先飞:DQN |
Day6下午 深度强化学习 | AlphaGo 1.围棋AI的难点 2.MCTS 3.策略网络 4.价值网络 5.Alpha Go的完整架构 6.Alpha Go zero
Actor-Critic算法 1.随机策略与确定性策略比较 2.随机策略AC的方法 3.确定性策略梯度方法 4.DDPG 方法及实现 5.A3C方法
| 案例实践: 1.山寨版alpha go 2.Actor-Critic的应用场景 |
Day7上午 大数据技术 | 大数据技术综述 1.从数据库,数据仓库到大数据 2.大数据的6V特征 3.Hadoop生态圈简介 4.Spark生态圈简介 5.搜索引擎:ES
hadoop 1.文件系统:HDFS 2.计算框架Map-Reduce 3.数据库Hbase 4.数据仓库Hive 5.数据迁移:sqoop
| 案例实践: 1.Hadoop集群的操作 2.Hbase的操作
|
Day7下午 大数据及其他 | Spark 1.scala 2.RDD 3.数据库操作:spark-SQL 4.流操作:spark-Streaming
GAN 1.生成对抗网络(GAN) 2.KL散度与JS散度 3.改进的GAN:DCGAN 4.Wasserstein GAN | 案例实践: 1.spark集群的演示 2.计算机想象的数字 3.特朗普的孩子? |