让一部分企业先学到真知识!

叶梓:大数据与人工智能

叶梓老师叶梓 注册讲师 450查看

课程概要

培训时长 : 1天

课程价格 : 扫码添加微信咨询

课程分类 : 数据分析

课程编号 : 10010

面议联系老师

适用对象

课程介绍

(一)统计分析、数据仓库与可视化表达

  1. 综述(大数据、人工智能、数据挖掘、机器学习:这些词的确切含义)
  2. 假设检验:“小数据”时代是怎么玩的?
  3. “回归”是数据挖掘算法吗?
  4. 度量、指标与维度
  5. 星型模型与雪花模型
  6. 下钻与上卷
  7. 数据仓库的应用案例
  8. 图表该怎么画才对?

 

(二)大数据相关技术综述

  1. hadoop:HDFS、Map-Reduce、Hbase、Hive、sqoop、pig、oozie等
  2. spark:scala、spark-SQL、spark-Streaming等
  3. 搜索引擎:lucene(solr)、ES
  4. 并发的机器学习工具:R-hadoop、spark-MLLIB、 spark-R、pyspark

 

(三)存储在hbase中的数据

  1. NoSQL(key-value)
  2. Hbase:安装
  3. 行键与列簇
  4. 如何利用Hbase的特点存储行业数据
  5. 应用程序如何访问Hbase中的数据
  6. 数据迁移工具:sqoop
  7. Hbase的应用场景

 

(四)Hive:为SQL开发者留的活路

  1. Hive:安装(单用户与多用户)
  2. Hive:基本操作
  3. Hive:与典型的关系型数据库的区别
  4. 存储业务数据时的注意点
  5. 如果“想慢”,你还可以这样…(不恰当使用hive的案例介绍)
  6. Hive的应用场景

 

(六)Spark各组件的应用

  1. Hadoop最大的特点是什么?
  2. Spark概述与安装
  3. Scala:你可以一直“点”下去
  4. RDD:“映射”、“转换”解决一切
  5. spark-SQL
  6. spark-streaming
  7. spark-graphX
  8. spark-MLLIB
  9. 应用场景

 

(七)机器学习-1

  1. 数据挖掘、知识发现与机器学习
  2. 工具:(早期)SPSS、SAS;
  3. 目前流行的工具R、Python等
  4. 决策树(熵、贪心法、连续的和离散的)
  5. 聚类(k-means、k-medoid)
  6. 监督学习、无监督学习的差异
  7. 机器学习性能评价指标

 

(八)机器学习-2

  1. KNN
  2. 关联规则(频繁项集、Apriori、支持度、置信度、提升度)
  3. 神经网络(神经元、激励函数、前馈神经网络的BP算法)
  4. SVM(最大间隔、核函数、多分类的支持向量机)

 

(九)机器学习-3

  1.  “概率派”与“贝叶斯派”
  2. 朴素贝叶斯模型(皮马印第安人患糖尿病风险预测)
  3. 极大似然估计与EM算法
  4. HMM(三个基本问题:评估、解码、学习)

 

(十)机器学习-4

  1. 遗传算法 (交叉、选择、变异,“同宿舍”问题)
  2. 无监督学习
  3. 集成学习(adaboost、RF)
  4. 强化学习

 

(十一)深度学习-1

  1. 连接主义的兴衰
  2. 地形要更陡:改进的目标函数
  3. 0.9的100次方等于几?克服梯度消散的方法(改进的激励函数、BN)
  4. 利用“惯性”下山:改进的优化算法(Adagrad、RMSprop、Adam)
  5. 防止“大锅饭”:dropout
  6. 记忆的关键是“合理的忘记”:weight decay

 

(十二)深度学习-2

  1. 让AI理解图像:典型CNN
  2. 各种CNN
  3. 让AI理解语言:RNN与LSTM、GRU
  4. 左右互搏术:GAN
  5. 电子游戏的新玩法:DQN

叶梓老师的其他课程

• 叶梓:大数据提纲
课时一:概念综述大数据的定义由来和原因大数据的6V特征从数据库,数据仓库到大数据大数据相关技术和处理 课时二:Hadoop生态圈、spark生态圈、搜索引擎概述hadoop:HDFS、Map-Reduce、Hbase、Hive等spark:scala、spark-SQL、spark-Streaming等搜索引擎:lucene(solr)、ES并发的机器学习工具:R-hadoop、spark-MLLIB、 spark-R、pyspark 课时三:存储在hbase中的数据NoSQL(key-value)Hbase:安装行键与列簇如何利用Hbase的特点存储数据应用程序如何访问Hbase中的数据数据迁移:sqoopHbase的应用场景 课时四:Hive:为用SQL的开发者留的活路Hive:安装(单用户与多用户)Hive:基本操作Hive:与典型的关系型数据库的区别如果“想慢”,你可以这样…(不恰当使用hive的案例介绍)Hive的应用场景 课时五:Spark各组件在卫生领域的应用Hadoop最大的特点是什么?Spark概述与安装Scala:你可以一直“点”下去RDD:“映射”、“转换”解决一切spark-SQLspark-streamingspark的其他组件应用场景 课时六:机器学习算法介绍—I综述(人工智能、数据挖掘、机器学习、机器智能、大数据:这些词的确切含义)监督学习、无监督学习与强化学习工具:R、Python等决策树详解(熵、贪心法、连续的和离散的)神经网络详解(神经元、激励函数、前馈神经网络的BP算法,其他神经网络) 课时七:机器学习算法介绍—II关联规则详解(频繁项集、Apriori、支持度、置信度)聚类详解(k-means、k-medoid)常见算法的简述(Naïve-Bayes、k-NN、HMM、SVM等)
• 叶梓:Python深度学习与知识图谱培训 (进阶部分)
【课程简介】人工智能的浪潮正在席卷全球,各种培训课程应运而生,但真正能让学员系统、全面掌握知识点,并且能学以致用的实战课程并不多见。本课程包含深度学习、知识图谱的重要概念及常用算法(目标检测、图像分割、自然语言处理、RNN、知识图谱、GAN等),以及人工智能领域当前的热点。通过3天的系统学习、案例讲解和动手实践,让学员能初步迈入深度学习和知识图谱的知识殿堂。【课程收益】掌握Python开发技能;掌握深度学习工具:TensorFlow、Keras、pytorch等;掌握深度学习的理论与实践;掌握知识图谱基本知识;为学员的后续项目应用提供针对性的建议。【课程特点】本课程力图理论结合实践,强调从零开始,重视动手实践;课程内容以原理讲解为根本,以应用落地为目标。课程通过大量形象的比喻和手算示例来解释复杂的机器学习理论,既能将原理充分讲懂讲透,也避免了繁复而枯燥的公式推导。【课程对象】计算机相关专业本科;或理工科本科,且至少熟悉一门编程语言。【主讲专家】叶梓,博士、高级工程师。2005年上海交通大学计算机专业博士毕业,主研方向为数据挖掘、机器学习、人工智能等。现为某大型上市软件企业的人工智能团队技术负责人。在大数据、人工智能应用等方面有着丰富的工程实践经验。先后在SCI或EI期刊上发表论文4篇,在中文核心期刊上发表论文近20篇,并被百度学术收录。【学员基础】具备初步的IT基础知识【课程大纲】(培训内容可根据客户需求调整)时间内容案例实践与练习Day4上午目标检测 二阶段目标检测目标检测项目介绍R-CNNSPPNET(全图卷积、SPP层)Fast-RCNN(多任务)Faster-RCNN(RPN) 一阶段目标检测(2)SSDYOLO-v1(一切都是回归)YOLO -v2(9000)YOLO -v3(多尺度)YOLO -v4YOLO -v5 案例实践:基于Faster-RCNN的通用目标检测示例血常规分析 案例实践:基于YOLO v3的通用目标快速检测示例基于YOLO v4的疫情防控系统Day4下午图像分割与NLP初步 图像分割(3)全卷积网络(FCN)上采样的三种实现方式膨胀卷积HMM与CRFDeepLab V1~V3 自然语言处理初步(2)语言模型Bi-Gram与N-Gram机械分词与统计分词词性标注命名实体识别情感分析DeepLab:遥感地图分析 Day5上午RNN与W2V  循环神经网络(1)RNN基本原理LSTM、GRU双向循环神经网络编码器与解码器结构seq2seq模型AttentionNIC模型 词向量(3)W2V:CBOWW2V:skip-gramW2V:Hierachical SoftmaxW2V:Negative Sampling 案例实践:股票交易数据的预测;藏头诗生成;《绝代双骄》中,谁和小鱼儿最相似?SnowNLP:褒义的中性词Word2vec代码解读 Day5下午预训练模型基础 Transformer所有你需要的仅仅是“注意力”Transformer中的block自注意力机制多头注意力位置编码(抛弃RNN)Batch Norm与Layer Norm解码器的构造 BERTBERT整体架构Masked-LMNext Sentence Prediction改造下游任务WordPiece作为输入哪些改进起作用? 案例实践:手推TransformerBERT代码解读BERT下游任务的改造 Day6上午知识图谱概念 知识图谱基础概念知识推理本体推理方法本体推理工具语义搜索RDF与RDFSOWL与OWL2 知识图谱存储Neo4j开发环境部署Neo4j-可视化操作Neo4j-CQL语法基础Neo4j-完整案例操作实战Neo4j系统管理Python与Neo4j的集成 实践:Neo4j的安装Neo4j的基本操作 Day6下午知识图谱存储 知识图谱自动抽取实体消歧与链接知识图谱表示学习基于深度学习的实体识别基于深度学习的属性链接知识问答系统基于知识图谱问答系统 GAN生成对抗网络(GAN)KL散度与JS散度改进的GAN:DCGAN加上约束:infoGAN根本上解决:Wasserstein GAN 实践:Python与Neo4j的集成知识抽取的DL模型完整的基于KG的问答系统(KBQA)计算机想象的数字特朗普的孩子查无此人【授课环境】讲课环境要能上网
• 叶梓:Python深度学习与知识图谱培训 (基础部分)
【课程简介】人工智能的浪潮正在席卷全球,各种培训课程应运而生,但真正能让学员系统、全面掌握知识点,并且能学以致用的实战课程并不多见。本课程包含基于python的数据分析、深度学习的重要概念及常用算法(决策树、关联规则、聚类、贝叶斯网络、神经网络、支持向量机、隐马尔科夫模型、遗传算法、CNN等),以及人工智能领域当前的热点。通过3天的系统学习、案例讲解和动手实践,让学员能初步迈入机器学习、深度学习的知识殿堂。【课程收益】掌握Python开发技能;掌握深度学习工具:TensorFlow、Keras、pytorch等;掌握基于python的数据分析知识;掌握数据挖掘与机器学习进阶知识;掌握深度学习的基础理论与实践;【课程特点】本课程力图理论结合实践,强调从零开始,重视动手实践;课程内容以原理讲解为根本,以应用落地为目标。课程通过大量形象的比喻和手算示例来解释复杂的机器学习理论,既能将原理充分讲懂讲透,也避免了繁复而枯燥的公式推导。【课程对象】计算机相关专业本科;或理工科本科,且至少熟悉一门编程语言。【主讲专家】叶梓,博士、高级工程师。2005年上海交通大学计算机专业博士毕业,主研方向为数据挖掘、机器学习、人工智能等。现为某大型上市软件企业的人工智能团队技术负责人。在大数据、人工智能应用等方面有着丰富的工程实践经验。先后在SCI或EI期刊上发表论文4篇,在中文核心期刊上发表论文近20篇,并被百度学术收录。【学员基础】具备初步的IT基础知识【课程大纲】(培训内容可根据客户需求调整)时间内容案例实践与练习Day1上午基于python的实验环境 实验环境搭建anaconda包的安装pip install的技巧通过anaconda配置多个环境Jupyter Notebook的使用绘图工具包matplotlibopencv的安装Tensorflow的安装Pytorch的安装paddlepaddle的安装 案例实践:python安装opencv安装与验证Tensorflow安装与验证Pytorch安装与验证paddlepaddle安装与验证 Day1下午Python基础 Python开发概述Python的基本语法引入外部包常用的数据结构定义函数Python中的面向对象编程文件读写访问数据库 数据预处理数据清理规范化无标签时:PCA有标签时:Fisher线性判别数据压缩(DFT、小波变换) 回归与时序分析线性回归非线性回归logistics回归 案例实践: 元组、列表、字典、集合PCA的实验DFT的实验回归的实验Day2上午基于python的数据分析 决策树模型分类和预测熵减过程与贪心法ID3C4.5其他改进方法决策树剪枝 聚类监督学习与无监督学习K-means与k-medoids层次的方法基于密度的方法基于网格的方法孤立点分析 案例实践:决策树的实验鸢尾花数据的聚类手肘法分析NBA球队的最佳聚类个数各种聚类方式的图形化展示 Day2下午基于python实现的经典算法 关联规则频繁项集支持度与置信度提升度Apriori性质连接与剪枝 性能评价指标(5)精确率;P、R与F1ROC与AUC对数损失泛化性能评价:k折验证验证 案例实践:超市购物篮——关联规则分析皮马印第安人患糖尿病的风险Day3上午深度学习基础 BP神经网络人工神经元及感知机模型Sigmoid激活函数前向神经网络的架构梯度下降误差反向传播详解 支持向量机“双螺旋”问题基本模型与惩罚项求解对偶问题核函数:映射到高维从二分类到多分类用于连续值预测的支持向量机 案例实践:皮马印第安人糖尿病风险:验证多种模型绘制ROC并计算AUC手算神经网络BP算法只用numpy,手推BPNNSVM实现人脸识别应用  Day3下午深度学习基础与CNN 深度学习基础连接主义的兴衰深度学习与神经网络的区别与联系目标函数与激励函数学习步长权重初始化权重衰减(Weight Decay)梯度下降的方法:Adagrad \ RMSprop \ Adam避免过适应 图像分类CNN图像分类概述AlexNet与ZF-NetVGG(5层变为5组)迁移学习GoogLenet和Inception模块模型退化与ResNetDenseNet(充分利用特征)最新的efficientnet 案例实践:通过深度BP网络实现手写数字的识别各种梯度下降方法的实战效果Batch normalization的效果 案例实践:VGG各层的可视化展现迁移学习:猫狗大战Resnet用于图像分类【授课环境】讲课环境要能上网

添加企业微信

1V1服务,高效匹配老师
欢迎各种培训合作扫码联系,我们将竭诚为您服务