让一部分企业先学到真知识!

刘晖:SPSS数据统计分析课程

刘晖老师刘晖 注册讲师 306查看

课程概要

培训时长 : 2天

课程价格 : 扫码添加微信咨询

课程分类 : 工作技能

课程编号 : 17573

面议联系老师

适用对象

相关人员

课程介绍

【课程收益】

  1. 认识和应用SPSS最新统计分析软件
  2. 掌握SPSS软件及技术原理
  3. 学会运用统计方法解决工作和学习中的实际问题
  4. 提高SPSS软件的运用能力,解决工作中的实际问题
  5. 如何在SPSS中完成数据的统计描述和参数估计,以及如何使用统计图表来进行数据的完美呈现

【课程特色】

1.   课上采用案例式教学,通俗易懂,课下一对一辅导强化训练,学与练交叉进行强化记忆,你所要做的就是认真听,勤于问,乐于练。

2.   清晰的知识结构,根据应用经验采用最优化授课模式。

3.   内容充沛、详略得当,前后呼应。

4.   讲师资历丰富,具有丰富的实践经验。

5.   知识讲授+贴身案例+场景故事+互动讨论+现场演练+落地跟踪

根据课程提供相应的练习数据,实现边学编练,以实践为主线掌握相应的知识体系。

【课程对象】相关人员

【课程时间】2天(6小时/天)需要上机操作

【课程大纲】

第一部分 数据管理与软件入门

一、数据分析概述与软件入门

  1. SPSS软件概述
  2. SPSS的安装
  3. SPSS操作入门
  1. SPSS软件的启动与退出
  2. SPSS的5个窗口
  3. SPSS的4种运行方式
  4. SPSS的4种结果输出
  1. 数据分析概述
  1. 数据分析方法论介绍
  2. SPSS系列产品对数据分析流程的支持

二、数据录入与数据获取

  1. 数据格式概述
  2. 数据的直接录入
  3. 外部数据的获取
  1. 电子表格数据如何导入 SPSS中
  2. 文本数据如何导入 SPSS中
  3. 数据库格式数据如何导入SPSS中
  1. 数据的保存
  1. 存为 SPSS格式
  2. 存为其他数据格式

三、数据管理

  1. 变量级别的数据管理
  1. 计算新变量
  2. 对变量值进行分组合并
  3. 连续变量的可视化分段
  4. 将字符变量转换为数值变量
  5. 变量的编秩
  1. 文件级别的数据管理
  1. 记录排序
  2. 记录拆分
  3. 记录筛选
  4. 记录加权
  5. 数据汇总
  6. 数据字典的定义与应用
  7. 查找重复记录
  8. 数据文件的重新排列与转置
  9. 多个数据文件的合并

第二部分 统计描述与统计图表

一、连续变量的统计描述与参数估计

  1. 连续变量的统计描述概述
  1. 统计描述中可用的工具
  2. 连续变量的统计描述指标体系
  3. SPSS中的相应功能
  1. 集中趋势的描述指标
  1. 算术均数
  2. 中位数
  3. 其他集中趋势描述指标
  1. 离散趋势的描述指标
  1. 全距
  2. 方差和标准差
  3. 百分位数、四分位数与四分位数间距
  4. 变异系数
  1. 连续变量统计描述实例
  2. 连续变量的参数估计
  1. 正态分布
  2. 参数的点估计
  3. 参数的区间估计

二、分类变量的统计描述与参数估计

  1. 分类变量的统计描述概述
  2. 分类变量统计描述实例
  3. 多选题的统计描述
  4. 分类变量的参数估计

三、数据的报表呈现

  1. SPSS报表概述
  2. 表格入门
  3. 用 OriginalTables模块制表
  4. 用 CustomTable模块自由制表
  5. 表格的编辑
  6. 表格高级应用技术

四、数据的图形展示

  1. 统计图概述
  2. 直方图与茎叶图
  3. 箱图
  4. 饼图
  5. 条图
  6. 线图
  7. 散点图
  8. 其他统计图
  9. 交互式统计图的编辑
  10. SPSS绘图中的注意事项

第三部分 常用假设检验方法

一、分布类型的检验

  1. 假设检验的基本思想
  2. 正态分布检验
  3. 二项分布检验
  4. 游程检验

二、连续变量的统计推断-t检验

  1. t检验基础
  2. 样本均数与总体均数的比较
  3. 成组设计两样本均数的比较
  4. 配对设计样本均数的比较

三、连续变量的统计推断-单因素方差分析

  1. 方差分析入门
  1. 为什么要进行方差分析
  2. 方法原理
  3. 单因素方差分析的应用条件
  4. 单因素方差分析的 SPSS实现
  1. 均数间的多重比较
  1. 直接校正检验水准
  2. 专用的两两比较方法
  3. 两两比较方法的选择策略
  4. 多重比较结果出现矛盾时的解释
  5. 分析实例
  1. 各组均数的精细比较
  1. 方法原理
  2. 分析实例
  3. 事先计划的比较
  1. 组间均数变化的趋势检验

四、有序分类变量的统计推断-非参数检验

  1. 非参数检验概述
  1. 非参数检验的意义
  2. 非参数检验预备知识
  1. 两个配对样本的非参数检验
  1. 方法原理
  2. 分析实例
  3. 确切概率的计算
  1. 两个独立样本的非参数检验
  1. Mann-WhitneyU检验
  2. 分析实例
  3. 其他两样本非参数检验方法
  1. 多个独立样本的非参数检验
  1. 方法原理
  2. 分析实例
  3. 多个样本的两两比较
  1. 多个相关样本的非参数检验
  1. Friedman检验
  2. 分析实例
  3. Kendall协和系数检验与Cochran检验
  1. 秩变换分析方法
  1. 原理简介
  2. 应用实例

五、无序分类变量的统计推断-χ2检验

  1. χ2 检验基础
  2. 拟合问题-样本率与已知总体率的比较
  1. 分析实例
  2. 检验方法的 SPSS实现
  3. 单样本χ2检验的其他话题
  1. 相关问题- 两(多)个率或构成比的比较
  1. 分析实例
  2. 检验方法的 SPSS实现
  3. 多样本 χ2检验的其他话题
  1. 两分类变量间关联程度的度量
  2. 一致性检验与配对χ2 检验
  3. 分层χ2检验

六、相关分析与回归分析

  1. 相关分析简介
  2. 简单相关分析
  3. 偏相关分析
  4. Distances过程
  5. 简单回归分析

刘晖老师的其他课程

• 刘晖:Python自动化办公
【课程特色】1.   课上采用案例式教学,通俗易懂,课下一对一辅导强化训练,学与练交叉进行强化记忆,你所要做的就是认真听,勤于问,乐于练。2.   清晰的知识结构,根据应用经验采用最优化授课模式。3.   内容充沛、详略得当,前后呼应。4.   讲师资历丰富,具有丰富的实践经验。5.   知识讲授+贴身案例+场景故事+互动讨论+现场演练+落地跟踪【课程对象】相关人员【课程时长】3天(6小时/天)【课程大纲】第1章  走进Python编程1.1  搭建编程环境1.2  在Windows系统中搭建Python编程1.3  在OS X系统中搭建Python编程1.4  在Linux系统中搭建Python编程第2章  变量和简单数据类型2.1  变量2.2  字符串2.3  数字2.4  数据类型转化与运算2.5  代码注释第3章  程序控制结构3.1  分支结构3.2 for计数循环3.3 while条件循环 3.4  停止和跳出循环第4章  序列中的列表4.1  列表的概念 4.2  列表的基本操作4.3  列表分片4.4  列表排序第5章  序列中的元组5.1  认识元组5.2  元组的基本操作5.3  使用元组的方法第6章  序列中的字典6.1  认识字典6.2  字典的基本操作6.3  遍历字典6.4  字典嵌套第7章  Python工具之函数7.1  函数的基本认识和用法7.2  函数的特性7.3  函数的作用域第8章  类与对象8.1  类与对象的初级认识8.2  类与对象的进阶8.3  类与对象之继承8.4  类的三大特性第9章  程序的异常9.1  错误与异常9.2  异常的处理第10章  文件操作10.1 读取文件10.2 写入文件10.3 文件读写之应用第11章  文件办公自动化与AI应用11.1 os模块入门11.2 os模块进阶11.3 文字数据处理11.4 AI智能应用功能第12章  Excel操作的自动化12.1 xlrd库的介绍和安装12.1.1 xlrd库简介12.1.2 安装xlrdD三方库12.1.3 安装过程的问题处理 12.2 xlrd库的使用12.2.1 打开Excel工作表对象12.2.2 数据读取单个单元格12.2.3 数据读取多个单元格12.2.4 Excel工作表写入单个数据12.2.5 Excel工作表写入多个数据12.2.6 Excel工作表数据复制第13章  Excel格式控制13.1 设置列宽行高13.2 设置表的风格样式13.2.1 风格样式属性13.2.2 设定风格样式13.3 设置字体属性13.4 设置边界属性13.5 设置对齐属性13.6 设置模式属性13.7 合并单元格第14章  Excel自动建表实战14.1 自动化建表应用场景14.2 表格数据分析14.3 数据格式整理14.4 数据写入到表格 14.5 追加数据到表格 14.6 设置风格样式14.7 封装风格样式第15章  让Excel自动处理飞起来15.1 xlwings库的介绍和安装15.1.1 什么是xlwings模块15.1.2 安装xlwingsD三方库15.2 xlwings库初体验15.2.1 与Excel工作簿建立连接15.2.2 相对路径和JD路径15.2.3 获取单元格数据15.2.4 工作簿文件的保存15.3 xlwings库J速入门15.3.1 xlwings库结构分析15.3.2 实例化应用15.3.3 创建工作簿对象15.3.4 创建工作表对象15.4 xlwings库常用的API(1)15.4.1 了解API 15.4.2 工作表常用的API 15.4.3 单元格常用的API 15.5 xlwings库常用的API(2)15.5.1 获取表格有效区 15.5.2 工作表中的函数15.6 xlwings库的拓展API 15.6.1 设定字体样式 15.6.2 设定边界属性 15.6.3 设定对齐属性 第16章  Excel自动化处理实战16.1 超市扫码记账系统案例16.1.1 案例简介 16.1.2 文件的打包 16.1.3 exe文件图标设计 16.2 工作簿数据筛选16.2.1 案例思路分析16.2.2 模拟数据实现16.2.3 实现数据筛选第17章  Word文档的自动化操作17.1 安装Python-docxD三方库17.2 创建Word文档17.2.1 创建空白Word文档 17.2.2 添加标题、段落和分页符17.3 设置Word中图片和字体17.3.1 操作图片 17.3.2 设置文档字体 17.4 合并多个文本文件到Word17.5 Word中插入表格第18章  加载源Word文档的操作18.1 加载源Word文档18.2 学生在校证明模板渲染案例第19章  Word模板渲染19.1 docxtpl简介19.2 学生通知书渲染案例第20章  Word文档操作案例20.1 拆分Word文档 20.2 合并Word文档 第21章  PPT文件的自动化操作21.1 Python-pptx模块简介 21.1.1 安装Python-pptx库 21.1.2 创建PPT文件 21.2 PPT相关简介 21.2.1 PPT母版与PPT幻灯片 21.2.2 PPT层次结构 21.2.3 占位符 21.3 幻灯片相关操作21.3.1 操作文本框 21.3.2 添加段落 21.3.3 添加图片 21.3.4 添加表格 21.3.5 添加形状 21.4 模板渲染 21.5 四种基本图形 21.5.1 折线图 21.5.2 柱形图 21.5.3 饼图和条形图 21.6 删除指定页 第22章  邮件处理自动化操作22.1 安装yagmail、keyringD三方库22.2 关于邮箱POP3和SMTP协议22.2.1 POP3和SMTP简介 22.2.2 开启POP3和SMTP协议 22.3 发送邮件22.3.1 发送DY封邮件 22.3.2 添加图片或链接 22.3.3 群发邮件 22.4 添加附件和定时器 22.4.1 添加附件 22.4.2 设置定时器 22.5 读取邮件 22.5.1 读取所有邮件 22.5.2 查看不同类型的邮件 22.6 删除邮件 第23章  Web的自动化操作 23.1 Selenium模块简介 23.1.1 Selenium是什么 23.1.2 安装及环境配置 23.1.3 自动加载百度页面 23.2 数据解析提取 23.2.1 操控元素的基本方法 23.2.2 自动操作鼠标键盘 23.2.3 自动化交互—鼠标动作链 23.2.4 模拟百度自动化搜索23.3 页面等待23.3.1 显式等待 23.3.2 隐式等待 23.4 自动获取京东商城信息23.4.1 设计思路23.4.2 代码演示23.5 自动获取淘宝商城信息23.5.1 案例分析 23.5.2 代码分析
• 刘晖:数据挖掘技术及工程实践
【课程特色】1.   课上采用案例式教学,通俗易懂,课下一对一辅导强化训练,学与练交叉进行强化记忆,你所要做的就是认真听,勤于问,乐于练。2.   清晰的知识结构,根据应用经验采用最优化授课模式。3.   内容充沛、详略得当,前后呼应。4.   讲师资历丰富,具有丰富的实践经验。5.   知识讲授+贴身案例+场景故事+互动讨论+现场演练+落地跟踪【课程对象】【课程时长】2天(6小时/天)【课程大纲】Python语言入门   第1个主题: Python语言基础知识(介绍Python语言基础知识,包括Python语言数据类型、基础概念等)1、 Python语言历史与趋势剖析2、 Python语言安装3、 如何运行Python程序4、 PyCharm开发环境介绍5、 Anaconda3开发环境介绍(以Anaconda3作为程序演示环境,Python3作为演示语言)6、 Python语言help()命令7、 Python基本命令8、 变量(Variables)9、 表达式(Expressions)10、 基本数据类型11、 字符串与正则表达式12、 Python条件表达式13、 循环(loops)14、 案例实战:正则表达式在爬虫中应用实例15、 Python数据结构16、 Python创建数组17、 Python矩阵运算18、 Python语言语法结构19、 案例:Python语言实现运营商数据分析处理第2个主题: Python函数(深入Python函数的编写语言)1、 Python函数介绍2、 数据分析与建模过程3、 Python语言定义函数规则4、 Python语言自定义函数5、 Python匿名函数6、 Python内置函数7、 Python函数案例第3个主题: Python类(class)(深入剖析Python类的原理)1、 类(class)介绍2、 Python多重继承3、 Python不支持函数重载4、 Class and Instance Variables5、 Method Objects6、 Python类编写案例实战第4个主题: Python异常处理(Exceptions)(深入剖析Python异常处理)1、 异常处理(Exceptions)简介2、 Python标准异常类3、 Python异常类编程案例实战(爬虫实例)第5个主题: Python模块 (Modules)(深入剖析模块 (Modules))1、 Python模块 (Modules)介绍2、 Python自定义模块3、 Python模块的导入与添加4、 Python标准函数库模块5、 Python第三方模块第6个主题: Python文件读写(深入剖析Python文件读写)1、 Python文件读写简介2、 Python读写方法介绍3、 Python读写文本文件4、 Python读写二进制文件5、 Python读写json文件6、 Python读写xml文件第7个主题: Python操作关系型数据库(深入剖析Python操作关系型数据)1、 Python2安装MySQL Connector 2、 Python3安装MySQL Connector3、 Python语言操作数据库4、 Python语言数据库优化5、 案例:Python语言实现话务数据时间序列建模     案例练习:通过Python语言实现运营商数据分析处理案例的剖析数据分析过程,体会数据分析的难点和要点。研讨:Python语言实现电网数据分析处理Python的NumPy模块    1、 NumPy 安装2、 NumPy Ndarray 对象3、 NumPy 数据类型4、 NumPy 数组属性5、 NumPy 创建数组6、 NumPy 从已有的数组创建数组7、 NumPy 从数值范围创建数组8、 NumPy 切片和索引9、 NumPy 高级索引10、 NumPy 广播(Broadcast)11、 NumPy 迭代数组12、 Numpy 数组操作13、 NumPy 位运算14、 NumPy 字符串函数15、 NumPy 数学函数16、 NumPy 算术函数17、 NumPy 统计函数18、 NumPy 排序、条件刷选函数19、 NumPy 字节交换20、 NumPy 副本和视图21、 NumPy 矩阵库(Matrix)22、 NumPy 线性代数23、 NumPy IO24、 NumPy Matplotlib 案例练习:通过NumPy的案例的剖析数据分析过程,体会数据分析的难点和要点。研讨:NumPy的数据处理Python的Pandas模块    1、 Pandas环境安装配置2、 Pandas数据结构3、 Pandas快速入门4、 Pandas系列5、 Pandas数据帧(DataFrame)6、 Pandas面板(Panel)7、 Pandas基本功能8、 Pandas描述性统计9、 Pandas函数应用10、 Pandas重建索引11、 Pandas迭代12、 Pandas排序13、 Pandas字符串和文本数据14、 Pandas选项和自定义15、 Pandas索引和选择数据16、 Pandas统计函数17、 Pandas窗口函数18、 Pandas聚合19、 Pandas缺失数据20、 Pandas分组(GroupBy)21、 Pandas合并/连接22、 Pandas级联23、 Pandas日期功能24、 Pandas时间差(Timedelta)25、 Pandas分类数据26、 Pandas可视化27、 Pandas IO工具28、 Pandas稀疏数据29、 Pandas注意事项&窍门30、 Pandas与SQL比较 案例练习:通过Pandas使用案例的剖析数据分析过程,体会数据分析的难点和要点。研讨:Pandas的使用方法Python机器学习   第1个主题: Python平台下的机器学习开发技术(介绍Python平台下的机器学习开发技术)31、 Python平台下的数据分析工具32、 Python平台下的数据分析工具概述33、 NumPy数据处理34、 NumPy案例35、 Scipy数值计算36、 SymPy符号处理37、 Matplotlib绘制图表38、 Pandas数据分析、探索工具39、 Pandas的DataFrame40、 DataFrame的构造41、 StatsModels数据统计建模分析42、 Scikit-Learn机器学习库43、 Keras人工神经网络44、 Keras的设计原则45、 Gensim文本挖掘库46、 OpenCV计算机视觉库47、 案例:Python语言实现基于聚类的图像分割方法     案例练习:通过案例的剖析数据分析过程,体会数据分析的难点和要点。研讨:Python语言实现基于聚类的图像分割方法Python机器学习   第1个主题: 聚类模型原理与实现(深入剖析聚类原理以及通过Python语言实现聚类算法模型)1、 聚类介绍2、 聚类算法应用场景3、 聚类算法应用案例4、 样品间相近性的度量5、 快速聚类法6、 快速聚类法的步骤7、 用Lm距离进行快速聚类8、 谱系聚类法9、 类间距离及其递推公式10、 谱系聚类法的步骤11、 变量聚类12、 K-Means(K均值)聚类13、 均值漂移聚类14、 基于密度的聚类方法(DBSCAN)15、 用高斯混合模型(GMM)的最大期望(EM)聚类16、 凝聚层次聚类17、 图团体检测(Graph Community Detection)18、 案例:Python语言聚类实现及绘图19、 案例:Kmeans应用案例剖析20、 课堂实操:Python语言实现基于聚类的图像分割方法第2个主题: 决策树模型原理与实现(深入剖析决策树原理以及通过Python语言实现决策树模型)1、 决策树介绍2、 决策树应用场景3、 决策树应用案例4、 信息熵5、 ID3算法6、 C4.5算法7、 CART算法8、 决策树算法9、 剪枝10、 过拟合与调参11、 决策树算法原理12、 决策树法的决策过程13、 案例:Python语言实现决策树模型14、 课堂实操:Python语言实现决策树模型15、 随机森林 案例练习:通过案例的剖析数据分析过程,体会数据分析的难点和要点。图表分析和数据可视化图表和可视化技术可以使数据的展示更为直观,使数据的规律更容易被发现。同时,图表使信息的传递更为快速。1.        Excel常规图表类型及其适用场合2.        几种加强版分析图表3.        绘制仪表盘案例剖析纳税评估模型偷漏电预测模型电信资源预测模型个人信用评级模型基于水色图像的水质评价模型6、基于数据挖掘技术的精确智能营销7、基于聚类分析的客户分群
• 刘晖:Python与数据分析实战-13天
【匹配关键知识点】Python语言入门,Python网络编程、爬虫与机器学习,Python数据分析案例分享,基于spark集群的python数据分析实战等内容。【课程时间】13天(8小时/天)【课程简介】随着大数据时代的快速到来,以及大数据在生产生活中迅速应用,大数据领域如雨后春笋般的出现大量的新技术,如Hadoop、Spark等技术,其中Python语言已经成为大数据技术中最为重要的一部分,被越来越多的企业所使用。Python语言的功能涵盖了大数据领域的数据处理、统计分析、数据挖掘、机器学习、人工智能、大数据应用开发等各种不同类型的计算操作,应用范围广泛、前景非常广阔。本课程是尹老师多年工作经验的总结和归纳,从实际业务案例为入口,使学员从理论层到实操层面系统的学习数据处理技术,使学员深入理解Python语言等数据分析工具。通过本课程的学习,学员即可以正确的分析企业的数据,为管理者、决策层提供数据支撑。【课程收益】1、Python语言入门;2、Python网络编程;3、Python网络爬虫;4、Python机器学习;5、Python数据分析案例分享;6、基于spark集群的python数据分析实战;【课程特点】Python语言入门,Python网络编程、爬虫与机器学习,Python数据分析案例分享,基于spark集群的python数据分析实战等内容。【课程对象】     数据分析师、技术经理、产品经理、产品助理等     将承担数据分析师职责的业务人员或信息化人员     希望加强数据分析能力的软件开发人员     系统集成企业售前工程师、售前顾问及方案制作人员【学员基础】     具有2年以IT部门工作经验,将负责数据分析等相关任务的技术人员【课程大纲】(13天*8小时)时间内容案例实践与练习Day1~Day3Python语言入门Python语言基础知识(介绍Python语言基础知识,包括Python语言数据类型、基础概念等)Python语言历史与趋势剖析Python语言安装如何运行Python程序PyCharm开发环境介绍Anaconda3开发环境介绍(以Anaconda3作为程序演示环境,Python3作为演示语言)Python语言help()命令Python基本命令变量(Variables)表达式(Expressions)基本数据类型字符串与正则表达式Python条件表达式循环(loops)案例实战:正则表达式在爬虫中应用实例Python数据结构Python创建数组Python矩阵运算Python语言语法结构案例:Python语言实现运营商数据分析处理 Python函数(深入Python函数的编写语言)Python函数介绍数据分析与建模过程Python语言定义函数规则Python语言自定义函数Python匿名函数Python内置函数Python函数案例 Python类(class)(深入剖析Python类的原理)类(class)介绍Python多重继承Python不支持函数重载Class and Instance VariablesMethod ObjectsPython类编写案例实战 Python异常处理(Exceptions)(深入剖析Python异常处理)异常处理(Exceptions)简介Python标准异常类Python异常类编程案例实战(爬虫实例) Python模块 (Modules)(深入剖析模块 (Modules))Python模块 (Modules)介绍Python自定义模块Python模块的导入与添加Python标准函数库模块Python第三方模块 Python文件读写(深入剖析Python文件读写)Python文件读写简介Python读写方法介绍Python读写文本文件Python读写二进制文件Python读写json文件Python读写xml文件 Python操作关系型数据库(深入剖析Python操作关系型数据)Python2安装MySQL Connector Python3安装MySQL ConnectorPython语言操作数据库Python语言数据库优化案例:Python语言实现话务数据时间序列建模案例练习:通过Python语言实现运营商数据分析处理案例的剖析数据分析过程,体会数据分析的难点和要点。 研讨:Python语言实现运营商数据分析处理Day4~Day5Python网络编程 多线程编程 (用实战实例介绍如何实现多线程) Python开发多线程的原理多线程创建线程锁网络应用程序编程实例:比如生成发送电子邮件  Python网络编程(介绍Python网络编程)TCP/IP网络介绍Socket基础知识Socket客户端服务器连接案例:聊天功能实战 Python Web开发实战(介绍Python Web实战)Python Web开发Django框架介绍定义和使用模型Django MVC架构Django开发环境搭建Django Session应用Django框架应用Django高级应用案例:客户通话历史记录查询案例练习:通过案例的剖析数据分析过程,体会数据分析的难点和要点。 研讨:网络编程Day6~Day7Python网络爬虫 Python基础知识和网络程序基础知识(介绍Python基础知识和网络程序基础知识)Python语言简介Python开发环境搭建和选择IO编程进程和多线程基础知识网络编程和TCP协议 Web前端基础知识(介绍Web前端基础知识)Web程序的结构Web前端的内容HTMLCSSJavaScriptXPathJsonHTTP协议标准HTTP头和主体Cookie信息 网络爬虫基础知识(介绍网络爬虫基础知识)网络爬虫概述网络爬虫及其应用网络爬虫结构HTTP请求的Python实现urllib2/urllib实现httplib/urllib实现更人性化的Requests HTML解析(HTML解析原理介绍)初识Firebug安装和配置Firebug正则表达式基本语法与使用Python中使用正则表达式BeautifulSoup概述安装和配置BeautifulSoupBeautifulSoup的使用lxml的XPath解析 基本的爬虫程序开发(介绍基本的爬虫程序开发)基础爬虫架构及运行流程URL管理器HTML下载器HTML解析器数据存储器爬虫调度器 协议分析(协议分析)Web端协议分析网页登录POST分析隐藏表单分析加密数据分析验证码问题IP代理Cookie登录传统验证码识别人工打码滑动验证码PC客户端抓包分析HTTPAnalyzer简介虾米音乐PC端API实战分析App抓包分析Wireshark简介酷我听书App端API实战分析API爬虫:爬取mp3资源信息 Scrapy爬虫框架(介绍Scrapy爬虫框架)Scrapy爬虫架构安装Scrapy创建cnblogs项目创建爬虫模块定义Item翻页功能构建ItemPipeline内置数据存储启动爬虫强化爬虫调试方法异常控制运行状态ItemLoaderItem与ItemLoader输入与输出处理器ItemLoaderContext?请求与响应下载器中间件Spider中间件扩展突破反爬虫案例研讨:通过案例的剖析数据分析过程,体会数据分析的难点和要点。 研讨:网络爬虫的实现Day8Python的NumPy模块NumPy 安装NumPy Ndarray 对象NumPy 数据类型NumPy 数组属性NumPy 创建数组NumPy 从已有的数组创建数组NumPy 从数值范围创建数组NumPy 切片和索引NumPy 高级索引NumPy 广播(Broadcast)NumPy 迭代数组Numpy 数组操作NumPy 位运算NumPy 字符串函数NumPy 数学函数NumPy 算术函数NumPy 统计函数NumPy 排序、条件刷选函数NumPy 字节交换NumPy 副本和视图NumPy 矩阵库(Matrix)NumPy 线性代数NumPy IONumPy Matplotlib案例练习:通过NumPy的案例的剖析数据分析过程,体会数据分析的难点和要点。 研讨:NumPy的数据处理Day9Python的Pandas模块Pandas环境安装配置Pandas数据结构Pandas快速入门Pandas系列Pandas数据帧(DataFrame)Pandas面板(Panel)Pandas基本功能Pandas描述性统计Pandas函数应用Pandas重建索引Pandas迭代Pandas排序Pandas字符串和文本数据Pandas选项和自定义Pandas索引和选择数据Pandas统计函数Pandas窗口函数Pandas聚合Pandas缺失数据Pandas分组(GroupBy)Pandas合并/连接Pandas级联Pandas日期功能Pandas时间差(Timedelta)Pandas分类数据Pandas可视化Pandas IO工具Pandas稀疏数据Pandas注意事项&窍门Pandas与SQL比较案例练习:通过Pandas使用案例的剖析数据分析过程,体会数据分析的难点和要点。 研讨:Pandas的使用方法Day10Python机器学习Python平台下的机器学习开发技术(介绍Python平台下的机器学习开发技术)Python平台下的数据分析工具Python平台下的数据分析工具概述NumPy数据处理NumPy案例Scipy数值计算SymPy符号处理Matplotlib绘制图表Pandas数据分析、探索工具Pandas的DataFrameDataFrame的构造StatsModels数据统计建模分析Scikit-Learn机器学习库Keras人工神经网络Keras的设计原则Gensim文本挖掘库OpenCV计算机视觉库案例:Python语言实现基于聚类的图像分割方法案例练习:通过案例的剖析数据分析过程,体会数据分析的难点和要点。 研讨:Python语言实现基于聚类的图像分割方法Day11Python机器学习 聚类模型原理与实现(深入剖析聚类原理以及通过Python语言实现聚类算法模型)聚类介绍聚类算法应用场景聚类算法应用案例样品间相近性的度量快速聚类法快速聚类法的步骤用Lm距离进行快速聚类谱系聚类法类间距离及其递推公式谱系聚类法的步骤变量聚类K-Means(K均值)聚类均值漂移聚类基于密度的聚类方法(DBSCAN)用高斯混合模型(GMM)的最大期望(EM)聚类凝聚层次聚类图团体检测(Graph Community Detection)案例:Python语言聚类实现及绘图案例:Kmeans应用案例剖析课堂实操:Python语言实现基于聚类的图像分割方法 决策树模型原理与实现(深入剖析决策树原理以及通过Python语言实现决策树模型)决策树介绍决策树应用场景决策树应用案例信息熵ID3算法C4.5算法CART算法决策树算法剪枝过拟合与调参决策树算法原理决策树法的决策过程案例:Python语言实现决策树模型课堂实操:Python语言实现决策树模型随机森林案例练习:通过案例的剖析数据分析过程,体会数据分析的难点和要点。 研讨: Python语言实现基于聚类的图像分割方法Day12Python数据分析案例分享 随机森林模型原理与实现(深入剖析随机森林原理以及通过Python语言实现随机森林模型)随机森林介绍随机森林的特点随机森林的相关基础知识信息、熵以及信息增益的概念随机森林的生成随机森林算法随机森林算法原理袋外错误率(oob error)随机森林应用场景随机森林应用案例案例:Python语言实现随机森林模型课堂实操:Python语言实现随机森林模型xgboost 支持向量机模型原理与实现(深入剖析支持向量机算法原理以及通过Python语言实现支持向量机模型)支持向量机介绍支持向量机应用场景支持向量机应用案例支持向量机算法支持向量机算法原理线性可分支持向量机间隔最大化和支持向量对偶问题求解柆格朗日函数非线性支持向量机和核函数超平面线性核多项式核高斯核拉普拉斯核sigmiod核线性支持向量机(软间隔支持向量机)与松弛变量松驰因子案例:Python语言实现支持向量机模型课堂实操:Python语言实现基于SVM的字符识别方法 神经网络模型原理与实现(深入剖析神经网络算法原理以及通过Python语言实现神经网络模型)神经网络介绍神经网络概念神经网络发展历史神经网络的别名神经网络研究的主要内容神经网络基本构成神经网络模拟人的智能行为的四个方面神经网络的特点学习能力适应性问题神经网络基本网络模型单层网络多层网络循环网络基本网络结构特点典型训练算法运行方式典型问题解决方法感知机线性神经网络BP神经网络RBF网络竞争网络反馈神经网络随机神经网络遗传算法PSO与神经网络优化自定义深度神经网络结构深度神经网络的优化方法深度框架的损失函数课堂实操:Python语言实现基于神经网络的人脸识别方法案例练习:通过案例的剖析数据分析过程,体会数据分析的难点和要点。 研讨:Python语言实现基于神经网络的人脸识别方法Day13基于spark集群的python数据分析实战基于Spark集群的Python的数据分析实战基于Python开发Spark 程序概述基于Python开发Spark 程序算法库介绍基于Python开发Spark 程序架构剖析基于Python开发Spark 程序机器学习算法剖析数据类型基本统计算法分类与回归协同过滤聚类降维特征提取与转换频繁模式挖掘评价指标基于Python开发Spark 程序编程基于Python开发Spark 程序 APIs介绍基于Python开发Spark 程序机器学习算法应用实战基于Python开发Spark 程序实战案例:数据聚类分析案例剖析案例练习:通过基于Python开发Spark 程序实战案例:数据聚类分析案例剖析,剖析数据分析过程,体会数据分析的难点和要点。 研讨:数据聚类分析案例 (5)教学实验数据分析概述:1、大数据企业应用障碍分析数据的产生、导入与预处理:案例练习:通过数据整理的编程和应用案例的剖析数据分析过程,体会数据分析的难点和要点。案例练习:通过案例的剖析数据分析过程,体会数据分析的难点和要点。案例练习:通过淘宝双十一案例的剖析数据分析过程,体会数据分析的难点和要点。案例研讨:通过数据挖掘案例的剖析数据分析过程,体会数据分析的难点和要点。研讨:数据挖掘案例练习:通过企业实践案例的剖析数据分析过程,体会数据分析的难点和要点。研讨:企业实践案例分享案例练习:通过数据模型的应用案例剖析案例的剖析数据分析过程,体会数据分析的难点和要点。研讨:数据模型的应用案例剖析数据分析与挖掘基础:1、课堂实操:数据整理的编程和应用2、企业OLAP模型设计案例剖析3、实例分享:淘宝双十一4、实例分享:腾讯QQ5、实例分享:百度文库6、实例分享:打车大战7、实验:Pig的实用案例8、实验:Hive安装部署9、实验:Sqoop安装10、实验:Sqoop Shell11、实验:FLume大数据架构案例分享及实战演练12、实验:企业实践案例分享 R语言数据分析实战:1、实验:安装R语言2、实验:R语言编程案例3、实验: R语言的绘图功能4、实操:R和MySQL的交互5、实操:R和Oracle的交互6、实操:R和Excel的交互7、案例:蒙特卡罗模拟的应用8、案例1:汽车数据描述统计分析9、案例2:财政收入与税收描述统计分析10、案例:蒙特卡罗模拟的应用11、实操:R语言实现蒙特卡罗求圆周率12、实操:R语言一元线性回归模型检验13、实操:R语言实现多元线性回归14、实操:R语言非线性回归15、案例:用户离网预测16、案例:中国税收收入增长案例分析17、案例:新教学方法的效果18、案例:信用卡违约预测19、案例分享:文章分类 大数据工具介绍之Hadoop:1、实例分享:马云预测经济危机案例剖析2、实例分享:双十一亿背后的开源技术3、实验:Hadoop集群部署4、实验:CLI操作HDFS5、实验:Java操作HDFS6、实验:MapReduce命令操作7、实验:MapReduce程序打包并在命令行运行8、实验:动手编写MapReduce程序  大数据工具介绍之Spark:1、编程实战:第一个 Scala 程序2、编程实战:编程Scala程序实例3、编程实战:Scala函数编程实例4、编程实战:Scala语言复杂数据类型编程实战5、编程实战:用SBT对Scala项目打包与发布6、实验:Spark集群部署7、实验:Scala编写Spark程序8、实验:Python编写Spark程序9、实验:Spark Shell10、编程实战:Spark基础操作编程实战11、企业级案例:Spark Streaming与Kafka整合实现数据实时数据分析处理设计与分析 Pyspark集群调度与数据处理:1、编程实战:Spark基础操作编程实战2、PySpark MLlib实战案例:数据聚类分析案例剖析3、案例:Python编写Spark大数据程序 大数据可视化:1、可视化案例实战:数据占比柏拉图绘制2、可视化案例实战:仪表盘制作3、实验:柏拉图制作4、实验:仪表盘制作5、实验:玫瑰图制作6、实验:热力图制作7、实验:地图制作8、实验:文字云制作9、淘宝24小时生活数据可视化案例10、无线淘宝数据可视化案例11、Google公司数据可视化案例12、Facebook用户画像可视化案例13、个人用户画像案例14、如何撰写一份优秀的数据分析报告 Python与数据分析实战:1、案例实战:正则表达式在爬虫中应用实例2、案例:Python语言实现运营商数据分析处理3、实验:Python语言自定义函数4、案例:Python语言实现蒙特卡罗求圆周率5、课堂实操:数据整理的编程和应用6、案例:Python语言实现购物蓝关联规则分析7、课堂实操:Python语言实现随机森林模型8、课堂实操:Python语言实现金融数据时间序列建模9、课堂实操:基于余弦相似度的精准营销10、案例分享:文章分类11、案例:Python编写Spark大数据程序

添加企业微信

1V1服务,高效匹配老师
欢迎各种培训合作扫码联系,我们将竭诚为您服务