陈则:SPSS统计分析与数据挖掘

陈则老师陈则 注册讲师 9查看

课程概要

培训时长 : 3天

课程价格 : 扫码添加微信咨询

课程分类 : 工作技能

课程编号 : 35163

面议联系老师

适用对象

-

课程介绍

基础篇(1天)

第一部分 软件入门与数据管理

第一章 SPSS入门

1.1 软件概述

1.2 SPSS操作入门

1.3 SPSS的窗口、菜单项和结果输出

1.4 SPSS的系统选项与扩展资源

1.5 SPSS的帮助系统

1.6 数据分析方法论概述

第二章 数据录入与数据获取

2.1 CCSS案例项目背景介绍

2.2 数据格式概述

2.3 SPSS中直接建立数据集

2.4 读入外部数据

2.5 数据的保存

2.6 数据编辑窗口常用操作技巧集锦

第三章 变量级别的数据管理

3.1 变量赋值

3.2 已有变量值的分组合并

3.3 连续变量的离散化

3.4 自动重编码、编秩与数值计数

3.5 转换菜单中的其他功能

第四章 文件级别的数据管理

4.1 几个常用过程

4.2 多个数据文件的合并

4.2 数据文件的重组与转置

4.3 数据菜单中的其他功能

第五章 大型研究项目的数据管理

5.1 数据字典

5.2 数据核查

5.3 数据准备

第六章 SPSS编程

6.1 CCSS项目的数据处理需求

6.2 SPSS编程入门

6.3 语法编辑窗口操作入门

6.4 宏程序与INSERT命令

6.5 OMS系统与程序自动化

第二部分 统计描述与统计图表

第七章 连续变量的统计描述与参数估计

7.1 连续变量的统计描述指标体系

7.2 连续变量的参数估计指标体系

7.3 案例:信心指数的统计描述

7.4 Bootstrap方法

第八章 分类变量的统计描述与参数估计

8.1 指标体系概述

8.2 案例:对学历等背景变量进行描述

8.3 案例:对多选题C0还贷状况进行描述

第九章 数据的报表呈现

9.1 统计表入门

9.2 简单案例:题目A3的标准统计报表制作

9.3 复杂案例:题目A3a的标准统计报表制作

9.4 表格的编辑

9.5 表格模板技术

第十章 数据的图形展示

10.1 统计图概述

10.2 直方图和茎叶图

10.3 箱图

10.4 饼图

10.5 条图与误差图

10.6 线图、面积图、点图与垂线图

10.7 散点图

10.8 P-P图和Q-Q

10.9 控制图与Pareto

10.10 其他统计图

第三部分 常用假设检验方法

第十一章 分布类型的检验

11.1 假设检验的基本思想

11.2 正态分布检验

11.3 二项分布检验

11.4 游程检验

11.6 本章小结

第十二章 连续变量的统计推断(一)――t检验

12.1 t检验概述

12.2 样本均数与总体均数的比较

12.3 成组设计两样本均数的比较

12.4 正态性、方差齐性的考察与应对策略

12.5 配对设计样本均数的比较

12.6 本章小结

第十三章 连续变量的统计推断(二) ――单因素方差分析

13.1 方差分析概述

13.2 案例:北京消费者不同时点信心指数的比较

13.3 均数间的多重比较

13.4 各组均数的精细比较

13.5 组间均数的趋势检验

13.6 本章小结

第十四章 有序分类变量的统计推断 ――非参数检验

14.1 非参数检验概述

14.2 两个配对样本的非参数检验

14.3 两个独立样本的非参数检验

14.4 多个独立样本的非参数检验

14.5 多个相关样本的非参数检验

14.6 秩变换分析方法

14.7 本章小结

第十六章 无序分类变量的统计推断――卡方检验

16.1 卡方检验概述

16.2 单样本案例:考察抽样数据的性别分布

16.3 两样本案例:不同收入级别家庭的轿车拥有率比较

16.4 卡方检验的事后两两比较

16.5 确切概率法和蒙特卡洛法

16.6 两分类变量间关联程度的度量

16.7 一致性检验与配对卡方检验

16.8 分层卡方检验

16.9 本章小结

第十七章 相关分析

17.1 相关分析简介

17.2 简单相关分析

17.3 偏相关分析

17.4本章小结

第十八章 线性回归模型入门

18.1 线性回归模型简介

18.2 案例:建立用年龄预测总信心指数值的回归方程

18.3 多重线性回归模型入门

18.4 本章小结

第四部分 统计实战案例集锦

第十九章 统计实战案例集锦

19.1 CCSS项目的自动化生产

19.2 X药物治疗原发性高血压的临床试验研究

19.3 咖啡屋需求调查

19.4 牙膏新品购买倾向研究

19.5 证券业市场绩效与市场结构关系的实证分析

高级篇(2天)

第一部分 一般线性、混合线性与广义线性模型

1章 方差分析模型

1.1 模型简介

1.2 案例:胶合板磨损深度的比较

1.3 两因素方差分析模型

1.4 因素各水平间的精细比较

1.5 方差分析模型进阶

2章 常用实验设计分析方法

2.1 仅研究主效应的实验设计方案

2.2 考虑交互作用的实验设计方案

2.3 误差项变动的特殊实验设计方案

2.4 协方差分析

3章 多元方差分析与重复测量方差分析

3.1 多元方差分析

3.2 重复测量资料的方差分析

4章 线性混合模型

4.1 模型简介

4.2 层次聚集性数据案例

4.3 重复测量数据案例

4.4 线性混合模型进阶

5章 广义线性模型,广义估计方程 与广义线性混合模型

5.1 广义线性模型

5.2 广义估计方程

5.3 广义线性混合模型

第二部分 回归模型

6章 多重线性回归模型

6.1 模型简介

6.2 案例:销量影响因素分析

6.3 回归预测与区间估计

6.4 残差分析

6.5 逐步回归

6.6 模型的进一步诊断与修正

6.7 自动线性建模

7章 线性回归的衍生模型

7.1 非直线趋势的处理:曲线直线化

7.2 方差不齐的处理:加权最小二乘法

7.3 共线性的处理:岭回归

7.4 分类变量的数值化:最优尺度回归

7.5 强影响点的弱化:稳健回归与分位数回归

7.6 其余回归方法简介

8章 路径分析入门

8.1 两阶段最小二乘法

8.2 路径分析入门

8.3 偏最小二乘法入门

9章 非线性回归模型

9.1 模型简介

9.2 案例:通风时间和毒物浓度的曲线方程

9.3 自定义损失函数:最小一乘法

9.4 分段回归模型的拟合

9.5 非线性回归模型进阶

10章 二分类logistic回归模型

10.1 模型简介

10.2 案例:低出生体重儿影响因素研究

10.3 分类自变量的定义与比较方法

10.4 自变量的筛选方法与逐步回归

10.5 弗斯Logistic回归

10.6 Logistic模型进阶

11章 多分类、配对logistic回归与probit回归模型

11.1 有序多分类logistic回归模型

11.2 无序多分类logistic回归模型

11.3 1:1配对logistic回归

11.4 probit回归模型

12章 对数线性模型、Poisson回归模型 与潜类别分析

12.1 对数线性模型简介

12.2 一般对数线性模型

12.3 因果关系明确时的对数线性模型

12.4 对数线性模型的自动筛选

12.5 对数线性模型与其它模型的关系

12.6 Poisson回归模型

12.7 潜类别分析简介

第三部分 多元统计分析方法

13章 主成份分析、因子分析与多维偏好分析

13.1 主成份分析

13.2 因子分析

13.3 因子分析进阶

13.4 分类数据的主成份分析(多维偏好分析)

14章 对应分析

14.1 模型简介

14.2 案例:头发颜色与眼睛颜色的关联

14.3 基于均数的对应分析

14.4 对应分析进阶

14.5 基于最优尺度变换的多重对应分析

15章 典型相关分析

15.1 模型简介

15.2 案例:体力指标和运动能力指标的相关分析

15.3 典型相关分析进阶

15.4 基于最优尺度变换的非线性典型相关分析

16章 多维尺度分析

16.1 不考虑个体差异的MDS模型

16.2 考虑个体差异的MDS模型

16.3 基于最优尺度变换的MDS模型

16.4 多维展开模型

17章 聚类分析

17.1 模型简介

17.2 K-均值聚类法

17.3 聚类结果的验证与自动优化

17.4 层次聚类法

17.4 两步聚类法

17.5 聚类分析进阶

18章 经典判别分析

18.1 模型简介

18.2 案例:鸢尾花种类判别

18.3 贝叶斯判别分析

18.4 判别分析进阶

第四部分 其他统计分析方法

19章 树模型、随机森林与最近邻元素法

19.1 树模型简介

19.2 案例:移动客户流失预测

19.3 对案例的进一步分析

19.4 常见的树模型算法

19.5 随机森林

19.6 最近邻元素法

20章 神经网络与支持向量机

20.1 模型简介

20.2 案例:对低出生体重儿案例的重新分析

20.3 对案例的进一步分析

20.4 径向基神经网络

20.5 支持向量机简介

21章 信度分析

21.1 信度理论入门

21.2 案例:问卷信度分析

21.3 其余常用的信度系数

21.4 概化理论简介

21.5 项目反应理论简介

22章 联合分析

22.1 模型简介

22.2 联合分析的正交试验设计

22.3 联合分析的数据建模

22.4 联合分析进阶

23章 时间序列模型

23.1 模型简介

23.2 时间序列的建立和平稳化

23.3 时间序列的图形化观察

23.4 时间序列的建模与预测

23.5 季节分解

23.6 时间因果模型

24章 生存分析

24.1 生存分析简介

24.2 生存函数的估计和检验

24.3 Cox回归模型

24.4 含时间依存变量的Cox模型

24.5 Cox模型进阶

24.6 加速失效时间模型

25章 缺失值分析

25.1 缺失值理论简介

25.2 对缺失情况的基本分析

25.3 缺失值填充技术

25.4 多重填充

第五部分 数据分析与挖掘实战案例

案例1 酸奶饮料新产品口味测试

案例2 偏态分布的激素水平影响因素分析

案例3 某车企汽车年销量预测案例

案例4 脑外伤急救后迟发性颅脑损伤影响因素分析案例

案例5 中国消费者信心指数影响因素分析

案例6 探讨消费者购买保健品的动机

案例7 1988年汉城奥运会男子十项全能成绩分析

案例8 住院费用影响因素挖掘

案例9 淘宝大卖家之营销数据分析

案例10 超市商品购买关联分析

案例11 电信业客户流失分析

案例12信用风险评分方法

案例13 医疗保险业的欺诈发现

案例14 电子商务中的数据挖掘应用

陈则老师的其他课程

• 陈则:Tableau 数据可视化设计(2天)
培训目标: l 连接多种类型数据源文件。编辑和保存数据源。 l 理解 Tableau 术语。使用 Tableau有效创建功能强大的可视化报表。 l 创建基本计算,包括基本算术计算、自定义聚合与比率、日期计算和快速表计算。 l 使用以下可视化类型呈现数据: u 饼图、条形图、交叉表、散点图、地理图、热图、树地图 u 采用不同标记类型的双轴图和组合图,突出显示表关键数据 u 生成仪表板以共享可视化 课程大纲: 第1天 第一章 Tableau应用概述 1.1什么是敏捷商务智能 1.1.1 用数据讲故事 1.1.2主要的数据可视化软件 1.1.3 Tableau的主要特性 1.2 Tableau的产品体系 1.3 Tableau美观交互的视图与界面 1.4 Tableau的文件管理 1.5 10分钟快速体验可视报表设计 第二章 管理基础数据——连接数据源 2.1 连接文件数据源 2.2连接服务器数据源 2.3 复制粘贴输入数据 2.4 筛选数据 第三章 管理基础数据——数据清洗 3.1 数据整合 3.1.1 实现多表联结 3.1.2 多数据源的数据融合 3.1.3 行列转换 3.2 数据加载 3.2.1 创建数据提取 3.2.2 刷新数据提取 3.2.3 向数据提取添加行 3.2.4 优化数据提取 3.3 数据维护 3.3.1 查看数据、 刷新数据、 替换数据、 删除数据 第4章 初级可视化分析 4.1 条形图 4.2 直方图 4.3 饼图 4.4 折线图: 基本折线图、双组合图 4.5 基本交叉表 4.6 树地图 4.7 气泡图 4.8 圆视图 4.9 标靶图 4.10 甘特图 第5章 地图分析 5.1 地图简介 5.1.1 分配地理角色 5.1.2 创建符号地图 5.1.3 创建填充地图 5.1.4 创建多维度地图 5.1.5 创建混合地图 5.2 设置地理信息 5.2.1 选择地图源 5.2.2 自定义地理编码 5.3 高级功能 5.3.1 多边形地图 5.3.2 背景图像地图 5.3.3 地理位置距离计算 第2天 第6章 高级数据操作 6.1 分层结构 6.1.1 创建分层结构 6.1.2 使用分层结构 6.2 使用组、集、参数 6.3 计算字段创建计算字段 6.3.1 使用计算字段 6.3.2 特殊函数:表计算 6.3.3 特殊函数:详细级别表达式 6.3.4 特殊函数:百分比 6.4 变换 6.4.1 变换日期型字段 6.4.2 变换字符型字段 6.5 参考线及参考区间 6.5.1 创建参考线及参考区间 6.5.2 创建参考区间 第7章 高级可视化分析 7.1 帕累托图 7.2 盒须图 7.2.1 基础应用 7.2.2 图形延伸 7.3 瀑布图 7.3.1 基础应用 7.3.2 图形延伸 7.4 倾斜图 7.5 网络图 7.6雷达图 第8章 仪表板整合 8.1 仪表板简介 8.1.1 工作区、对象、布局容器、布局方式、交互操作 8.2 编辑仪表板 8.2.1 新建布局 8.2.2 添加内容并调整格式 8.2.3 添加交互操作 8.3 故事简介 8.3.1 使仪表板适合故事 8.3.2 设置故事格式 第9章 报表成果共享 9.1 导出和发布数据 9.1.1 通过将数据复制到剪贴板导出数据 9.1.2 以Access数据库文件导出数据 9.1.3 以交叉分析(Excel)方式导出数据 9.1.4 导出数据源 9.1.5 发布数据源 9.2 导出图像和PDF 文件 9.2.1 复制图像 9.2.2 导出图像 9.2.3 打印为PDF 9.3 保存和发布工作簿 9.3.1 保存工作簿 9.3.2 保存打包工作簿 9.3.3 将工作簿保存到TableauPublic上 第10章 总结综合练习 10.1教育水平评估图表 10.2 保险/银行的识别与预测 10.3 中国楼市降温的分析 10.3.1 制作购房计算器 10.3.2 制作房价与 GDP 关系视图 10.3.3 制作房价变化全国分布图 10.3.4 制作环比变化城市排名视图 10.3.5 制作房价与 CPI 的关系视图 10.3.6 制作销售情况的视图 10.3.7 制作施工情况的视图 10.3.8 制作投资情况的视图 10.3.9 制作动态仪表板
• 陈则:大数据时代的Excel统计与分析
第1章 大数据分析概述 1.1 大数据概述 1.1.1 什么是大数据 1.1.2 数据、信息与认知 1.1.3 数据管理与数据库 1.1.4 数据仓库 1.1.5 数据挖掘的内涵和基本特征 第2章 数据挖掘流程 2.1 数据挖掘流程概述 2.1.1 问题识别 2.1.2 数据理解 2.1.3 数据准备 2.1.4 建立模型 2.1.5 模型评价 2.1.6 部署应用 第3章 大数据的Excel统计分析 3.1 研究程序与抽样 3.2 频率分布 3.3 集中趋势 3.3.1 平均值\平均值的优点 3.3.2中位数\ 众数\ 内部平均值\ 最大值\最小值 3.3.3 第几最大值第几最小值 3.3.4 描述统计 3.4 离散程度 3.5 假设检验 3.6 单因子方差分析 3.7 相关分析 3.8 回归分析 3.9 聚类分析 3.10预测分析 3.11 Excel在数据分析中的应用 3.11.1 Excel操作技巧 3.11.2 Excel函数公式:Vlookup,left/right/mid,sumif/sumifs等 3.11.3 Excel神器之二:创建数据透视表 第4章 大数据的图表分析案例 前言:常见图表分析的三大错误 4.1 用实例说明九大类型图表:饼图、柱状图、条形图、折线图、散点图、雷达图、气泡图、面积图、圆环图的应用场合 4.2 几种专业的图表分析法 4.3九大类型图表的生成实例演练 4.4介绍几种专业的图表分析工具,您需要展示与众不同的专业度 -利用双曲线组合图表显示预计销量和实际销量对比 -利用柱形层叠图显示计划完成度 -利用双侧比较图显示市场调查结果 -利用复合饼图深入分析主要销售组成 -使用断层图分析企业数据 第5章 数据分析应用实践 5.1 合理的数据呈现与EXCEL/PPT图表制作 图表制作的关键要素 合适的图表展示合适的数据 正确表达需要的主题 图表与文字的协调 图表的结论 5.2科学的数据分析结果解读 注意因果关系 不要以偏概全 考虑环境影响 兼顾定性研究 第6章 数据分析报告与汇报 6.1如何撰写一份优秀的数据分析报告 6.2现场实操演练:分析报告撰写 6.3 汇报的技巧 第7章 商业预测技术 预测是企业重要的决策依据,企业通过预测技术可以估计下一季度、年度的市场规模、市场占有率、销售量等。 1. 预测责任者与支持者 2. 预测的组织流程 3. 不同的预测模型各自的优缺点 4. 多元回归分析:如何分析多个因素对目标值的影响程度,包含 i. 如何建立多变量业务预测模型 ii. 如何评估业务模型的有效性 iii. 企业外部变量(例如经济宏观数据)的选择和过滤 5. 回归分析演练:如何量化分析广告的效果
• 陈则:大数据时代的Excel统计与分析
第1章 大数据分析概述 1.1 大数据概述 1.1.1 什么是大数据 1.1.2 数据、信息与认知 1.1.3 数据管理与数据库 1.1.4 数据仓库 1.1.5 数据挖掘的内涵和基本特征 1.2 制造行业需要分析哪些数据? 1.2.1 产品的良率监控 1.2.2 产品的BOM设计 1.2.3 市场数据监控 1.2.4 财务数据 1.2.5 产品生产数据 1.2.6 设备预防性维护数据 1.2.7 产品需求数据 1.2.8 其他日常数据等 第2章 数据挖掘流程 2.1 数据挖掘流程概述 2.1.1 问题识别 2.1.2 数据理解 2.1.3 数据准备 2.1.4 建立模型 2.1.5 模型评价 2.1.6 部署应用 第3章 大数据的Excel统计分析 3.1 研究程序与抽样 3.2 频率分布 3.2.1 传统的建表方式 3.2.2 离散变量—单选题频率布 3.2.3 如何用Word编辑频率分布表 3.2.4 绘制频率分布统计图表 3.2.5 离散变量—复选题频率分布 3.2.6 利用RANK()函数处理 3.3 集中趋势 3.3.1 平均值\平均值的优点 3.3.2中位数\ 众数\ 内部平均值\ 最大值\最小值 3.3.3 第几最大值第几最小值 3.3.4 描述统计 3.4 离散程度 3.5 假设检验 3.6 单因子方差分析 3.7 相关分析 3.8 回归分析 3.9 聚类分析 3.10预测分析 第4章 大数据的图表分析案例 前言:常见图表分析的三大错误 4.1 用实例说明九大类型图表:饼图、柱状图、条形图、折线图、散点图、雷达图、气泡图、面积图、圆环图的应用场合 4.2 几种专业的图表分析法 4.3九大类型图表的生成实例演练 4.4介绍几种专业的图表分析工具,您需要展示与众不同的专业度 -利用双曲线组合图表显示预计销量和实际销量对比 -利用柱形层叠图显示计划完成度 -利用双侧比较图显示市场调查结果 -利用复合饼图深入分析主要销售组成 -使用断层图分析企业数据 第5章 数据分析应用实践 5.1 合理的数据呈现与EXCEL/PPT图表制作 图表制作的关键要素 合适的图表展示合适的数据 正确表达需要的主题 图表与文字的协调 图表的结论 5.2科学的数据分析结果解读 注意因果关系 不要以偏概全 考虑环境影响 兼顾定性研究 第6章 数据分析报告与汇报 6.1如何撰写一份优秀的数据分析报告 6.2现场实操演练:分析报告撰写 6.3 汇报的技巧 第7章 商业预测技术 预测是企业重要的决策依据,企业通过预测技术可以估计下一季度、年度的市场规模、市场占有率、销售量等。 1. 预测责任者与支持者 2. 预测的组织流程 3. 不同的预测模型各自的优缺点 4. 多元回归分析:如何分析多个因素对目标值的影响程度,包含 i. 如何建立多变量业务预测模型 ii. 如何评估业务模型的有效性 iii. 企业外部变量(例如经济宏观数据)的选择和过滤 5. 回归分析演练:如何量化分析广告的效果

添加企业微信

1V1服务,高效匹配老师
欢迎各种培训合作扫码联系,我们将竭诚为您服务