学习期限: 11天
课程安排
日期 | 主题 | 内容 |
Day1 上午 | Python复习 |
列表、元组、集合、字典、字符串、Range
|
Day1 下午 | Numpy复习 |
手动创建数据 自动创建一维数据,变形 自动创建多维数据
实例1:计算鸢尾花的统计数据 实例2:使用梯度法计算积分的面积 |
Day2 上午 | matplotlib可视化库 Seaborn可视化库 |
|
Day2 下午 | pandas数据分析(上) |
从内存/csv/excel/mysql中读/写数据
形状、数据类型、空值、前n行和后n行、统计信息、唯一性、计数统计等。
|
Day3 上午 | pandas数据分析(下) |
按值/索引
横向/纵向连接,行索引和列索引互相转换,行索引和列互相转换。
|
Day3 下午 | 数据分析案例 | 案例分析:
|
Day4 | 机器学习基础 线性回归 Scikit-learn工具 |
实操1:相关系数 实操2:梯度下降 实操3:线性回归 实操4:Ridge回归 实操5:LASSO回归 实操6:Elastic Net |
Day5 | 逻辑回归 KNN |
实操1:线性逻辑回归实现 实操2:非线性逻辑回归 实操3:KNN预测约会网站配对 实操4:KNN预测电影分类 实操5:KNN预测鸢尾花分类 实操6:KNN预测手写数字分类 |
Day6 | 决策树 随机森林 |
实操1:决策树预测房价 实操2:决策树预测隐形眼镜类型 实操3:随机森林算法演示 实操4:Adaboost算法演示 实操5:病马死亡率预测 实操6:泰坦尼克号存活预测 |
Day7 | 聚类 特征工程 |
实操1:用Python实现kmeans的实现 实操2:用Sklearn实现kmeans聚类 实操3:用Sklearn实现dbscan密度聚类 |
Day8 | XGboost |
实操1:回归树预测房价 实操2:gbdt预测回归案例 实操3:Xgboost的参数调优 实操:4:Xgboost在数据竞赛中运用 |
Day9 | 推荐系统-关联规则 推荐系统-协同过滤 |
实操1:实现Arpiori算法 实操2:英国零售商的商品推荐 实操3:实现movielens电影推荐 |
Day10 | 竞赛案例分析(1) | 1. 建模流程 1) 需求分析 2) 数据清洗 3) 数据预处理 4) 特征工程 5) 建模 6)度量 7)模型优化 2. 案例:金融欺诈(分类) 3. 案例:鲍鱼年龄(回归) |
Day11 | 竞赛案例分析(2) |
|