机器学习讲座
2023 8 24 王成军
推荐教材:
教学数据:泰坦尼克号数据
特征工程与深度神经网络
数据清理
描述统计
表格、可视化
机器学习
机器学习要有监督式学习,通过测试集测试模型的效果,测试集的分数要高。防止过度拟合
scikit-learn
最常用工具包
dataframe
分类与回归 对应不同的算法
5步进行机器学习
- 选择一个模型,
- 对模型进行初始化
- 把数据整理成X、y(X是列表嵌套)
- 使用选择的模型拟合数据
- 进行模型评价
yangjh
August 24, 2023
2023 8 24 王成军
推荐教材:
教学数据:泰坦尼克号数据
特征工程与深度神经网络
表格、可视化
机器学习要有监督式学习,通过测试集测试模型的效果,测试集的分数要高。防止过度拟合
最常用工具包
dataframe
分类与回归 对应不同的算法
5步进行机器学习