各有关机构、学员:
科技立则民族立,科技强则国家强。新一轮科技革命与产业变革迅猛发展,科技创新已经成为国际战略博弈的主战场。党的二十大报告中提出,教育、科技、人才是全面建设社会主义现代化国家的基础性、战略性支撑。必须坚持科技是第一生产力、人才是第一资源、创新是第一动力。深入实施科教兴国战略、人才强国战略、创新驱动发展战略,开辟发展新领域新赛道,不断塑造发展新动能新优势。实现这一战略的关键是有足够数量和质量的人才,为加强新时代高技能人才队伍建设,深化产教融合,校企合作,提升相关从业人员的职业技能,拟开展机器学习与大数据分析人才培养。
一、举办单位
主办单位:中国高等教育培训中心
承办单位:北京华业大教育科技有限公司
二、研修时间
时间:2023年7月15日--7月21日
地点:北京(线下详细报到路线将在第二轮通知中告知)
线 上:直播+回放(毛豆课堂,无需下载任何软件)
三、研修目的
为人工智能产业快速发展保驾护航,搭建校企互动交流平台,提升教师专业实践能力,加强新时代高技能人才队伍建设,有效提高各院校人工智能专业的课程教学质量,使教育教学体系真正与就业接轨,实现人才培养与人才就业无缝对接,助力行业健康发展。
四、研修对象
各高等院校/职业院校智能科学与技术、计算机视觉、机器学习、机器人工程、自然语言处理、语音处理、知识工程、推理与规划、统计学、数学、审计、计算机、生物、医学、环境科学、经济学、社会学、管理学应用、数据科学与大数据技术、大数据与审计专业、数据采集、数据分析、数学建模等相关专业的学院领导、专业教学带头人、实验室教学技术人员及骨干教师,研究生;企事业单位从事机器学习与大数据分析技术人员等。
五、研修内容
第一天
1.1 认识Python
2.1.1 编写第一个Python程序
2.1.2 缩进代码
2.2.1 字符串基本操作
2.2.2 字符串的索引及切片操作
2.2.3 任务实现-字符串与数值处理
2.3.1 Python常用运算符介绍
2.3.2 任务实现-计算圆形的各参数
3.1 认识Python数据结构
3.2.1 创建列表
3.2.2 列表索引及切片操作
3.2.3 为列表添加元素
3.2.4 列表元素的删除及修改操作
3.2.5 列表推导式
3.2.6 任务实现-求解曲边图形面积
3.3.1 创建字典
3.3.2 字典的增删改查操作
3.3.3 任务实现-单词词频统计
4.1.1 考试成绩等级划分-任务描述
4.1.2 条件判断及分支语句
4.1.3 try-except语句
4.1.4 任务实现-考试成绩等级划分
4.2.1 循环语句
4.2.2 任务实现-实现一组数的连加与连乘操作
4.3 冒泡排序法排序
5.1.1 使用def定义函数
5.1.2 任务实现-自定义求列表均值的函数
5.2 使用lambda创建匿名函数
5.3 存储并导入函数模块
6.1 认识面向对象
6.2.1 创建Human类
6.2.2 创建对象
7.1.1 读取文件数据
7.1.2 任务实现-文件数据读取及词频统计
7.2 将数据写入文件
8 模块和第三方库
第二天
Python数据分析与应用
1 Python数据分析概述
1.1 认识数据分析
1.2 熟悉Python数据分析的工具
1.3 安装anaconda与掌握Jupyter Notebook常用功能
2 NumPy数值计算基础
2.1 掌握NumPy数组对象
2.1.1NumPy简介
2.1.2 数组创建及基础属性
2.1.3 初识数组的特点
2.1.4 创建常用数组
2.1.5 数组数据类型
2.1.6 生成随机数
2.1.7 一维数组的索引
2.1.8 逻辑型索引
2.1.9 多维数组的索引
2.1.10 求解距离矩阵
2.1.11 变化数组shape
2.2 掌握NumPy矩阵与通用函数
2.2.1 NumPy矩阵介绍
2.2.2 NumPy通用函数介绍
2.2.3 通用函数的广播机制
2.3 利用NumPy进行统计分析
2.3.1 NumPy读写二进制文件
2.3.2 NumPy读写txt文件
2.3.3 利用NumPy对数据进行简单统计分析
第三天
Pandas数据分析基础
1 Matplotlib数据可视化基础
1.1 掌握绘图基础语法与常用参数
1.1.1 Matplotlib介绍
1.1.2 基础图形绘制
1.1.3 常用参数设置
1.2 分析特征间关系
1.2.1 绘制散点图
1.2.2 散点图参数设置
1.2.3 绘制折线图
1.3 分析特征内部数据分布与分散情况
1.3.1 绘制柱形图
1.3.2 绘制饼图
1.3.3 绘制箱线图
2 Pandas统计分析基础
2.1 Pandas简介
2.2 读写不同数据源的数据
2.2.1 Pandas读取文本数据
2.2.2 存储数据框
2.2.3 Pandas读取excel文件
2.2.4 将数据框存储为excel文件
2.3 数据框与数据框元素
2.3.1 构建数据框
2.3.2 查看数据框的常用属性
2.3.3 按行列顺序访问数据框中的元素
2.3.4 按行列名称访问数据框中的元素
2.3.5 修改数据框中的元素
2.3.6 删除数据框中的元素
2.3.7 描述分析数据框中的元素
第四天
Pandas数据分析基础
2.4 转换与处理时间序列数据
2.4.1 转换成时间类型数据
2.4.2 时间类型数据的常用操作
2.5 使用分组聚合进行组内计算
2.5.1 groupby分组操作
2.5.2 agg聚合操作
2.6 创建透视表与交叉表
2.6.1 生成透视表
2.6.2 生成交叉表
3 使用Pandas进行数据预处理
3.1 合并数据
3.1.1 表堆叠
3.1.2 主键合并
3.1.3 重叠合并
3.2 清洗数据
3.2.1 检测与处理重复值
3.2.2 检测与处理缺失值
3.2.3 检测与处理异常值
3.3 标准化数据
3.4 转换数据
3.4.1 哑变量处理
3.4.2 离散化连续型数据
第五天
Python机器学习实战
1机器学习绪论
1.1引言
1.2基本术语
1.3假设空间&归纳偏好
2模型评估与选择
2.1经验误差与过拟合
2.2评估方法
2.3性能度量
2.4性能度量Python实现
3回归分析
3.1线性回归基本形式
3.2线性回归模型的Python实现
3.3波士顿房价预测的Python实现
3.4逻辑回归介绍
3.5研究生入学录取预测的Python实现
4决策树
4.1从女生相亲到决策树
4.2明天适合打球吗
4.3决策树拆分属性选择
4.4决策树算法家族
4.5(实例1)数据预处理
4.6(实例2)模型构建与预测
第六天
Python机器学习实战
5人工神经网络
5.1单个神经元介绍
5.2经典网络结构介绍
5.3神经网络工作流程演示
5.4如何修正网络参数-梯度下降法
5.5网络工作原理推导
5.6网络搭建准备
5.7样本从输入层到隐层传输的Python实现
5.8网络输出的Python实现
5.9单样本网络训练的Python实现
5.10全样本网络训练的Python实现
5.11网络性能评价
5.12调用sklearn实现神经网络算法
第七天
Python机器学习实战
6支持向量机
6.1间隔与支持向量
6.2对偶问题
6.3核函数
6.4软间隔与正则化
6.5支持向量机算法的Python实现
7.1聚类分析概述
7.2相似性度量
7.3K-Means聚类分析算法介绍
7.4利用K-Means算法对鸢尾花进行聚类
7.5聚类结果的性能度量
7.6调用sklearn实现聚类分析
8 集成学习
8.1 集成学习基本概念
8.2 并行集成算法-Bagging&RandomForest
8.3 串行集成算法-Boosting算法流程
8.4 串行集成算法-Boosting代码实现
8.5 Stacking算法流程
8.6 Stacking代码实现
第八天
Python特征工程实战
1.1 特征工程是什么
1.2 特征工程效果评估
1.3 定性还是定量
1.4 数据的4个等级介绍
1.5 数据的4个等级演示
2.1 探索性数据分析
2.2 探究不同类别样本的血糖浓度
2.3 缺失值探索
2.4 删除缺失值
2.5 构建基线模型
2.6 网格搜索优化
2.7 利用0进行缺失值填充的模型性能
2.8 利用均值进行缺失值填充的模型性能
2.9 标准化和归一化介绍
2.10 结合机器学习流水线进一步优化
2.11 数据预处理小结
3.1 特征构建引言
3.2 分类数据的填充
3.3 自定义分类数据填充器
3.4 自定义定量数据填充器
3.5 编码定类数据
3.6 编码定序变量
3.7 连续变量分箱
3.8 在流水线中封装预处理操作
3.9 拓展数值特征的模型基线
3.10 多项式特征模型性能
第九天
Python特征工程实战
4.1 特征选择介绍
4.2 数据导入及探索
4.3 基于皮尔逊相关系数的特征选择
4.4 特征选择前后模型性能比较
4.5 基于假设检验的特征选择
4.6 基于树的特征选择
4.7 特征选择后模型性能探索
4.8 基于线性模型的特征选择
4.9 小结
5.1 特征转换介绍
5.2 主成分分析(PCA)介绍
5.3 PCA工作流程实现
5.4 PCA方差分析
5.5 利用sklearn实现PCA
5.6 深入解释PCA之相关性探究
5.7 深入解释PCA之线性变换
5.8 深入解释PCA之数据分布探索
5.9 PCA小结
5.10 LDA工作流程及实现
5.11 sklearn实现LDA
5.12 LDA数据分布探索
5.13 应用特征转换
6.1 特征学习介绍
6.2 受限玻尔兹曼机(RBM)工作原理
6.3 MNIST数字识别任务介绍
6.4 MNIST数据准备
6.5 PCA特征分析
6.6 RBM特征学习
6.7 构建基线模型
6.8 加入PCA进行模型优化
6.9 加入RBM进行模型优化
6.10 多层受限玻尔兹曼机
第十天
实战案例一
1.1背景与目标
1.2案例思路分析
2.1数据探索
2.2数据去重及删除无关属性
2.3用户分组及标签构建
2.4提取用户基本信息和在网时长
2.5处理合约是否有效
2.6处理合约计划到期时间
2.7其余变量处理
2.8特征拼接及缺失值处理
2.9数据保存
3.1特征选择介绍
3.2皮尔逊特征选择
3.3处理样本类别不均衡问题
4.1模型性能评估介绍
4.2模型构建及性能评估
第十一天
实战案例二
1 背景与目标
2 数据处理
2.1 读取数据
2.2 了解数据基本情况
2.3 哑变量处理
2.4 拼接特征并删除无关列
2.5 标签转化及预处理函数封装
3 模型训练与验证
3.1 认识集成学习算法
3.2 模型训练与性能验证
3.3 保存模型集训练数据结构
4 模型应用与评估
4.1 加载并处理待预测样本
4.2 模型应用及性能评估
六、报名及缴费
(一)报名方式与时间
1.个人报名请提报名申请表、身份证号码、两寸近期正面免冠彩色半身证件照电子版( 背景:白色,格式:JPG,大小:14-20K);学历证明、工作年限证明或相关专业证书(电子版);参加培训人员需自带笔记本电脑;
2.团队报名请咨询董老师,填写报名回执表进行报名;
3.报名时间:2023年6月6日—7月10日。
(二)收费标准
本期研修班收费标准为2480元/人,企业团体线上报名 24800元/单位(限15人/单位)。
(三)付款方式
1.支付宝或微信扫描报名成功后生成的缴费二维码在线缴费。
支付宝用户
微信用户
七、结业证书
参训学员按照规定完成研修课时,由中国高等教育培训中心颁发《机器学习与大数据分析》电子版“结业证书”,证书中注明研修课程名称及学时。
八、联系方式
联系人:董老师
电话:15727391920
邮箱:andrew_0001@163.com
地址:北京市海淀区清华科技园
常年开班,获取最新开班时间或课程报名,欢迎您联系董老师
序号 | 昵称 | 年级 | 性别 | 备注 |
---|---|---|---|---|
暂无数据 |
序号 | 课堂内容 | 开始时间 | 备注 | 课堂回放 |
---|---|---|---|---|
暂无数据 |