各有关机构、学员:
科技立则民族立,科技强则国家强。新一轮科技革命与产业变革迅猛发展,科技创新已经成为国际战略博弈的主战场。党的二十大报告中提出,教育、科技、人才是全面建设社会主义现代化国家的基础性、战略性支撑。必须坚持科技是第一生产力、人才是第一资源、创新是第一动力。深入实施科教兴国战略、人才强国战略、创新驱动发展战略,开辟发展新领域新赛道,不断塑造发展新动能新优势。实现这一战略的关键是有足够数量和质量的人才,为加强新时代高技能人才队伍建设,深化产教融合,校企合作,提升相关从业人员的职业技能,拟开展大数据技术应用人才培养。
一、举办单位
主办单位:中国高等教育培训中心
承办单位:北京华业大教育科技有限公司
二、研修时间
时间:2023年7月15日--7月21日
地点:北京(线下详细报到路线将在第二轮通知中告知)
线 上:直播+回放(毛豆课堂,无需下载任何软件)
三、培训对象
各高等院校/职业院校统计学、数学、审计、计算机、生物、医学、环境科学、经济学、社会学、管理学应用、数据科学与大数据技术、大数据与审计专业、数据采集、数据分析、数学建模等相关专业的学院领导、专业教学带头人、实验室教学技术人员及骨干教师,研究生;互联网企业、金融机构、科研院所等从事大数据分析、挖掘、处理、服务、应用和研究技术人员等。
四、培训目的
为大数据产业快速发展保驾护航,搭建校企互动交流平台,提升教师专业实践能力,加强新时代高技能人才队伍建设,有效提高各院校大数据专业的课程教学质量,使教育教学体系真正与就业接轨,实现人才培养与人才就业无缝对接,助力行业健康发展
五、培训内容
第一天
Linux操作系统基础
1.Linux概述
1.1 Linux简介与发展历程
1.2 Linux常见版本
2.Linux基本命令:
2.1 Linux文件系统树
2.2 创建与删除目录或文件
2.3 查看文件内容
2.4 创建硬链接和符号链接
2.5 帮助命令
2.6 重定向相关命令
2.7 用户及用户组
2.8 权限相关命令
2.9 用户、用户组及权限实践操作进程
3.Linux Vi编辑器:
3.1 模式介绍与常见快捷命令
3.2 一般模式快捷键
3.3 编辑模式与指令模式快捷键
Java编程基础
1.基础知识:
1.1 Java 简介
1.2 Java 安装配置
1.3 Java 基础语法
1.4.1 Java 基本数据类型&引用数据类型
1.4.2 Java 变量
1.5 Java String 类
1.6.1 Java 运算符-赋值运算符&算术运算符
1.6.2 Java 运算符-关系、逻辑、其他运算符
1.7 循环、条件、循环中断
1.8 Java 数组
1.9.1 函数-修饰符用法
1.9.2 函数的定义
1.9.3 函数重载
1.10.1 Java 集合简介
1.10.2 Java 集合之 List
1.10.3 Java 集合之 Set
1.10.4 Java 集合之 Map
1.10.5 Java 集合-实例
1.11 Java 泛型
2.面向对象:
2.1 类和实例
2.2.1 类封装
2.2.2 类继承
2.2.3 类多态
2.2.4 类多态实战
2.3.1 抽象类、接口
2.3.2 抽象类、接口实战
3.线程及异常处理:
3.1.1 多线程-1
3.1.2 多线程-2
3.1.3 多线程-练习
3.2.1 包、异常-1
3.2.2 包、异常-2
第二天
Scala编程基础
1.Scala简介
1.1. Scala简介
2.Scala安装配置
2.1 Scala线上环境介绍
2.2 在Windows上搭建Scala
2.3 在Linux上搭建Scala
2.4 Scala插件安装
2.5 创建第一个Scala工程
3.Scala基础语法
3.1 Scala类型、变量、运算符
3.2 数组
3.3 if条件判断
3.4 循环语句
3.5 实现冒泡排序法
3.6 列表List
3.7 列表ListBuffer
3.8 集合Set
3.9 计算最大公约数和最小公倍数
3.10 映射Map
3.11 元组Tuple
4.函数
4.1 函数定义
4.2 匿名函数
4.3 高阶函数
4.4 集合中的高阶函数
4.5 递归与尾递归
5.面向对象编程
5.1 面向对象编程简介
5.2 类的定义
5.3 定义类实现有理数的运算
5.4 单例对象
5.5 样例类和模式匹配
6.文件读写
6.1 文件读写
6.2 手机号码段查询
第三天
Hadoop大数据基础
1.认识Hadoop
1.1 认识大数据
1.2 Hadoop简介和发展简史
1.3 Hadoop特性与生态环境
2.Hadoop集群的安装配置
2.1 安装虚拟机
2.2 配置固定IP
2.3 克隆虚拟机并修改配置
2.4 配置ssh无密码登录
2.5 配置时间同步服务
第四天
2.6 安装Java
2.7 Hadoop集群架构
2.8 Hadoop集群安装与配置
2.9 Hadoop集群启动与监控界面介绍
3.HDFS基本操作
3.1 HDFS简介及架构
3.2 HDFS数据读写流程
3.3 HDFS管理命令
3.4 HDFS目录基本操作
3.5 HDFS文件基本操作
第五天
4.MapReduce原理与架构
4.1 MapReduce思想与设计构思
4.2 MapReduce框架结构
5.MapReduce入门编程
5.1 MapReduce单词计数原理
5.2 MapReduce单词计数源码分析
5.3 搭建MapReduce开发环境
5.4 MapReduce单词计数编程实现
5.5 MapReduce实现XX与YY连接
5.6 MapReduce实现单词统计次数排序
第六天
Hive大数据仓库
1. Hive简介
1. Hive简介
2. Hive安装配置
2.1 Hadoop集群介绍与MySQL安装
2.2 Hive安装配置
2.3 Hive单词计数
3. Hive应用
3.1.1 Hive表定义
3.1.2 创建内部表与外部表
3.1.3 创建静态分区表和动态分区表
3.1.4 创建带数据的表和桶表
3.2 Hive导入及导出
第七天
3. Hive应用
3.3.1 Select查询基本用法1
3.3.2 Select查询基本用法2
3.3.3 内置函数应用
3.3.4 关联查询
第八天
4. Hive开发
4.1 构建Maven工程
4.2 开发环境连接测试
4.3 创建公共连接类与建表
4.4 导入数据到订单表与物品表
4.5 统计顾客数量和商品销售量
4.6 统计各类型商品的购买情况
4.7 统计所有商品销量排名Top20
4.8 统计不同类型商品销量Top10
4.9 将相同客户订单整合写入Hive
5. Hive自定义函数
5.1 创建UDF函数
5.2 创建临时函数
5.3 永久函数的创建与删除
5.4 创建UDAF函数
5.5 创建UDTF函数
6. Hive查询优化
6.1 视图的创建与删除
6.2 创建物化视图
6.3 文件存储格式
第九天
项目实战(一)
1. 案例背景与挖掘目标
2. 数据存储
3. 数据探索与数据清洗
4. 属性规约
5. 属性构造
第十天
HBase非关系型数据库
1. HBase简介与原理架构
1.1 HBase简介
1.2 HBase原理架构
2. HBase安装配置
2.1 安装集群
3. HBase Shell基本操作
3.1 namespace操作命令
3.2 创建表和查看表
3.3 修改和删除表
3.4 插入和查看数据
3.5 删除表数据
第十一天
4. 表的模式设计
4.1 表设计
5. HBase Java API应用
5.1 开发环境创建和连接HBase集群
5.2 Java API实现创建表和删除表
5.3 Java API设置Region
5.4 Java API修改列簇
5.5 Java API插入数据
5.6 Java API查看和删除数据
5.7 Java API任务实现
第十二天
Spark大数据技术基础
1. Spark入门
1.1 Spark入门
2. Spark集群的安装配置
2.1 Spark安装部署
2.2 Spark安装部署实战
3. Spark架构及原理
3.1 Spark架构
3.2 Spark RDD及DAG图相关概念
4. Spark编程基础
4.1 创建RDD
4.2 RDD常用算子之transformation算子(1)
4.3 RDD常用算子之transformation算子(2)
4.4 RDD常用算子之键值对RDD算子
4.5 RDD常用算子之action算子
4.6 文件读取与存储
4.7 统计用户停留时间最长的基站
第十三天
5. 配置Spark IDEA开发环境
5.1 搭建Spark开发环境
6. Spark SQL应用
6.1 Spark SQL简介
6.2 Spark SQL配置
6.3 从结构化数据文件创建DataFrame
6.4 从外部数据库创建DataFrame
6.5 从RDD创建DataFrame
6.6 读取Hive表数据创建DataFrame
6.7 读取学生成绩创建DataFrame
6.8 常见DataFrame API操作1
6.9 常见的DataFrame操作2
6.10 常见的DataFrame操作3
6.11 通过DataFrame API计算学生总分和平均分
6.12 保存DataFrame数据
6.13 保存学生成绩分析结果到Hive
6.14 DataSet基础操作
6.15 统计商品销量
第十四天
项目实战二:大数据用户画像(Hadoop + Spark + Hive)
1. 项目背景与目标分析
1.1 背景介绍
1.2 目标分析
1.3 系统架构介绍
2. 数据存储
2.1 数据介绍
2.2 数据存储
2.3 开发环境搭建
3. 数据探索与清洗
3.1.1 数据探索1
3.1.2 数据探索2
3.1.3 数据探索3
3.1.4 数据探索4
3.2.1 数据清洗1
3.2.2 数据清洗2
3.2.3 数据清洗3
第十五天
4. 用户画像标签计算
4.1 用户画像简介
4.2 消费内容
4.3 消费等级
4.4 产品名称
4.5 入网程度&业务名称
4.6 地区&语言偏好
5. SVM预测用户是否挽留
5.1 SVM介绍
5.2 特征构建
5.3 标签构建
5.4 模型构建与评估
自行安排课程
1 大数据分布式消息Zookeeper
2 Flume数据采集
3 Kafka消息系统
4 Flink大数据实时处理
5 商品实时推荐系统(Flume + Kafka + Flink)
六、报名及缴费
1.报名材料及要求
报名申请表、身份证号码、两寸近期正面免冠彩色半身证件照电子版( 背景:白色,格式:JPG,大小:14-20K);学历证明、工作年限证明或相关专业证书(电子版);参加培训人员需自带笔记本电脑。
2.报名时间:2023年5月22日--6月8日。
3.收费标准:本期研修班线下收费标准为机器学习与大数据分析人才(高级)2480元/人(此外无任何费用)。
本次培训由北京华业大教育科技有限公司收取费用并开具电子发票。
七、结业证书
参训学员按照规定完成研修课时,由中国高等教育培训中心颁发《机器学习与大数据分析》电子版“结业证书”,证书中注明研修课程名称及学时。
八、联系方式
联系人:董老师
电话:15727391920(微信同号)
邮箱:andrew_0001@163.com
地址:北京市海淀区清华科技园
常年开班,获取最新开班时间或课程报名,欢迎您联系董老师
序号 | 昵称 | 年级 | 性别 | 备注 |
---|---|---|---|---|
暂无数据 |
序号 | 课堂内容 | 开始时间 | 备注 | 课堂回放 |
---|---|---|---|---|
暂无数据 |