课程名称:富华保险大数据分析平台实训项目
课程周期:48课时
课程收获:
1.熟悉Hadoop生态圈,掌握大数据环境的搭建过程
2.掌握Hadoop+Spark+Hive的用法,能够运用SparkSQL进行数据仓库的一系列操作
3.熟练应用FineBI,DolphinScheduler等组件对数据仓库进行可视化,任务调度等操作
4.掌握保险行业精算流程
课程概述:
近几年随着保险行业的发展,为了满足不同场景下的保险业务需求,保险公司不断推出新的保险产品,对于保险的产品的定价精算业务不断增多,使用传统的工具来计算保费缺点日益显现,商业授权使用费用昂贵,计算资源不易弹性扩展。SparkSQL支持大数据的计算,灵活编程,支持所有场景,分布式处理速度比单机快,支持迭代计算,软件开源,集群资源易扩展费用划算。正是在此背景下,我们以富华保险为业务背景,开展此次富华保险大数据项目实训。
本项目为综合项目,包含Linux基础,SparkSQL技术,HDFS分布式文件系统,保险大数据业务分析,项目实战。通过本项目的学习,我们可以更好的体验数据仓库的搭建,分析,可视化以及任务调度等功能,从而对数仓有一个更新的认识。
课程亮点
1.基于HDFS实现出行大数据异构数据源存储。
2.使用Sqoop实现数据的导入导出。
3.使用SparkSQL数仓构建技术实现出行大数据数据分析。
4.使用FIneBI实现数据分析结果展示。
5.使用DolphinScheduler实现数仓的任务调度。
项目成果:
投保理赔差额分布图和投保区域分布
投保热力地图
城市投保理赔排名
1.计算机、数据科学与大数据技术等相关专业老师。
2.正在从事或未来想从事数据仓库相关方向的老师。
3.在工作中会用到数据分析相关技能的老师。
获取方式:请扫描下方二维码,回复【大数据】即可获取完整预习资料
硬件环境要求
1、PC机器CPU:8G Hz以上
2、PC机器内存:16GB以上
3、录音设备与扬声设备
1.体验大数据环境的搭建过程
2.熟练使用基础Linux实操能力
3.能够使用SparkSQL完成基础统计分析
4.能够使用Sqoop,FineBI,DS等数据仓库相关组件
5.使用MetaStore实现对元数据管理功能
1月6日
环境搭建
1月7日
数据开发技术栈(Hadoop+Spark)
1月8日
数据开发技术栈(SparkSQL)
1月10日
项目实战(一)
1月11日
项目实战(二)
1月12日
项目实战(三)