大数据导论
1. 课程简介
本课程的主要目的是让学生了解什么是大数据,大数据的特点,大数据思维,大数据的核心技术,大数据应用,大数据带来的变革,以及大数据面临的挑战,从而使学生对大数据技术和应用有一个初步的了解。本课程重视演示和实战,以便使学生通过亲身体验来理解和掌握大数据的核心概念。
2. 课程安排(74学时:42学时讲课,6学时演示,26学时实验)
第一阶段:大数据概述(8+4+0)
第一课:(理论:2学时)
第一章大数据概述瓷都景德镇是哪个省
第二课:(理论:2学时)
第二章大数据采集
第三课:(理论:2学时)
第三章大数据预处理
第四课:(演示:2学时)
演示一:大数据技术演示
第五课:(理论:2学时)
第四章大数据处理系统
通天峰第六课:(演示:2学时)
演示二:大数据应用演示
第二阶段:大数据存储技术(8+0+8)
第七课:(理论:2学时)
第五章大数据文件系统HDFS
第八课:(使用:2学时)
实验一:分布式文件系统HDFS使用
第九课:(理论:2学时)
第六章 NoSQL数据库HBase
第十课:(实验:2学时)
实验二:列式数据库HBase使用
第十一课:(理论:2学时)
第七章数据仓库Hive
第十二课:(理论:2学时)
第七章数据仓库Hive
第十三课:(实验:2学时)
哪些古装电视剧好看实验三:HiveQL 命令行的使用
第十四课:(实验:2学时)
实验四:使用JDBC程序操作数据库
第三阶段:大数据处理技术(12+0+10)第十五课:(理论:2学时)
第八章大数据批处理Hadoop MapReduce
第十六课:(理论:2学时)
第八章大数据批处理Hadoop MapReduce
第十七课:(实验:2学时)
实验五:批处理模式MapReduce应用
第十八课:(理论:2学时)
第九章大数据快速处理Spark
第十九课:(实验:2学时)
实验六:内存处理模式Spark应用
第二十课:(理论:2学时)
广西二本学校第十章大数据实时流计算 Spark Streaming
第二十一课:(实验:2学时)
实验七:流式处理模式Spark Streaming应用
第二十二课:(理论:2学时)
第十一章分布式图计算框架 Spark GraphX
第二十三课:(实验:2学时)
实验八:图处理模式Spark Graph应用
第二十四课:(理论:2学时)
第十二章大数据随机查询 Spark SQL
第二十五课:(实验:2学时)
实验九:大数据随机查询Spark SQL使用
第四阶段:大数据挖掘技术(14+2+8)第二十六课:(理论:2学时)
第十三章大数据挖掘概述
第二十七课:(理论:2学时)
第十三章大数据挖掘概述
第二十八课:(理论:2学时)
第十三章大数据挖掘概述
第二十九课:(演示:2学时)
演示三:数据挖掘应用体验
第三十课:(理论:2学时)
第十四章大数据挖掘系统 Spark MLlib
第三十一课:(实验:2学时)
实验十:聚类算法实验
第三十二课:(实验:2学时)
实验十一:分类算法实验
第三十三课:(实验:2学时)
实验十二:关联分析算法实验
第三十四课:(实验:2学时)
实验十三:协同过滤算法实验
第三十五课:(理论:2学时)
第十五章大数据可视化
第三十六课:(理论:2学时)
第十六章 Python数据可视化
第三十七课:(理论:2学时)
第十七章大数据的功能应用场景
3. 学时分配
章理论课演示课实验课合计第一章大数据概念2学时2学时第二章大数据采集2学时2学时第三章大数据预处理2学时2学时4学时第四章大数据处理系统2学时2学时4学时第五章大数据文件系统HDFS 2学时2学时4学时第六章 NoSQL数据库HBase 2学时2学时4学时第七章数据仓库Hive 4学时4学时8学时
4学时2学时6学时第八章大数据批处理Hadoop
MapReduce
第九章大数据快速处理Spark 2学时2学时4学时
2学时2学时4学时第十章大数据实时流计算Spark
Streaming
2学时2学时4学时第十一章分布式图计算框架Spark
GraphX
第十二章大数据随机查询Spark SQL 2学时2学时4学时第十三章大数据挖掘概述6学时2学时8学时
第94届奥斯卡提名名单2学时8学时10学时第十四章大数据挖掘系统Spark
MLlib
第十五章大数据可视化2学时2学时第十六章 Python大数据可视化2学时2学时
储蓄卡和信用卡的区别第十七章大数据的功能应用场景2学时2学时合计42学时6学时26学时74学时
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论