《大数据技术基础》教案 第1课 大数据概述(一)
《大数据技术基础》
教案
课时分配表
章序课程内容课时备注
1 大数据概述  4
2 大数据处理平台Hadoop    4
3 数据采集与预处理  4
4 数据存储与管理  4
5 数据处理与分析  6
6 数据可视化  4
7 大数据思维与安全  2
8 城市空气质量大数据分析实战  4
合计32
课题大数据概述(一)课时2课时(90 min)
教学目标
知识技能目标:
(1)理解大数据的概念和主要特征。
(2)了解大数据的发展现状与趋势。
(3)了解我国的大数据发展战略
(4)理解大数据的处理流程
思政育人目标:
深刻理解大数据作为国家基础性战略资源的重要意义,如推动经济发展、完善社会治理、提升政府服务和监管能力等,进一步加强对信息化新阶段和数字经济的认识,不断提升自身的信息素养。
教学重难点教学重点:大数据的概念和特征教学难点:大数据的处理流程
教学方法案例分析法、问答法、讨论法、讲授法教学用具电脑、投影仪、多媒体课件、教材
教学设计第1节课:考勤(2 min)→新课预热(10 min)→问题导入(5 min)→传授新知(18 min)→课堂讨论(10 min)
第2节课:问题导入(5 min)→传授新知(20 min)→课堂互动(15 min)→课堂小结(3 min)→作业布置(2 min)
教学过程主要教学内容及步骤设计意图
第一节课
考勤(2 min)⏹【教师】使用APP进行签到
⏹【学生】按照老师要求签到
培养学生的组
织纪律性,掌握学
生的出勤情况
新课预热(10 min)
企业路由器⏹【教师】自我介绍,与学生简单互动,介绍课程内容、考核
标准等
⏹【学生】聆听、互动
⏹【教师】利用多媒体课件展示大数据的广泛应用,并和学生
焦急近义词互动,询问学生对于大数据的印象
随着信息技术的飞速发展和计算机教育的普及,社会对大数据
的依赖越来越大,大数据应用也随处可见,我们经常使用的各类软
件都有大数据应用的痕迹,例如抖音,淘宝,微博,等等。
通过老师自我
介绍,与学生相互
熟悉,并让学生了
解这门课的大致
要求
2
⏹【学生】聆听、记录、互动、理解
问题导入(5 min)⏹【教师】提出以下问题:
你认为什么是大数据?它的优缺点各是什么?
⏹【学生】思考、举手回答
⏹【教师】通过学生的回答引入要讲的知识
通过问题导入
的方法,引导学生
主动思考,激发学
生的学习兴趣
传授新知(18 min)
⏹【教师】通过学生的回答引入要讲的知识,介绍大数据的概
念、特征和发展
一、什么是大数据
✈【教师】通过多媒体展示数据的基本概念和对于生活的重要
作用
数据是用来记录客观事物或事件的符号,具体来说,是对客观
事物或事件的性质、状态及相互关系等信息进行记录的物理符号。
它是可识别的、抽象的符号(详见教材)
✈【教师】提出问题:
我们已经知道了数据的概念,那么大数据是否只是数量较多的
数据呢?如果不是,那你是怎么理解大数据呢?
✈【学生】思考、举手回答
✈【教师】组织学生阅读“家国情怀”中的内容(详见教材),
并提问:
通过阅读上面的案例,你认为大数据对于现代社会具有哪些重
要意义?
✈【学生】思考、举手回答
二、大数据的特征
✈【教师】提出以下问题:
你知道大数据具有哪些特征吗?
✈【学生】思考、举手回答
大数据的特征包括大数据具有海量的数据规模(volume)、
快速的数据流转(velocity)、多样的数据类型(variety)和数
据价值密度低(value)四大特征,简称4V。
三、大数据的发展
✈【教师】展示与大数据发展相关的图片
通过教师的讲
解和演示,互动以
及案例,使学生了
解大数据的概念、
特征和发展
3
大数据的发展现状与趋势主要表现在以下几个方面(1)大数据底层技术逐步成熟。
(2)大数据产业规模平稳增长。
(3)数据合规要求日益严格。
(4)大数据战略持续拓展。
(详见教材)十一月祝福语
⏹【学生】聆听、记录、理解
课堂讨论(10 min)
⏹【教师】组织学生阅读“青山绿水”中的案例(详见教材),
然后组织学生以小组为单位讨论以下问题:
这个案例体现了大数据在什么领域的应用?你还知道哪些大数
据的应用领域?
⏹【学生】聆听、思考、小组讨论,由小组代表上台发表讨论
结果
⏹【教师】与学生一起评价各组的讨论结果
通过课堂讨论,
辰时是什么时间加深学生对大数
据发展历史的认
第二节课
问题导入(5 min)⏹【教师】提出问题:
你知道大数据处理数据的流程是怎样的吗?
【学生】聆听、思考、举手回答
通过问题
导入,引导学
生主动思考,
激发学生的
学习兴趣
传授新知(20 min)⏹【教师】通过学生的回答引入新的知识,介绍大数据的处理
流程
一、数据采集与预处理
由于大数据超大规模的体量,以及众多用户的频繁操作访问,
使得仅使用传统的数据采集方法难以满足业务需求,因此需要通
过专门的采集方法对大数据进行采集。采集形式主要有网络数据
采集(如提取网页中的图片、文本等)、系统日志采集(业务平
台每天都会产生大量的日志数据)、数据库数据采集(如关系型
数据库的接入)等,常用的工具有网络爬虫工具、Flume、Kafka、
Sqoop等。
……(详见教材)
饭店服务员管理制度✈【教师】提出以下问题:
通过讲授,
提问,讨论等
教学方式,让
学生了解大
数据的处理
流程
4
大数据在处理数据时,会先对数据进行预处理,这是为什么呢?
✈【学生】思考、举手回答
✈【教师】对学生的回答进行总结
想要获得高质量的数据分析结果,必须在数据准备阶段提高数
据的质量,即对大数据进行预处理。数据预处理是指将杂乱无章的
数据转化为相对单一且便于处理的结构,或者去除没有价值甚至可
能对分析造成干扰的数据,从而为后期的数据分析奠定基础。
二、数据存储与管理
经过预处理后的数据,被放到文件系统或数据库系统中进行
存储与管理。数据存储与管理是指用存储器把采集到的数据存储
起来,并建立相应的数据库,以便对数据进行管理和调用。
目前,主要采用HDFS分布式文件系统、NoSQL数据库(非
关系型数据库)、数据仓库、云数据库等来存储和管理大数据。其
中,常用的NoSQL数据库包括HBase、Redis、Cassandra、MongoDB、Neo4j等。(详见教材)
✈【教师】提出问题:
你知道什么是分布式系统吗?
✈【学生】聆听、思考、举手回答
✈【教师】对学生的回答进行总结
分布式系统是由一组通过网络进行通信,为了完成共同的任务
而协调工作的计算机组成的系统。分布式系统包括分布式计算和分
布式存储,作用是使用众多计算机完成单个计算机无法完成的计算
和存储任务。其中,分布式存储又包括分布式文件系统和分布式数
据库等。
三数据处理与分析
数据处理与分析是指通过各种算法从大量的数据中出潜在的
有用信息,并研究数据的内在规律和相互间的关系。
数据处理与分析大多需要在大数据处理平台上进行,借助分布
照组词
式并行框架,通过结合一系列算法完成。常用的工具或技术有MapReduce、Spark、Storm、Hive、Pig、Flink、Impala、Mahout
等。
四、数据可视化
✈【教师】展示“数据可视化示意图”,协助讲解知识点
5

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。