云计算与大数据技术应用习题
1. 简述什么是云计算?
答:云计算是一种动态扩展的计算模式,通过网络将虚拟化的资源作为服务提供;云计算是一种无处不在的、便捷的通过互联网访问一个可定制的IT资源(IT资源包括网络、服务器、存储、应用软件和服务)共享池,并是一种按使用量付费的模式,它能够通过最少量的管理或与服务供应商的互动实现计算资源的迅速供给和释放;云计算是基于互联网服务的增加、使用和交付模式,通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源。
2. 云计算有什么特点?
答:具有大规模并行计算能力;资源虚拟化(Virtualization)和弹性调度;数据量巨大并且增速迅猛;高可靠性;按需分配,按量计费。
3. 请分别回答什么是IaaS、PaaS、SaaS?
答:IaaS:基础设施即服务Infrastructure as a ServicePaaS:平台即服务Platform as a ServiceSaaS:软件即服务Software as a Service。
4. 云计算的基础设施有哪些,各自完成什么功能?
答:分布式文件系统,完成数据的存储;MapReduce编程模式,提供分布式并行编程环境进行数据处理;大规模分布式数据库BigTable,提供分布式大规模数据库管理系统。
1. 解释说明什么是非结构化和半结构化数据?
答:非结构化数据是数据结构不规则或不完整,没有预定义的数据模型,不方便用数据库二维逻辑表来表现的数据,包括所有格式的办公文档、文本、图片、图像和音频/视频信息等。半结构化数据是介于完全结构化数据(如关系型数据库、面向对象数据库中的数据)和完全无结构的数据之间的数据,XML、HTML文档属于半结构化数据,它一般是自描述的,数据的结构和内容混在一起,没有明显的区分。
2. 大数据价值链的三大构成是什么?
答:数据本身、技能与思维。
3. 大数据的4V特征是什么?
母亲节的短信
答:多样性(Variety);规模性大(Volume);快速性(Velocity);价值密度低(Value)。
4. 简述云计算与大数据的关系?
答:云计算与大数据是一对相辅相成的概念,它们描述了面向计算时代信息技术的两个方面,云计算侧重于描述资源和应用的网络化交付方法,大数据侧重于描述面向数据时代由于数据量巨大所带来的技术挑战。
云计算的核心是业务模式,本质是数据处理技术。数据是资产,云为数据资产提供了存储、访问的场所和计算,即云计算更偏重海量存储和计算,以及提供的云服务,运行云应用。云计算是基础设施架构,大数据是灵魂资产。
1. 什么是虚拟化?
答:虚拟化是一个广义的术语,对不同的行业或不同的人有着不同的意义。在计算机科学领域中,虚拟化意味着对计算机资源的抽象。简单来说,虚拟化是模拟真正的(或者称物理的)计算机资源,模拟CPU、内存、存储、网络等用户可见的物理的硬件资源。
2. 为什么要使用虚拟化?
答:使用虚拟化的原因主要有以下四点:
(1)使用虚拟化可以共享资源,而相互不受影响。
2使用虚拟化可以将很多零散的资源集中到一处,而使用的用户则感觉像是一个整体。
3使用虚拟化可以动态维护资源的分配,动态扩展或减少某个用户所使用的资源。
4使用虚拟化易于管理资源,易于发布版本,易于部署版本,易于测试版本等。
3. 常见的虚拟化技术有哪些?
答:常见的虚拟化技术有:CPU虚拟化,内存虚拟化,全虚拟化,半虚拟化,硬件辅助虚拟化,存储虚拟化等虚拟化技术
1. 数据中心的发展经历了_________、________、_______、_______四个阶段。
答:巨型机时代、微型计算机/PC时代、互联网时代、云计算大数据时代。
2. 数据中心的选址主要考虑_________、_________、_________、_________等因素。
答:地质条件、气候环境、电力供给、网络带宽。
3. 数据中心的主要组成部分有_________、_________、_________、_________。
答:基础设施、硬件设施、基础软件、管理支撑软件。
4.PUE的定义为_____________________________________________。
答:PUEPower Usage Effectiveness世界三大运河由美国绿网格联盟The Green Grid于2007年提出,是业界公认的测量数据中心能耗的主要指标之一,其定义如下:
信噪比
5. DCIE的定义为_____________________________________________。
答:DCIE(Data Center Infrastructure Efficiency)是数据中心能耗评估的另一公认指标,是由美国绿网格联盟于2007年提出,用于表示数据中心IT设备用电占总用电量的比例,
其定义如下:
1. 解释说明什么是并行计算?简要概括并行计算的发展如何?
答:在计算机术语中,并行性指的是把一个复杂问题分解成多个能同时处理子问题的能力。并行计算(Parallel Computing)是指同时使用多种计算资源解决计算问题的过程,是提高计算机系统计算速度和处理能力的一种有效手段。
20世纪70年代,第一台并行计算机于1972年产生(ILLIAC IV,伊利诺依大学),由64个处理器组成,可扩展性好,但可编程性差;20世纪80年代,并行计算机进入百家争鸣状态,以多指令多数据流MIMD(Multiple Instruction stream Multiple Data stream)并行计算机为主;20世纪90年代,并行计算体系结构框架趋于统一,基本以分布式共享存储(Distributed Shared MemoryDSM)、大规模并行处理结构(Massively Parallel ProcessingMPP)、工作站机(Cluster of WorkstationsCOW)为代表;21世纪初,并行计算得到了前所未有的大踏步发展,以COW为原型的由大规模商用普通PC机构
成的机为主;今天,越来越多的并行计算机系统采用商品化的微处理器加上商品化的互连网络构造,这种分布存储的并行计算机系统称为集(NOW),并行计算进入了一个新的时代,并行计算的应用达到了前所未有的广度和深度。
2. 简要说明集的概念和集系统的分类。
答:集是一组独立的计算机(结点)的集合体,结点间通过高性能的网络相连接,各结点除了作为一个单一的计算资源供用户使用外,还可以协同工作,并表示为一个单一的、集中的计算资源,供并行计算使用。集是一种造价低廉、易于构建并且具有较好可扩展性的体系结构。
集系统按功能和结构可以分为如下四类:(1)高可用性集系统(2)负载均衡集系统(3)高性能集系统(4)虚拟化集系统。
3. 并行计算的分类有哪些?
答:并行计算技术在高速发展的今天,出现了各种不同的技术方法,同时也出现了不同的分类方法,包括按指令和数据处理方式的Flynn分类、按存储访问结构的分类、按应用计算
特征的分类。
4. 简要说明并行计算的四类设计模型?
答:并行计算的设计模型主要有四类:隐式并行(Implicit Parallel)、数据并行(Data Parallel)、共享变量(Shared Variable)、消息传递(Message Passing)。
(1)隐式并行是程序员用熟悉的串行语言编程,编译器或运行支持系统自动转化为并行代码。其特点是语义简单、可移植性好、单线程、易于调试和验证正确性,但效率很低。
(2)数据并行是SIMD的自然模型,是局部计算和数据选路操作。其特点是单线程、并行操作于聚合数据结构(数组)、松散同步、单一地址空间、隐式交互作用和显式数据分布。
(3)共享变量是PVP、SMP、DSM的自然模型。其特点是多线程(SPMD、MPMD)、异步、单一地址空间、显式同步、隐式数据分布、隐式通信。
(4)消息传递是MPP、COW的自然模型。其特点是多线程、异步、多地址空间、显式同步、显式通信、显式数据映射和负载分配。
5. 并行程序设计方式主要有哪几种并分别说明。
答:实现并行编程常见方法有以下三种。但三者可混合使用,如对以SMP为节点的Cluster来说,可以在节点间进行消息传递,在节点内进行共享变量编程。
(1)线程模型:OpenMP、POSIX。
(2)消息传递模型:PVM(Parallel Virtual Machine Computing)、MPI(Message Passing Interface)。
(3)数据并行模型:HPF。
1. 描述云存储系统的结构模型。
答:云存储系统的结构模型主要包括:存储层基础管理层应用接口层访问层
参赛格言(1)医院合作协议书存储层是云存储最基础的部分云存储中的存储设备往往数量庞大且多分布在不同地域,彼此之间通过广域网、互联网或者FC光纤通道网络连接在一起。云存储系统对外提供多种不同的存储服务,各种服务的数据统一存放在云存储系统中,形成一个海量数据池。
云存储的数据存储层将不同类型的存储设备互连起来山东高考安排,实现海量数据的统一管理,同时实现对存储设备的集中管理、状态监控以及容量的动态扩展实质是一种面向服务的分布式存储系统。存储设备之上是一个统一存储设备管理系统,可以实现存储设备的逻辑虚拟化管理、多链路冗余管理,以及硬件设备的状态监控和故障维护。
(2)基础管理层是云存储最核心的部分,也是云存储中最难以实现的部分。基础管理层通过、分布式文件系统和网格计算等技术,实现云存储中多个存储设备之间的协同工作使多个存储设备可以对外提供同一种服务,并提供更大、更强、更好的数据访问性能
(3)应用接口层是云存储最灵活多变的部分。不同的云存储运营单位可以根据实际业务类型,开发不同的应用服务接口,提供不同的应用服务。云存储平台面向用户的部分,包括数据存储服务、公共资源使用、数据备份功能等接口服务。
(4)用户访问层主要功能包括访问控制、身份识别与验证、安全隔离等。云存储用户应用程序,可以全新开发和移植现有的应用程序方式实现。云存储服务商均为独立实体,会有个性化的云存储服务提供方式,因此,云存储服务系统的访问方式和访问手段,不同的服
务系统会有所差异。
2. 请简述云存储的实现前提。
答:主要分为以下六点:宽带网络的发展Web2.0技术的出现,应用存储的发展集技术、网格技术和分布式文件系统CDN内容分发、P2P技术、数据压缩技术重复数据删除技术、数据加密技术存储虚拟化技术、存储网络化管理技术

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。