计算机三级数据库技术(数据仓库与数据挖掘)机试模拟试卷6
选择题
1.设有m个的用户集合US={u1, …. um},现对他们的行为数据进行处理,使得每个用户ui对应一个n维向量Vi=[vil,…. vin],用于表示用户ui的特征。设有函数sim(Vi,Vj)用于判定用户ui与用户uj之间的相似性。若有算法A,能根据用户间的相似性,将US划分成k个子集合,并使属于同一子集合的客户间的相似性尽可能大,不属于同一子集合的客户间的相似性尽可能小。则算法A属于一种( )(A)
A. 聚类算法
B. 分类算法
C. 关联分析算法
D. 回归预测法
解析:聚类将一个数据集中的数据进行分组,使得每一组内的数据尽可能相似而不同组间的数据尽可能的不同。它与分类的一个不同点在于,它强调同一个组中的对象有较高的相似度,不同组中的对象之间差别很大。分类和聚类的区别在于,分类事先知道有哪些类别可以分。聚类,事先不知道将要分成哪些类,需有聚类算法来自动确定。综上可知,算法A属于聚类算法。
2.下面说法正确的是( )(C)
A. 数据仓库是从数据库中导入的大量数据,并对结构和存储进行组织以提高查询效率
B. 使用数据仓库的目的在于对已有数据进行高速的汇总和统计
C. 数据挖掘采用适当的算法,从数据仓库的海量数据中提取具有潜在价值的信息和知识
D. OLAP技术为提高处理效率,必须绕过DBMS直接对物理数据进行读写
解析:数据仓库是一个面向主题的、集成的、非易失的,且随时间变化的数据集合,用来支持管理人员的决策。建立数据仓库的主要目的:根据决策需求对企业的数据采取适当的手段进行集成,形成一个综合的、面向分析的数据环境,用于支持企业的信息型、决策型的分析应用。数据挖掘采用适当的算法,从数据仓库的海量数据中提取具有潜在价值的信息和知识。因此A和B错误,C正确。OLAP (on-line analytical processing)是联系分析处理的英文缩写,它仍使用DBMS存取数据,即D的描述错误。
3.一个在线书评、乐评分享网站,建有面向业务的数据库系统和面向分析的数据仓库系统,数据仓库系统需要每天从数据库应用系统的数据库导入新数据。有下列数据表:
Ⅰ.书籍表和书籍类别表
Ⅱ.用户表和好友关系表
Ⅲ.书评表和乐评表
Ⅳ.音乐专辑表和音乐分类表
上述表中,适合采用快照方式从数据库应用系统获取数据的是( )。(C)
A. 仅Ⅰ和Ⅳ
B. 仅Ⅱ和Ⅳ
C. 仅Ⅰ、Ⅱ和Ⅳ
D. 仅Ⅰ、Ⅱ和Ⅲ
解析:快照:该方法通过对当前数据表进行“照相”,记录当前的数据表信息“相片”,然后将当前的“相片”与以前的数据表“相片”进行比较,如果不一致将通过一定的方式传到数据仓库,从而实现数据的一致性,这种方式适合于更新频率较低的数据表。题目中的书评表和乐评表主要用于记载用户的评论,里面的内容更新频率较高,而数据仓库的更新频率较低,因此书评表和乐评表不适合用于快照的方法。而其它三个选项的更新频率相对较低,比较适合快照模式,故选择C选项。
4.在大型企业的数据库应用系统中,联机事务处理(OLTP)和联机分析处理(OLAP)是常见的数据管理与数据分析形式。关于OLTP和OLAP,一般情况下,下列说法正确的是( )(C)
A. OLTP系统的安全性要求比OLAP系统的低,也比较容易实现
B. OLAP系统在访问数据时,一般以访问少量记录为主,OLTP系统则相反
C. OLTP要求系统必须具有很高的响应速度,而OLAP对系统响应速度的要求较为宽松
D. OLTP系统一般由企业的中上层或决策层使用,而OLAP系统一般由企业的中下层业务人员使用
解析:OLTP是对数据库联机的日常操作,通常是对一条记录的查询和修改,要求快速响应用户的请求,对数据的安全性、完整性及事物吞吐量要求很高。而OLAP是对数据的查询和分析操作,通常是对海量历史数据的查询和分析,要访问的数据量非常大,查询和分析操作十分复杂。所以A、B错。又因为OLAP为宏观分析,OLTP为微观操作,所以前者面向中上层和决策者使用,而后者面向企业的中下层业务人员使用。所以D错。因此选C。
5.下列关于数据仓库粒度的说法,错误的是( )。(C)
A. 在数据仓库环境中,粒度是一个重要的设计问题,它影响到数据仓库的数据量和系统能够回答的查询的类型
B. 一般在进行数据仓库的数据组织时,需要根据当前应用的需求来进行多粒度级设计
C. 粒度越小,数据量越小,空间代价越小
D. 粒度越大,综合程度越高
解析:在数据仓库环境中,粒度是一个重要的设计问题,它影响到数据仓库的数量以及系统能够回答的查询的类型。粒度越小,则详细程度越高,综合程度就越低,回答询问的种类也越多,数据量比较大,空间代价也大;粒度越大,综合程度就越高。综上所述可知C选项错误。故选择C选项。
6.下列关于建立数据仓库的目标的描述,不恰当的是( )。(B)
A. 充分利用企业信息系统生成的数据
B. 把企业各种类型的应用集中在一起
C. 解决数据分析应用和企业基本业务应用之间的性能冲突问题,减轻OLTP系统的负担
D. 以面向主题的方式合理组织数据,实现跨部门视图
解析:建立数据仓库的主要目的在于根据决策需求对企业的数据采取适当的手段进行集成,形成一个综合的、面向分析的数据环境,用于支持企业的信息性、决策性的分析应用。故答案为B项。
7.设有某大型连锁商场,建立有面向基础业务的数据库应用系统和面向决策支持的数据仓库系统,数据仓库系统每天夜间需要从数据库应用系统的数据库导入新数据。在下列数据表中,最不适合采用快照方式从数据库应用系统获取数据的是( )。(A)
A. 各商品销售明细表
B. 各商场员工表
C. 商品表和商品类别表
D. 各商场收银点信息表
解析:快照(Snapshot))是指定数据集合的一个完全可用拷贝,该拷贝包括相应数据在某个时间点(拷贝开始的时间点)的映像。快照可以是其所表示的数据的一个副本,也可以是数据的一个复制品,适合更新变化量少的数据。各商品销售明细表是属于一个动态信息表,每个时刻的信息都不一样,因此各商品销售明细表不适合用快照方式更新。故答案为A选项。
8.在具有数据仓库的企业数据环境中,数据仓库数据一般都具有许多特点,下列都属于其特点的是( )。(A)
A. 面向主题、不可直接修改、批量访问
B. 面向主题、可直接修改、性能要求较为宽松
C. 集成的、不可直接修改、性能要求高
D. 集成的、可直接修改、批量访问
解析:数据仓库是一个面向主题的、集成的、非易失的,且随时间变化的数据集合,用来支持管理人员的决策,有面向主题性、集成性、不可更新性和时间特性等几个重要特性。故答案为A选项。
9.设某数据仓库系统中有下列数据表:
Ⅰ.商品销售表(商品号,店铺标识,销售量,单价,日期,时间)
Ⅱ.各店商品周销售表(商品号,店铺标识,周销售量,周)
Ⅲ.各店商品月销售表(商品号,店铺标识,月销售量,月)
Ⅳ.各小类各店商品月销售表(商品小类,店铺标识,月销售量,月)
以上各个表中数据,粒度级最低和最高的表分别是( )。(C)
A. 仅Ⅰ和Ⅱ
B. 仅Ⅱ和Ⅲ
C. 仅Ⅰ和Ⅳ
D. 仅Ⅲ和Ⅳ
解析:粒度
本文档预览:3600字符,共8266字符,源文件无水印,下载后包含无答案版和有答案版,查看完整word版点下载