计算机三级数据库技术(数据仓库与数据挖掘)机试模拟试卷8
选择题
1.对于ODS体系,有下列说法:
Ⅰ.ODSⅠ:第一类ODS数据更新频率是天级,一般隔夜后将数据更新到ODS中
Ⅱ.ODSⅡ:第二类ODS的数据更新频率是小时级,如4小时更新一次
Ⅲ.ODSⅢ:第三类ODS的数据更新频率是秒级,即操作型系统中的数据发生改变后,几乎是立即传送到ODS中,这类ODS建设难度大
Ⅳ.ODSⅣ:第四类ODS是根据数据来源方向和类型划分的,不仅包含来自操作型环境的数据,也包含由数据仓库层和数据集市层的应用反馈给ODS的一些决策结果或一些报表信息
以上说法正确的是( )(C)
A. 仅Ⅰ和Ⅱ
B. 仅Ⅰ和Ⅲ
C. 仅Ⅰ和Ⅳ
D. Ⅰ、Ⅱ、Ⅲ和Ⅳ
解析:ODS(Operational Data Store)是数据仓库体系结构中的一个可选部分,ODS具备数据仓库的部分特征和OLTP系统的部分特征,它是“面向主题的、集成的、当前或接近当前的、不断变化的”数据。第一类ODS数据更新频率是秒级,第二类ODS的数据更新频率是小时级,第三类ODS的数据更新频率是天级,上述三类是根据数据更新的速度划分的,ODSⅣ:第四类ODS是根据数据来源方向和类型划分的。
2.关于操作型数据和DSS型数据特征有如下说法
Ⅰ.操作型数据更新频率高,DSS型数据一般不更新
Ⅱ.操作型数据对性能要求宽松,DSS型数据对性能要求高
Ⅲ.操作型数据是详细的,DSS型数据是综合的
Ⅳ.操作型数据有冗余,DSS型数据无冗余
Ⅴ.操作型数据处理需求事先可知,DSS型数据处理需求事先不明确
以上说法正确的是( )(C)
A. Ⅰ、Ⅱ、Ⅴ
B. Ⅱ、Ⅲ、Ⅳ
C. Ⅰ、Ⅲ、Ⅴ
D. Ⅲ、Ⅳ、Ⅴ
解析:操作型数据对性能要求较高、无冗余。操作型数据与分析型数据的区别如以下所示。
3.某电子商务平台为实现精准营销,提高向用户推荐商品的成功率,欲建立数据仓库系统,作为数据挖掘程序的数据源。假设业务型数据主要存放于销售数据表T1中,用户信息存放于用户表T2中。数据仓库将近5年的销售细节数据存放在数据表T3中,并在数据仓库中根据需要存放一些汇总数据。为达到这些要求,有如下一些方案:
Ⅰ.T3与T1实时更新,即每产生一条销售记录,同时写到T1和T3中,并触发数据挖掘程序运行,以增加数据挖掘结果的准确性
Ⅱ.用户每次产生新的销售记录,触发数据挖掘程序执行并得到针对该用户的推荐商品列表,然后写回T2中。T3每天定时从T1进行批量更新
Ⅲ.T3与T1实时更新,每天定时运行数据挖掘程序,将运行结果,也就是针对用户的推荐商品列表写回数据仓库的用户商品推荐表中
Ⅳ.T3每天做一次批量更新,并在数据仓库中生成相应的汇总数据,数据挖掘程序以细节数据或汇总数据作为数据源,将运行结果即针对用户的推荐商品列表写回数据仓库的用户商品推荐表中
上述方案中不合理的是( )。(D)
A. 仅Ⅰ和Ⅳ
B. 仅Ⅱ和Ⅳ
C. 仅Ⅰ、Ⅱ和Ⅳ
D. 仅Ⅰ、Ⅱ和Ⅲ
解析:数据仓库是为了构建新的分析处理环境而出现的一种数据存储和组织的新技术。它的建立能充分利用已有的数据资源,把数据转换为信息,从中挖掘出知识,最终创造出效益。数据仓库有若干基本特征,包括不可更新性和随时间变化性。所谓不可更新性就是用户在提取仓库中的数据进行分析时并不会同时对数据仓库中的数据进行更新操作,而数据变化性是数据仓库每隔一段时间进行数据的更新和处理。综上可以看出,数据仓库的更新与时间间隔有关,所以不会实时更新,即排除A、C,又因为对用户进行推荐时要结合以往的历史数据而不是仅通过当前数据分析,即B错。故选择D选项。
4.关于商场的DBAS,设有如下数据内容
Ⅰ.数据库结构说明
Ⅱ.顾客名单
Ⅲ.数据清洗规则
Ⅳ.订单细节数据
Ⅴ.商品分类销售汇总数据
上述选项中是元数据的是( )(C)
A. 仅Ⅰ、Ⅱ、Ⅲ和Ⅳ
B. 仅Ⅰ、Ⅱ、Ⅲ和Ⅴ
C. 仅Ⅰ和Ⅲ
D. 全部都是
解析:元数据是关于数据的数据,或者叫做描述数据的数据。元数据描述了数据的结构、内容、链和索引等项内容。在关系数据中,这种描述就是对数据库、表、列等其他对象的定义。因此可推出,Ⅰ、Ⅲ属于元数据。选C。
5.关于数据仓库、数据挖掘、决策支持系统和机器学习的相关概念或说法,下列说法一般情况下错误的是( )。(C)
A. 数据仓库是服务于决策支持的数据集合
B. 决策支持系统是指辅助需要决策的人或系统进行决策的系统
C. 数据挖掘一般是指数据分析师根据个人经验针对细节数据进行分析总结,挖掘出有用的知识的过程
D. 机器学习是指机器采用一些方法或模型从数据中习得知识的过程
解析:数据仓库是一个面向主题、集成的、非易失的、且随时间变化的数据集合,用来支持管理人员决策。决策支持系统是辅助决策者通过数据、模型和知识,以人机交互方式进行半结构化或非结构化决策的计算机应用系统。数据挖掘就是从数据库中的所有数据记录中归纳总结出知识,让人们从抽象复杂的数据中看到客观规律,以便做出决策。数据挖掘是从人工智能机器学习中发展起来的。它研究各种方法和技术,从大量的数据中挖掘出有用的信息和知识。机器学习是研究使计算机模拟或实现人类的学习行为,即让计算机自动获取知识。故答案为C选项。
6.在建立数据仓库的数据集成工作中,需要采用适当的策略从数据源获取变化数据。下列数据表中,一般情况下不适宜采用快照方式从业务系统获取数据的是( )。(C)
A. 顾客表、商品类别表
B. 门店表、销售人员表
C. 商场商品销售表、电信公司通话详单
D. 商品清单、商品类别表
解析:快照是关于指定数据集合的一个完全可用拷贝,该拷贝包括相应数据在某个时间点(拷贝开始的时间点)的映像。快照可以是其所表示的数据的一个副本,也可以是数据的一个复制品。它反映的是某个时间点内的数据,该数据具有不可以改变性。而商场商品销售表、电信公司通话详单属于动态数据,不适合用快照的方式获取数据。故答案为C项。
7.下列关于数据仓库、数据挖掘、机器学习与决策支持系统中的相关概念或说法,错误的是( )。(D)
A. 数据仓库是服务于决策支持的数据集合
B. 数据挖掘是从大量数据中提取或挖掘知识的方法或过程
C. 机器学习是指机器采用一些方法或模型根据数据去习得知识的过程
D. 决策支持系统一般是指企业中以数据为基础对重要业务或事务实施决策的信息系统
解析:决策支持系统一般是指企业中以数据为基础对重要业务或事务实施辅助决策的信息系统。故答案为D项。
8.在数据挖掘或机器学习概念中,有监督学习、无监督学习和强化学习是常见的学习方法,下列学习任务属于有监督学习的是( )。(C)
A. 将未知类别的一组数据,采用聚类方法,分成不同的组
B. 机器人在动态环境中自主学习掌握行走方法
C. 根据样本数据,采
本文档预览:3600字符,共9291字符,源文件无水印,下载后包含无答案版和有答案版,查看完整word版点下载