计算机三级(数据库技术)模拟试卷122
选择题
1.数据挖掘可以简单地理解为从大量的数据中发现或挖掘知识。设某公司的客户关系管理系统中有客户表A(CID,v1,v2,…,vn)。给定一个训练集S(v1,v2,…,vn,c),其中c为客户类别、vi(i=1..n)为客户其他属性。若对表A中任一客户x,要使系统能判定x所属的客户类别,较合理的方案是( )。(B)
A. 将x对应的元组中的特征向量(v1,v2,…,vn)与训练集S中的元组进行匹配,从而判定x所属的客户类别
B. 对训练集S设计适当的算法,构造一个分类器M,将x对应的特征向量(v1,v2,…,vn)作为M的输入,用M判定x所属的客户类别
C. 采用关联规则挖掘算法构成一个关联式分类器M,用M判定x所属的类别
D. 采用适当的聚类算法,对表A中的所有元组进行聚类,将每个元组归入训练集S各元组的c列所给出的客户类别中,从而实现x所属客户类别的判定
解析:对于训练集S,测试集A利用数据挖掘中的分类算法,通过训练集构建一个分类器,将测试集A作为分类器输入,经过分类器后会得到相应的类别号。即使相同的类别编号的训练集也可能对应不同的属性集,所以单纯的通过对属性集差别的比较来识别类别不准确,故A选项错。关联规则挖掘是发现交易数据库中不同商品之间的联系,而本题是对数据进行分类,与题意不符,故C选项错。D选项属于无监督学习算法,对类别并没有规定明确的前提条件,与本题所给的条件无关。综上可知,B选项正确。
2.在对某商场的顾客进行流失预测分析时,先取得一个顾客样本集S,其模式为(id,a1,a2,…,an,c),其中id为顾客的唯一标识,ai(i=1,2,…,n)为顾客的属性,如年龄、性别、消费时间间隔等,c的取值为{流失,未流失}。现有算法A对样本S进行处理,输出结果为P,P能根据该样本集外的顾客u的n个属性,确定u的c属性值,以对顾客的流失作出预测。那么,A和P分别是( )。(B)
A. 聚类算法,聚类工具
B. 分类算法,分类器
C. 关联规则算法,规则集
D. 多维分析算法,OLAP工具
解析:由于有样本集和测试集之分,又有已有的类别标签,所以属于监督学习。分类:通过学习得到一个目标函数f,把每个属性集x映射到一个预先定义的类标号y。分类属于监督学习。聚类:根据在数据中发现的描述对象及其关系的信息,将数据对象分组,组内的对象相互之间是相似的,而不同组中的对象则不同。组内的相似性越大,组间差别越大,聚类就越好,属于无监督学习。关联规则挖掘:发现隐藏在大型数据集中的有意义的联系。多维分析是指各级管理决策人员从不同的角度、快速灵活地对数据仓库中的数据进行复杂查询多维分析处理。根据题意显然是符合分类。所以选择B选项。
3.在数据库运行过程中,数据库管理员应对数据库运行情况进行监控。设有如下可能需要监控的内容:
Ⅰ.数据库空间使用情况
Ⅱ.数据库服务器网络是否通畅
Ⅲ.数据库缓冲区命中率情况
Ⅳ.数据库用户向数据库发送的每条SQL语句
Ⅴ.数据库中索引使用情况
上述工作中属于数据库日常监控内容的是( )。(A)
A. 仅Ⅰ、Ⅲ和Ⅴ
B. 仅Ⅰ和Ⅲ
C. 仅Ⅱ、Ⅲ、Ⅳ和Ⅴ
D. 全部均是
解析:本题是对数据库维护的考查,服务器网络的检测不是数据库管理员的职责,而应是操作系统管理员的职责。用户向数据库发送的SQL数量庞大而且没有稳定的衡量指标,所以不属于日常监控范围。故选择A选项。
4.设有关系模式R(A,B,C, D),存在函数依赖集:{A→B,C→D},则R最高可属于( )。(A)
A. 1NF
B. 2NF
C. 3NF
D. BCNF
解析:如果关系模式R中不包含多值属性,则R满足第一范式,简称1 NF,记作R1 NF。可知此题中R
1 NF,且R的所有非主属性不依赖于一个候选码,候选码(A、C)→(B、D)存在非主属性对主码的部分函数依赖,故不满足2NF,所以R最高
5.下列关于数据库实施、运行和维护的说法中,最恰当的是( )。(B)
A. 对于数据量超大的数据库应用系统,最好在刚刚建立好数据库且未导入任何数据前编写调试应用程序
B. 对于数据量极大的中大型系统,不需要等待所有的数据都入库后才开始试运行,可以先装载少量的数据,等到试运行的结果符合设计要求后,再批量装入全部数据
C. 数据库的重构不仅需要在原来的数据库设计的基础上做适当的扩充或修改,也最好考虑重新设计相应的应用程序
D. 索引的根本目的是为了提高查询效率,但当数据量庞大时也会占用大量的磁盘空间。由于查询缓存的存在,因此不需要为经常在查询中作为条件的列建立索引
解析:A选项中在调试应用程序时,如果数据入库尚未完成,数据库没有数据,应用程序的调试将会出现一定的困难;C选项中数据库重构应该尽量避免应用程序的改动;D选项中经常查询的列应该建立索引。
6.DBAS生命周期模型中时间最长的阶段是( )。(D)
A. 需求分析
B. 系统设计
C. 实行与部署
D. 运行管理与维护
解析:一个数据库应用系统开发完成后,运行管理与维护往往是一个长久的过程,时间一般是以年为单位,其成本消耗也是巨大的。
7.下面说法正确的是( )。(C)
A. 数据仓库是从数据库中导入的大量数据,并对结构和存储进行组织以提高查询效率
B. 使用数据仓库的目的在于对已有数据进行高速的汇总和统计
C. 数据挖掘采用适当的算法,从数据仓库的海量数据中提取具有潜在价值的信息和知识
D. OLAP技术为提高处理效率,必须绕过DBMS直接对物理数据进行读写
解析:数据库不是用做日常查询,也不是汇总和统计,而主要用于提取数据中的潜在信息和知识。因此A选项和B选项错误。OLAP(On-line analytical processing)是联系分析处理的英文缩写,它仍使用DBMS存取数据,即D选项的描述错误。
8.关于数据库应用系统的需求分析工作,下列说法正确的是( )(D)
A. 通过需求分析过程,需要确定出整个应用系统的目标、任务和系统的范围说明
B. 在需求分析阶段,系统需求分析员要与用户充分沟通,并做出各类用户试图
C. 数据需求分析的主要工作是要辨识出数据处理中的数据处理流程
D. 数据操作响应时间、系统吞吐量、最大并发用户数都是性能需求分析的重要指标
解析:数据库应用系统的需求包括:数据需求分析,数据处理需求分析,业务需求分析及其在性能、存储、安全、备份和恢复等方面的要求。C项中,数据需求分析的主要工作是从用户视图出发,分析与辨识应用领域所管理的各类数据项和数据结构,形成数据字典的主要内容。B中在需求分析阶段,系统需求分析员与用户充分沟通,并形成文档化的需求描述。A中通过需求分析过程,需要系统的描述整个应用系统的功能特征、性能特征和约束,并形成需求规范说明文档。D中数据操作响应时间、系统吞吐量和最大并发用户数都是性能需求分析的重要指标。所以选D。
9.在SQL Server 2008中,常常会发生数据库数据
本文档预览:3600字符,共20065字符,源文件无水印,下载后包含无答案版和有答案版,查看完整word版点下载