题库496-510
题库496-510
- 下面关于Hbase的特性描述正确的是?
A高可靠性
B高性能
C面向列
D可伸缩 - 下列哪些选项是安装Hbase前所必须安装的?
A操作系统
B JDK
C Shell script
D Java Code - Hbase官方 版本可以安装在( ) 操作系统上?
A CentOS
B UBbuntu
C RedHat
D Windows - 以下关于DBSCAN算法说法正确的是?
A可以对任意形状的稠密数据集进行聚类
B样本集的密度不均匀时,聚类质量较好
C可以在聚类的同时发现异常点,对数据集中的|异常点不敏感
D聚类结果没有偏倚 - AGNES算法可分为?
A单链算法
B多链算法
C全链算法
D均链算法 - 以下哪些是典型的关联规则应用场景?
A.穿衣搭配推荐
B.依据用户轨迹的商户精准营销
C.实时新闻推荐
D.金融客户交叉销售
析:这篇博文讲的挺多场景 link - 以下哪些是MatLab软件的特点?
A.高效的数值计算及符号计算功能,能使用户从繁杂的数学运算分析中解脱出来
B.具有完备的图形处理功能,实现计算结果和编程的可视化
C.友好的用户界面及接近数学表达式的自然化语言,使学者易于学习和掌握
D.功能丰富的应用工具箱(如信号处理工具箱、通信工具箱等),为用户提供了大量方便实用的处理工具 - 常用的数据挖掘编程工具有?
A.SAS
B.Stata
C.MatLaB
D.R - 审核回收的调研数据需要做以下哪些数据清洗?
A.补充缺失值
B.剔除异常值
C.剔除数据重复
D.调整不一致的数据 - 可以用于分类指标呈现的方式有以下哪些?
A.混淆矩阵
B.ROC曲线
C.气泡图
D.增益图 - 回归模型的检验需要经过以下哪些方面?
A.样本容量
B.模型显著性
C.无偏估计
D.拟合优度 - 用户对Hbase Region服务的读写过程,下面说法正确的是?
A.用户写入数据时,被分配到相应Region服务器去执行
B.用户数据首先被写入到MemStore和Hlog中
C.只有当操作写入Hlog之后,commit()调用才会将其返回给客户端
D.当用户读取数据时,Region服务器会直接去磁盘上面的StoreFile中寻找 - Hadoop集群中关于机架配置的描述正确的是?
A.如果一个机架出问题,不会影响数据读写
B.写入数据的时候会写到不同机架的DataNode中
C.写入数据的时候会写到随机机架的DataNode中
D.MapReduce会根据机架获取离自己比较近的网络数据 - 以下属于分类器模型评价指标的有?
A.预测准确度
B.recall
C.模型描述的简洁度
D.F1-Score - 随机森林指的是利用多棵树对样本进行训练并预测的一种分类器,以下针对随机森林算法的表述,错误的是?
A.随机森林算法的分类精度会随着决策树数量的增加而提高。
B.随机森林算法对异常值和缺失值不敏感。
C.随机森林算法不需要考虑过拟合问题。
D.决策树之间相关系数越低、每棵决策树分类精度越高的随机森林模型的分类效果越好。