栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

题库496-510

题库496-510

题库496-510
  1. 下面关于Hbase的特性描述正确的是?
    A高可靠性
    B高性能
    C面向列
    D可伸缩
  2. 下列哪些选项是安装Hbase前所必须安装的?
    A操作系统
    B JDK
    C Shell script
    D Java Code
  3. Hbase官方 版本可以安装在( ) 操作系统上?
    A CentOS
    B UBbuntu
    C RedHat
    D Windows
  4. 以下关于DBSCAN算法说法正确的是?
    A可以对任意形状的稠密数据集进行聚类
    B样本集的密度不均匀时,聚类质量较好
    C可以在聚类的同时发现异常点,对数据集中的|异常点不敏感
    D聚类结果没有偏倚
  5. AGNES算法可分为?
    A单链算法
    B多链算法
    C全链算法
    D均链算法
  6. 以下哪些是典型的关联规则应用场景?
    A.穿衣搭配推荐
    B.依据用户轨迹的商户精准营销
    C.实时新闻推荐
    D.金融客户交叉销售
    析:这篇博文讲的挺多场景 link
  7. 以下哪些是MatLab软件的特点?
    A.高效的数值计算及符号计算功能,能使用户从繁杂的数学运算分析中解脱出来
    B.具有完备的图形处理功能,实现计算结果和编程的可视化
    C.友好的用户界面及接近数学表达式的自然化语言,使学者易于学习和掌握
    D.功能丰富的应用工具箱(如信号处理工具箱、通信工具箱等),为用户提供了大量方便实用的处理工具
  8. 常用的数据挖掘编程工具有?
    A.SAS
    B.Stata
    C.MatLaB
    D.R
  9. 审核回收的调研数据需要做以下哪些数据清洗?
    A.补充缺失值
    B.剔除异常值
    C.剔除数据重复
    D.调整不一致的数据
  10. 可以用于分类指标呈现的方式有以下哪些?
    A.混淆矩阵
    B.ROC曲线
    C.气泡图
    D.增益图
  11. 回归模型的检验需要经过以下哪些方面?
    A.样本容量
    B.模型显著性
    C.无偏估计
    D.拟合优度
  12. 用户对Hbase Region服务的读写过程,下面说法正确的是?
    A.用户写入数据时,被分配到相应Region服务器去执行
    B.用户数据首先被写入到MemStore和Hlog中
    C.只有当操作写入Hlog之后,commit()调用才会将其返回给客户端
    D.当用户读取数据时,Region服务器会直接去磁盘上面的StoreFile中寻找
  13. Hadoop集群中关于机架配置的描述正确的是?
    A.如果一个机架出问题,不会影响数据读写
    B.写入数据的时候会写到不同机架的DataNode中
    C.写入数据的时候会写到随机机架的DataNode中
    D.MapReduce会根据机架获取离自己比较近的网络数据
  14. 以下属于分类器模型评价指标的有?
    A.预测准确度
    B.recall
    C.模型描述的简洁度
    D.F1-Score
  15. 随机森林指的是利用多棵树对样本进行训练并预测的一种分类器,以下针对随机森林算法的表述,错误的是?
    A.随机森林算法的分类精度会随着决策树数量的增加而提高。
    B.随机森林算法对异常值和缺失值不敏感。
    C.随机森林算法不需要考虑过拟合问题。
    D.决策树之间相关系数越低、每棵决策树分类精度越高的随机森林模型的分类效果越好。
转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/307614.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号