1、大数据分析的目的是从类型多样的海量数据中挖掘出隐藏的有价值的信息----正确
2、数据挖掘在建立模型时需要选择算法,一个模型只能使用一种算法----正确
3、众数不受分布数列的极大或极小值的影响----正确
4、大数据预测只是一个概率,受到非常多的因素影响,并不能100%准确----正确
5、K-means算法属于分类算法----错误
6、好的聚类方法需要产生高质量的聚类结果,所形成的簇要有高的内部相异性----错误
7、大数据的最显著特征是。
数据规模大
8、如下关于大数据分析流程的哪一项是正确的。
数据采集、数据清洗、数据管理、数据分析、数据呈现
9、下面哪个图表适合展现随时间而变化的数据。
折线图
10、下面哪个图表不属于传统统计图(D)
A柱状图
B曲线图
C饼图
D网络图
11、不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别,这里使用的方法是( B)。
A分类
B聚类
C回归
D关联
12、“啤酒和尿不湿”案例属于哪种数据挖掘算法。(A )
A分类
B聚类
C回归
D关联
13、数据清洗的方法有(D)
A、填充缺失值
B、修改错误值
C、消除重复记录
D、以上都是
14、下列论据中,能够支撑“大数据无所不能”的观点的是( A)。
A互联网金融打破了传统的观念和行为
B大数据存在泡沫
C大数据具有非常高的成本
D个人隐私泄露与信息安全担忧



