大数据题目:
1.大数据指的是所涉及的资料量规模巨大到无法通过目前主流软件工具,在合理时间内达到撷取、管理、处理、并()成为帮助企业经营决策的信息。
A.收集 B.整理 C.规划 D.聚集
2.下列关于舍恩伯格对大数据特点的说法中,错误的是()。
A.数据规模大 B.数据类型多样
C.数据处理速度快 D.数据价值密度高
3.以下哪个代表大数据的4V特征中的数据体量巨大?()
A. Volume B. Velocity C. Variety D. Veracity
4.当前大数据技术的基础是由()首先提出的。
A.微软 B.百度 C.谷歌 D.阿里巴巴
5.大数据包括()。
A. 结构化数据,半结构化数据,非结构化数据三种都有
B. 只有结构化数据
C. 只有非结构化数据
D.只有非结构化数据和半结构化数据
6.博客、微博、微信中的信息,与客服的对话等数据属于()。
A.半结构化数据 B.结构化数据
C.非结构化数据 D.三种都有
7.在当前社会中,最突出的大数据环境是()。
A.金融 B.电信 C.互联网 D.公共管理
8.与大数据密切相关的技术是()。
A.蓝牙 B.云计算 C.博弈论 D .wifi
9.大数据应用需依托的新技术有()。
A.大规模存储与计算 B.数据分析处理
C.智能化 D.三个选项都是
10.大数据随着谷歌MapReduce和GoogleFile System的发布,大数据不再仅用来描述大量的数据,还涵盖了处理数据的()。
A.质量 B.速度 C.精度 D.进度
11.MapReduce的Map函数产生很多的()。
A.Key B.value C.
12.IBM大数据平台和应用程序框架,()以经济高效的方式分析PB级结构化和非结构化信息。
A.流计算 B .Hadoop C.数据仓库 D.语境搜索
13.大数据工程指大数据的()的系统工程。
A.大数据网络发展和运营过程 B.规划建设运营管理 C.规律和验证 D.发现和验证
14.大数据的价值是通过数据共享、()后获取最大的数据价值。
A.算法共享 B.共享应用 C.数据交换 D.交叉复用
15.下列关于数据重组的说法中,错误的是()。
A.数据的重新生产和重新采集
B.数据重组能够使数据焕发新的光芒
C.数据重组实现的关键在于多元数据融合
D.数据重组有利于实现新颖的数据模式创新
16.下列关于大数据的分析理念的说法中,错误的是()。
A.在数据基础上倾向于全体数据而不是抽样数据
B.在分析方法上更注重相关分析二不是因果分析
C.在分析效果上更追究效率而不是绝对精确
D.在数据规模上强调相对数据而不是绝对数据
17.大数据时代,数据使用的关键是()。
A.数据收集 B.数据存储 C.数据分析 D.数据再利用
18.数据仓库的最终目的是()。
A.收集业务需求 B.建立数据仓库逻辑模型
C.开发数据仓库的应用分析 D.为用户和业务部门提供决策支持
19.支持大数据业务的基础是()。
A.数据科学 B.数据应用 C.数据硬件 D.数据人才
20.下列论据中,能够支撑“大数据无所不能”的观点的是()。
A.互联网金融打破了传统的观念和行为
B.大数据存在泡沫
C.大数据具有非常高的成本
D.个人隐私泄露与信息安全担忧
21.以下说法中错误的是()。
A. 大数据会带来机器智能 B. 大数据不仅仅是数据的体量大
C. 大数据的英文名称是large data D. 大数据是一种思维方式
22.关于计算机存储容量单位换算关系的公式中,正确的是()。
A. 1P=1024G B. 1P=1024T C. 1Y=1024E D. 1E=1024Z
23.一切皆可连,任何数据之间逻辑上都有可能存在联系,这体现了大数据思维维度中的()思维。
A.定量 B.相关 C.因果 D.实验
24.下列演示方式中,不属于传统统计图方式的是()。
A.柱状图 B.饼状图 C.曲线图 D.网络图
25.啤酒尿布湿大数据分析的()。
A. A/B测试 B.分类 C.关联规则 D.数据聚类
26.Google收集的信息不包括()。
A.日志信息 B.位置信息
C.你的家庭成员 D.cookie和匿名标识符
27.大数据的取舍与()不相关。
A.易于提取 B.家庭信息 C.数字化 D.廉价的存储器
28.社交网络产生了海量用户以及实时和完整的数据,同时社交网络也记录了用户群体的(),通过深入挖掘这些数据来了解用户,然后将这些分析后的数据信息推给需要的品牌商家或是微博营销公司。
A.地址 B.行为 C.情绪 D.来源
29.临床决策支持系统通过电子病历、医学指导的比较等提高手术质量,降低错误治疗和()。
A.医疗事故 B.病患投诉 C.民事诉讼 D.手术费用
30.大数据在医疗与健康的临床应用不包括()。
A.疗效比较研究方案 B.临床决策支持系统
C.远程患者检测系统 D.患者家庭情况分析
31.推荐系统为客户推荐商品,自动完成个性化选择商品的过程,满足客户的个性化需求,推荐基于网站最热卖商品、客户所处城市、(),推测客户将来可能的购买行为。
A.客户的朋友 B.客户的个人信息
C.客户的兴趣爱好 D.客户过去的购买行为和购买记录
32.智能健康手环的应用开发,体现了()的数据采集技术的应用。
A.统计报表 B.网络爬虫 C. API接口 D.传感器
33.智慧城市的构建,不包含()。
A数字城市 B物联网 C联网监控 D云计算
34. 2012年7月,()集团全面推进“数据分享平台”战略,并推出大型的数据分享平台——“聚石塔”,为天猫、淘宝平台上的电商及电商服务商等提供数据云服务,分享和挖掘海量数据。
A.阿里巴巴 B.华为 C.腾讯 D.网易
35.美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,表明了大网点,这体现了大数据分析理论中的()。
A.在数据基础上倾向于全体数据而不是抽样数据。
B.在分析方法上更注重相关分析而不是因果分析。
C.在分析效果上更追求效率而不是绝对精确。
D.在数据规模上强调相对数据而不是绝对数据。
36.对于线下零售而言,做好大数据分析应用的前提是()。
A.增加统计种类 B.扩大营业面积
C.增加数据来源 D.开展优惠促销
37.大数据的利用过程是()
A.采集——挖掘——清洗——统计
B.采集——统计——清洗——挖掘
C.采集——清洗——挖掘——统计
D.采集——清洗——统计——挖掘
38.第一个提出“大数据时代已经到来”的公司是 ( )。
A.Facebook公司 B.麦肯锡公司
C.Google公司 D.微软公司
39.大数据的本质是()
A.洞察 B.搜集 C.联系 D.挖掘
40.2009年,甲型H1N1流感在全球爆发,谷歌流感趋势(5000万条历史记录,做了4.5亿个不同的数学模型)测算出的数据与官方最后的数据相关性非常接近,达到了()。
A.50% B.77% C.97% D.95%
41.现在的非结构化数据已经占人类产生的数据的()。
A.50% B.30% C.80% D.70%
42.个性化推荐系统是建立在海量数据我觉基础上的一种高级商务智能平台,以帮助()为其顾客购物提供完全个性化的决策支持和信息服务。
A.公司 B.各单位 C.跨国企业 D.电子商务网站
43.《数据新闻学手册》的作者们认为,通过数据的实验,记者工作的重点从“第一个报道”转化成为对特定时间的影响的()。
A.拍摄者 B.知情者 C.记录者 D.阐释者
44.下列关于大数据的说法中,错误的是()。
A.大数据具有体量大、结构单一、时效性强的特征
B.处理大数据需采用新型计算架构和智能算法等新技术
C.大数据的应用注重相关分析而不是因果分析
D.大数据的目的在于发现新的知识与洞察并进行科学决策
45.下列论据中,体现“冷眼”看大数据的观点的是()。
A.互联网金融打破了传统的观念和行为
B.大数据医疗正在走进平民百姓
C.数据资产性企业前景光明
D.个人隐私泄漏与信息安全担忧
46.数据仓库是随着时间变化的,下面的描述不正确的是 (C)
A.数据仓库随时间的变化不断增加新的数据内容
B.捕捉到的新数据会覆盖原来的快照
C.数据仓库随事件变化不断删去旧的数据内容
D.数据仓库中包含大量的综合数据,这些综合数据会随着时间的变化不断地进行重新综合
47.大数据的价值密度低,指的是大数据中(),存在大量共现但又毫无意义的关联模式,只有采取有效的信息处理手段提取网络大数据中潜在的价值,网络大数据才能成为一个价值“宝藏”。
A.包含大量重复、噪声和垃圾数据
B..包含少量重复、噪声和垃圾数据
C.包含微量重复、噪声和垃圾数据
D.不包含重复、噪声和垃圾数据
48.全国首个国家级大数据综合试验区在()建立。
A.北京 B.上海 C.深圳 D.贵州省
49.()年3月,国家大数据(贵州)综合试验区正式揭牌。
A.2018 B.2017 C.2016 D.2015
50. Hadoop是一个由()开发的分布式系统基础架构。
A. Teradata B. Splunk C. Cloudera D. Apache基金会



