栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

大数据复试面试总结(二)前沿技术相关

大数据复试面试总结(二)前沿技术相关

大数据是什么?

大数据,指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

大数据未来发展的趋势?

数据资源化:资源化是指大数据成为企业和社会关注的重要战略资源,并已成为大家争相抢夺的新焦点。

与云计算的深度结合:大数据离不开云处理,云处理为大数据提供了弹性可拓展的基础设备,是产生大数据的平台之一

科学理论的突破:随着大数据的快速发展,就像计算机和互联网一样,大数据很有可能是新─轮的技术革命。

数据科学与数据联盟的成立:未来,数据科学将成为一门专门的学科,被越来越多的人所认知

数据泄露之滥

数据挖掘是什么?

数据挖掘是指从大量数据中通过算法搜索隐藏于其中信息的过程

数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。

数据挖掘的特点

基于大量数据:小型数据可以人工分析总结规律,小数据量无法反应真实世界普遍特性

非平凡性:数据挖掘要发现深藏数据内部的知识,而不是直接浮

隐含性:数据挖掘要发现深藏数据内部的知识,而不是直接浮现在数据表面的知识

新奇性:挖掘的知识在以前是未知的,否则只是验证了经验

价值性:可以为企业带来直接间接的效益

数据挖掘步骤

1定义问题

2建立数据挖掘库

3分析数据

4准备数据

5建立模型

6评价模型和分析

数据挖掘经典算法 神经网络法

模拟生物神经系统的结构和功能,是一种通过训练来学习的非线性预测模型,它将每一个连接看作一个处理单元,试图模拟人脑神经元的功能,可完成分类、聚类、特征挖掘等多种数据挖掘任务

决策树法

决策树是根据对目标变量产生效用的不同而建构分类的规则,通过一系列的规则对数据进行分类的过程,其表现形式是类似于树形结构的流程图。比如,在贷款申请中,要对申请的风险大小做出判断。

遗传算法

遗传算法模拟了自然选择和遗传中发生的繁殖、交配和基因突变现象,是一种采用遗传结合、遗传交叉变异及自然选择等操作来生成实现规则的、基于进化理论的机器学习方法。

粗糙集法

粗糙集法也称粗糙集理论,是一种新的处理含糊、不精确、不完备问题的数学工具,可以处理数据约简、数据相关性发现、数据意义的评估等问题。

模糊集法

模糊集法是利用模糊集合理论对问题进行模糊评判、模糊决策、模糊模式识别和模糊聚类分析。模糊集合理论是用隶属度来描述模糊事物的属性。系统的复杂性越高,模糊性就越强

关联规则法

关联规则反映了事物之间的相互依赖性或关联性。

什么是云计算?

狭义上讲,云计算就是一种提供资源的网络,从广义上说,云计算是与信息技术、软件、互联网相关的一种服务,这种计算资源共享池叫做"云",云计算把许多计算资源集合起来,通过软件实现自动化管理,只需要很少的人参与,就能让资源被快速提供。

特点 :虚拟化技术 、动态可拓展 、按需部署 、可靠性高 、灵活性高 、性价比高、可拓展性 服务类型: 1、基础设施即服务  2、平台即服务  3、软件即服务 人工智能?

人工智能(Artificial Intelligence),英文缩写为Al。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科。

应用 : 机器视觉,指纹识别,人脸识别,专家系统,自动规 划,智能搜索,定理证明,博弈,语言和图像理解 等。人工智能是一门边缘学科,属于自然科学和社会科学的交叉。 弱人工智能时代

弱人工智能观点认为不可能制造出能真正地推理( REASONING)和解决问题(PROBLEM_  SOLVING)的智能机器,这些机器只不过看起来像 是智能的,但是并不真正拥有智能,也不会有自主意 识。主流科研集中在弱人工智能上,并且一般认为这 一研究领域已经取得可观的成就。强人工智能的研究 则处于停滞不前的状态下。

强人工智能时代 强人工智能观点认为有可能制造出真正能推理( REASONING)和解决问题(PROBLEM_ SOLVING)的智能机器, 并且,这样的机器能将被 认为是有知觉的,有自我意识的。强人工智能可以有 两类: 类人的人工智能,即机器的思考和推理就像人 的思维一样。 非类人的人工智能,即机器产生了和人完全不一样的 知觉和意识,使用和人完全不一样的推理方式。 区块链 区块链是分布式数据存储、点对点传输、共识机制、 加密算法等计算机技术的新型应用模式。

区块链起源于比特币,是一个信息技术领域的术语。 从本质上讲,它是一个共享数据库,存储于其中的数 据或信息,具有“不可伪造”“全程留痕”“可以追溯”“公 开透明”“集体维护”等特征。基于这些特征,区块链 技术奠定了坚实的“信任“基础,创造了可靠的“合作” 机制,具有广阔的运用前景。

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/774862.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号