实用工具小学数学练习字帖生成在线画板函数绘制拼音字母表在线词典黄历查询中国历史 Excel函数模拟请求 json格式化

栏目分类:

子分类:

名师互学网

名师互学网用户登录

快速导航

当前搜索

当前分类

前沿技术软件开发系统运维产品运营生活办公面试经验考试题库

实用工具

学习工具小学数学练习字帖生成在线画板函数绘制拼音字母表在线词典黄历查询亲戚关系计算安全期计算中国历史 Excel函数模拟请求 json格式化浏览器指纹

名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

云平台数据统计分析平台项目

大数据系统更新时间：2026-04-07 21:06:24 发布时间：1497天前 IT归档最新发布模块sitemap 名妆网法律咨询聚返吧英语巴士网伯小乐网商动力

数据统计分析平台整体流程

从线上数据库备份到备份库，再通过ETL加载到数据仓库，

然后对接kylin系统，根据数据模型的设计进行数据预计算，

生成预统计数据存储到hbase中，最接报表系统和数据可视化系统。

数据分析优化

聚合组优化，cubeplanner优化，根据历史查询记录对cubeid做剪枝优化，采用贪心算法，每次分析计算每个cubeid的效益，选取效益最高的cubeid，因为某些cubeid可以通过已有的cubeid计算出来，最终达到数据膨胀率阈值后停止；

数据仓库的建设，分成设备数据、用户数据和生产数据。

ETL对数据做清洗，过滤掉一些无效数据，以及做一些数据转换，如在kylin预分析之前，为减少一些维度的数量，需要对时间维度做转换，减少数据预分析的数量；

可视化系统

后台对接kylin系统，前端根据用户输入的维度查询条件获取数据展示前端，形成数据表格和数据折线图，体现数据随着时间推进的变化趋势；

最终成果

数据查询效率提供10倍左右；

遇到问题：

1、因系统重启并且误用tmp临时目录作为hdfs的存储目录，导致hdfs和kylin的所有元数据和业务数据都丢失，解决方案为重新创建kylin model和cube等信息，hdfs重新建立数据仓库表，已生成的统计数据丢失了，可视化系统改为从旧数据统计系统获取数据。

2、数据分析任务失败没能及时发现，需要人工检查，有时候需要外部门反馈才发现，恢复数据困难。解决方案为增加任务执行失败告警，监控各个任务的执行时间和结果，建立超时和失败等告警，及时发现问题，及时恢复数据。

转载请注明：文章转载自 www.mshxw.com

本文地址：https://www.mshxw.com/it/747776.html

上一篇 C/C++或C#或java中如何生成随机数：

下一篇 2022-2028年中国乘用车轮胎行业市场全景评估及投资前景规划报告

大数据系统相关栏目本月热门文章

热门相关搜索

路由器设置木托盘宝塔面板儿童python教程心情低落朋友圈 vim 双一流学科专升本我的学校日记学校西点培训学校汽修学校情书化妆学校塔沟武校异形模板西南大学排名最精辟人生短句 6步教你追回被骗的钱南昌大学排名清朝十二帝北京印刷学院排名北方工业大学排名北京航空航天大学排名首都经济贸易大学排名中国传媒大学排名首都师范大学排名中国地质大学(北京)排名北京信息科技大学排名中央民族大学排名北京舞蹈学院排名北京电影学院排名中国戏曲学院排名河北政法职业学院排名河北经贸大学排名天津中德应用技术大学排名天津医学高等专科学校排名天津美术学院排名天津音乐学院排名天津工业大学排名北京工业大学耿丹学院排名北京警察学院排名天津科技大学排名北京邮电大学(宏福校区)排名北京网络职业学院排名北京大学医学部排名河北科技大学排名河北地质大学排名河北体育学院排名

关于我们文章归档网站地图联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号：晋ICP备2021003244-6号