栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

学习笔记《Tableau案例课程:Prep实战篇》

学习笔记《Tableau案例课程:Prep实战篇》

课程来源:《Tableau案例课程:Prep实战篇》--讲师:文彤老师

课程地址:

Tableau案例课程:Prep实战篇 - 网易云课堂


Tableau Prep简介:

Tableau Prep 改变了在组织中进行数据准备的传统方式。Tableau Prep 提供了一种直观、直接的方式来合并、调整和清理数据,使分析师和业务用户可以更轻松便捷地开始分析。

Tableau Prep 由两款产品组成:一款是用于构建数据流程的 Tableau Prep Builder,另一款是用于在整个组织中共享和管理流程的 Tableau Prep Conductor。

Tableau Prep Builder:用数据流的形式整理和清理数据。

Tableau Prep Conductor:在服务器环境中将数据流自动化。


目录

1、Tableau Prep概述

Tableau Prep核心使用价值

Tableau的产品体系

Tableau Prep界面操作的基本规律

使用中的注意事项

案例1:历史销售数据的合并清理

1.1 案例需求分析

1.2 数据读取节点的基本用法

1.3 读入文本格式的数据文件

1.4 读入数据时处理文件合并等问题

1.5 数据清理节点的基本用法

1.6 对各地区的销售数据进行清理

1.7 各地区数据的纵向合并

1.8 数据的横向连接

1.9 数据的保存与导出

案例2:CCSS数据质量的自动核查

2.1 CCSS案例介绍

2.2 数据核查的方法论

2.3 生成数据核查结果长表(上)

2.4 生成数据核查结果长表(下)

2.5 生成数据核查结果宽表

2.6 在Prep流程中调用python代码


1、Tableau Prep概述

Tableau Prep核心使用价值

核心价值:

(1)减少数据准备工作量(流程化+自动化+可视化+自主化)

(2)补足tableau desktop功能缺陷

Tableau Prep实现功能:分组、拆分;计算新变量;汇总;筛选/删除;横向链接、纵向合并;数据转置;角色定义(自动数据校验,如邮箱等);

Tableau的产品体系

Tableau Prep:数据源组织与管理;数据清理与准备Tableau Desktop:PC端编辑使用(用于数据分析和结果呈现,提供完整的数据连接、展示、分析功能,可保存结果到本地或者发布到Server端)Tableau Reader:PC端结果浏览,免费使用(提供对已打包文件的浏览、动态交互能力,但不能编辑)Tableau Public:PC端编辑器,免费使用(只能读取本地文件,不能读取远程数据库;不能将结果保存为本地文件,只能发布到web)Tableau Server:服务器版本(大规模、自动化、多终端分析,可在本地或云服务器部署,可通过desktop连接并上传分析结果;可通过浏览器界面直接使用)Tableau Online:Server的云托管版本(是SaaS形式的Tableau Server,带有由Tableau完全托管的维护、升级和安全性服务)Tableau Mobile:移动端APP,免费使用(为移动客户端提供完整的数据连接、展示、分析功能;必须结合Server才能使用)


Tableau Prep界面操作的基本规律

 


使用中的注意事项

每一次预览都会重新计算,CPU越快越好;

给节点命名和设置不同颜色,用于区分流程;

案例1:历史销售数据的合并清理


1.1 案例需求分析

数据问题:

不同类型的数据文件(csv文件、xlsx文件)

变量列不一样


1.2 数据读取节点的基本用法

输入设置区域

设置:

*启用增量刷新,需要设置“输入字段”,且后接【输出】组件,设置“输出字段”。

在【输出】组件中,可设置增量刷新为“附加到表”或“创建表”。

多个文件:

数据样本:

*抽样方法选择“随机抽样”时,数据更准确。

*预览中展示的为抽样数据集数据,不是全部数据集。

更改数:


1.3 读入文本格式的数据文件

文本文件格式,比Excel文件多了一些设置项。 


1.4 读入数据时处理文件合并等问题


1.5 数据清理节点的基本用法
1.6 对各地区的销售数据进行清理

MAKEDATE函数,根据日期年、月、日生成日期字段。


1.7 各地区数据的纵向合并


1.8 数据的横向连接

*注意:

1. 用哪些关键字进行连接;

2. 连接类型;

3. 连接结果汇总:显示连接结果;

4. 在右侧连接结果中,可以勾选“仅显示不匹配的值”,查看未匹配数据;

 
1.9 数据的保存与导出

 

案例2:CCSS数据质量的自动核查


2.1 CCSS案例介绍


2.2 数据核查的方法论

数据质量的例行报告;

常见数据错误的自动更正;

发现可能存在的数据错误;

 


2.3 在Prep流程中调用python代码

prep流程中的数据框将直接与Python中的pandas包对接

 

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/758084.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号