课程来源:《Tableau案例课程:Prep实战篇》--讲师:文彤老师
课程地址:
Tableau案例课程:Prep实战篇 - 网易云课堂
Tableau Prep简介:
Tableau Prep 改变了在组织中进行数据准备的传统方式。Tableau Prep 提供了一种直观、直接的方式来合并、调整和清理数据,使分析师和业务用户可以更轻松便捷地开始分析。
Tableau Prep 由两款产品组成:一款是用于构建数据流程的 Tableau Prep Builder,另一款是用于在整个组织中共享和管理流程的 Tableau Prep Conductor。
Tableau Prep Builder:用数据流的形式整理和清理数据。
Tableau Prep Conductor:在服务器环境中将数据流自动化。
目录
1、Tableau Prep概述
Tableau Prep核心使用价值
Tableau的产品体系
Tableau Prep界面操作的基本规律
使用中的注意事项
案例1:历史销售数据的合并清理
1.1 案例需求分析
1.2 数据读取节点的基本用法
1.3 读入文本格式的数据文件
1.4 读入数据时处理文件合并等问题
1.5 数据清理节点的基本用法
1.6 对各地区的销售数据进行清理
1.7 各地区数据的纵向合并
1.8 数据的横向连接
1.9 数据的保存与导出
案例2:CCSS数据质量的自动核查
2.1 CCSS案例介绍
2.2 数据核查的方法论
2.3 生成数据核查结果长表(上)
2.4 生成数据核查结果长表(下)
2.5 生成数据核查结果宽表
2.6 在Prep流程中调用python代码
1、Tableau Prep概述
Tableau Prep核心使用价值
核心价值:
(1)减少数据准备工作量(流程化+自动化+可视化+自主化)
(2)补足tableau desktop功能缺陷
Tableau Prep实现功能:分组、拆分;计算新变量;汇总;筛选/删除;横向链接、纵向合并;数据转置;角色定义(自动数据校验,如邮箱等);
Tableau的产品体系
Tableau Prep:数据源组织与管理;数据清理与准备Tableau Desktop:PC端编辑使用(用于数据分析和结果呈现,提供完整的数据连接、展示、分析功能,可保存结果到本地或者发布到Server端)Tableau Reader:PC端结果浏览,免费使用(提供对已打包文件的浏览、动态交互能力,但不能编辑)Tableau Public:PC端编辑器,免费使用(只能读取本地文件,不能读取远程数据库;不能将结果保存为本地文件,只能发布到web)Tableau Server:服务器版本(大规模、自动化、多终端分析,可在本地或云服务器部署,可通过desktop连接并上传分析结果;可通过浏览器界面直接使用)Tableau Online:Server的云托管版本(是SaaS形式的Tableau Server,带有由Tableau完全托管的维护、升级和安全性服务)Tableau Mobile:移动端APP,免费使用(为移动客户端提供完整的数据连接、展示、分析功能;必须结合Server才能使用)
Tableau Prep界面操作的基本规律
使用中的注意事项
每一次预览都会重新计算,CPU越快越好;
给节点命名和设置不同颜色,用于区分流程;
案例1:历史销售数据的合并清理
1.1 案例需求分析
1.1 案例需求分析
数据问题:
不同类型的数据文件(csv文件、xlsx文件)
变量列不一样
1.2 数据读取节点的基本用法
输入设置区域
设置:
*启用增量刷新,需要设置“输入字段”,且后接【输出】组件,设置“输出字段”。
在【输出】组件中,可设置增量刷新为“附加到表”或“创建表”。
多个文件:
数据样本:
*抽样方法选择“随机抽样”时,数据更准确。
*预览中展示的为抽样数据集数据,不是全部数据集。
更改数:
1.3 读入文本格式的数据文件
文本文件格式,比Excel文件多了一些设置项。
1.4 读入数据时处理文件合并等问题
1.5 数据清理节点的基本用法
1.6 对各地区的销售数据进行清理
MAKEDATE函数,根据日期年、月、日生成日期字段。
1.7 各地区数据的纵向合并
1.8 数据的横向连接
1.8 数据的横向连接
*注意:
1. 用哪些关键字进行连接;
2. 连接类型;
3. 连接结果汇总:显示连接结果;
4. 在右侧连接结果中,可以勾选“仅显示不匹配的值”,查看未匹配数据;
1.9 数据的保存与导出
案例2:CCSS数据质量的自动核查
2.1 CCSS案例介绍
2.2 数据核查的方法论
2.1 CCSS案例介绍
2.2 数据核查的方法论
数据质量的例行报告;
常见数据错误的自动更正;
发现可能存在的数据错误;
2.3 在Prep流程中调用python代码
prep流程中的数据框将直接与Python中的pandas包对接



