数仓开发中使用Sqoop把关系型数据库的数据接入到集群。
问题描述: Sqoop从pgsql中把数据接入到集群时,发现数据库中的部分NULL值接入后变成字符串null,影响后续模型报表开发。
原因分析:
当数据库中字段为字符串类型时,Sqoop直接import接入集群后NULL值变成字符串null。
解决方案:
Sqoop接入时增加以下参数
# Hive中NULL值写法为N --null-string '\N' --null-non-string '\N'

数仓开发中使用Sqoop把关系型数据库的数据接入到集群。
当数据库中字段为字符串类型时,Sqoop直接import接入集群后NULL值变成字符串null。
Sqoop接入时增加以下参数
# Hive中NULL值写法为N --null-string '\N' --null-non-string '\N'