因为公司客户的数据量非常大,我试着用kettle去清洗出想要的数据,可是结果居然是0条
附图如下
可以看到数据在链接完之后,就没了
很奇怪到底是哪里出了问题
先在数据库里查了一下,之后
又用pandas去处理了一下,去验证是不是真的没数据了
可是,并不是,pandas也是有数据的,这说明数据本身是没有问题的,肯定是spoon处理的过程中有问题,更进一步,应该说是链接出了问题。
又去学习了一下kettle,数据库之间的表连接的时候,怎么就没想到跟数据库一样,去用join呢,用了join之后,不同的库,就可以使用数据库查询这个插件了。
我并不确定是不是所有的查询结果都需要排序才行,但是,反正不少块肉。在查询后就又加入了排序记录。
结论:数据库同一个库中的表查询,可以使用sql语句,不同的库之间做链接查询,可以用数据库查询。



