之前学习过python中的pandas库,使用pandas操作表格,包括inner join,outer join,选择某些行,某些列等等。
后来学习了关系型数据库,mysql,标准的sql语句,包括条件查询等等。
现在学习了数据库原理才发现,这两种方式对应的理论支撑。
pandas: 关系代数(基于过程的)
5个基本操作:
selection: 选择某些行projection:去除某些列cross-product:笛卡尔乘积set-difference: A-B, 去除A中B的成份union: A并B sql: 关系演算 (基于bool表达式的)和关系代数在表达能力上一样,只不过会存在安全查询问题,比如sql注入。
B站课程:
https://www.bilibili.com/video/BV1ux411G7Bs?p=9



