python / jupyter notebook 连接hive数据库sql

大数据系统更新时间：2026-05-21 16:37:54 发布时间：1635天前 IT归档最新发布模块sitemap 名妆网法律咨询聚返吧英语巴士网伯小乐网商动力

使用的是impala包。
如何安装impala：https://blog.csdn.net/weixin_43713105/article/details/111921221

def read_sql(sql):
    '''
    读取hive的sql，二维列表
    参数：
        sql：sql语句
    返回：
        Dataframe
    '''
    from impala.dbapi import connect
    import pandas as pd
    import time
    
    start = time.time()           # 开始时间
    
    host_name = '主机地址'
    port = 10000
    user = '用户名'
    password = '密码'

    conn = connect(host=host_name, port=port, auth_mechanism='PLAIN', user=user, password=password)

    cur = conn.cursor()
    cur.execute(sql)                          # 执行查询语句
    sql_data = cur.fetchall()                 # 获取查询结果：二维列表
    
    end = time.time()                         # 结束时间
    print('耗时%s秒'%(end - start))           # 计算耗时

    columns = [i[0] for i in cur.description]            # dataframe的列名
    sql_data = pd.Dataframe(sql_data, columns=columns)   # 将二维列表转为dataframe，并设置列名
    
    cur.close()
    conn.close()
    
    return sql_data							   # 返回Dataframe

转载请注明：文章转载自 www.mshxw.com

本文地址：https://www.mshxw.com/it/600577.html

上一篇意外获得这份面试指南，最终斩获20+的互联网各大厂offer

下一篇 phpmyadmin设置密码，不用登录直接进入

大数据系统相关栏目本月热门文章

关于我们文章归档网站地图联系我们