栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

pyspark 中 读取 hive 表,提示 hdfs 中的 nameservice 不识别

pyspark 中 读取 hive 表,提示 hdfs 中的 nameservice 不识别

前言

本文隶属于专栏《Spark异常问题汇总》,该专栏为笔者原创,引用请注明来源,不足和错误之处请在评论区帮忙指出,谢谢!

本专栏目录结构和参考文献请见 Spark异常问题汇总

正文 问题描述

pyspark 中 读取hive表,提示 hdfs 中的 nameservice 不识别

Caused by: java.net.UnknownHostException: gbigdata
问题补充

本地 跑 是好的,但是 到 jupyter 上就有问题

环境

配置的 python 环境是 anaconda3

定位思路
  1. 查一下core-site.xml里的fs.defaultFS属性

  1. 查一下 nn 端口配置和移动转移的配置
  2. 查一下hdfs-site.xml里的nameservice
  3. 查一下host配置映射,可能主机地址没有映射
  4. 用代码调试的时候,查一下上下文,配置文件加载可能出错了
转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/326127.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号