- Java:jdk1.8.0_251WIN10Hadoop:目标安装版本为3.1.3Scala:目标安装版本为2.11.12Spark:目标安装版本为3.0.0(适用于Hadoop 2.7.0以上版本)
- 提前安装好JDK 8/11,根据自己的需要进行安装即可
- 下载网址本教程的Hadoop版本下载地址:https://mirror.bit.edu.cn/apache/hadoop/common/hadoop-3.1.3/hadoop-3.1.3.tar.gz
- 因为Hadoop在2.0之前是完全运行在Linux系统上的,所以在之后如果想要在Windows上安装需要我们下载相应的exe才可以。下载地址,可以使用fork的方式到自己的仓库然后下载,也可以直接选择下载ZIP文件。
- 将刚刚下载的以tar.gz的文件以管理员权限进行解压如果不使用管理权限解压是无法解决so文件的解压的。将刚刚下载的Wintuils-3.1.0的bin文件夹下的所有的文件赋值到Hadoop解压后的bin文件夹下。
- 新建HADOOP_HOME的系统变量,其变量值为刚刚Hadoop解压的文件夹,比如D:hadoop为Path添加新的变量值:%HADOOP_HOME%bin
- 查看版本:hadoop version启动Hadoop:HADOOP_HOME/sbin/start-all.cmd
- 原因:JAVA安装的位置的路径中包含有空格修改binhadoop.cmd文件中的JAVA_HOME的值:注意需要同时修改etchadoophadoop-env.cmd中的JAVA_JOME的值
set JAVA_HOME=C:PROGRA~1Javajdk1.8.0_251(your jdk name)3.6.2. java.lang.ClassNotFoundException: org.apache.hadoop.yarn.server.timelineservice.collector
- Hadoop启动报错,缺少hadoop-yarn-server-timelineservice jar包解决方案:从Hadoopsharehadoopyarntimelineservice下hadoop-yarn-server-timelineservice-x.x.x.jar复制到Hadoopsharehadoopyarnlib目录下。
- 重启Hadoop的时候,控制台正常打印日志,但是jps显示没有namenode进程,可以发现存储数据的目录不存在或者目录不可访问解决方案:重新格式化文件系统
- 停止hadoop的进程:HADOOP_HOME/sbin/stop-all.sh重新格式化文件系统:HADOOP_HOME/bin/hdfs namenode -format启动Hadoop:HADOOP_HOME/sbin/start-all.sh
- 运行Hadoop的过程中显示:file:/// has no authority修改etchadoopcore-site.xml的配置
4. 安装运行Spark 4.1. 下载安装Scalafs.default.name hdfs://localhost:8020
- Scala安装注:一定要提前安装好JDK,并设置JAVA_HOME的系统变量。本教程安装使用的是2.11.12版本的ScalaWindows可以选择
- 方案一:下载Scala-2.11.12.zip然后解压缩后,手动配置系统变量方案二:使用Windows安装程序,之后根据安装程序的指引完成安装即可。
- 选择下载地址本教程的Spark的下载地址
- 将刚刚下载的压缩包就压缩到你想要的解压缩的位置(也就是安装位置)进入到安装目录下bin在cmd命令下运行spark-shell
首先需要有IDEA,并且安装了Scala的Plugin
创建一个Scala的IDEA项目
选择相应的JDK和Scala SDK,创建HelloWorld项目
创建一个名字为Hello的Scala Object,产生Hello.scala的文件。
编辑这个文件
object Hello {
def main(args: Array[String]): Unit = {
println("Hello World");
}
}
IDEA中运行正常
使用File->Project Structure->Artifacts生成meta-INF文件夹
打包JAR:选择Build->Build Artifact->Build
将压缩后的jar文件使用spark-submit来执行:spark-submit --class Hello HelloWorld.jar
- 在windows上搭建hadoop开发环境hadoop启动报错java.lang.ClassNotFoundException: org.apache.hadoop.yarn.server.timelineservice.collectorhadoop异常处理之nameNode进程无法启动,报org.apache.hadoop.hdfs.server.common.InconsistentFSStateExceptionWindows上安装运行Sparkintellij idea 打可运行scala jar 包的两种方式



