登录
首页 >  文章 >  linux

Debian上搭建Hadoop开发环境攻略

时间:2025-04-15 17:09:43 113浏览 收藏

本指南提供在Debian系统上搭建Hadoop 3.3.6开发环境的详细步骤,涵盖JDK安装、Hadoop下载与配置、SSH无密码登录设置、NameNode格式化以及Hadoop服务的启动和验证。 文章将指导您逐步完成环境配置,包括配置核心Hadoop配置文件(core-site.xml、hdfs-site.xml、mapred-site.xml和yarn-site.xml)以及设置必要的环境变量。 最终,您可以通过访问NameNode Web界面验证Hadoop的成功安装。 本教程适合Hadoop初学者和开发者快速搭建本地开发环境。

Debian上Hadoop开发环境如何搭建

本指南详细介绍如何在Debian系统上搭建Hadoop开发环境。

一、安装Java开发套件(JDK)

首先,安装OpenJDK:

sudo apt update
sudo apt install openjdk-11-jdk -y

配置JAVA_HOME环境变量:

sudo nano /etc/environment

在文件末尾添加(根据实际JDK版本调整路径):

JAVA_HOME="/usr/lib/jvm/java-11-openjdk-amd64"

保存并退出,然后执行:

source /etc/environment

验证安装:

java -version

二、安装Hadoop

下载Hadoop 3.3.6 (或其他版本):

wget https://www.apache.org/dyn/closer.cgi/hadoop/common/hadoop-3.3.6/hadoop-3.3.6-src.tar.gz

验证下载完整性:

wget https://downloads.apache.org/hadoop/common/hadoop-3.3.6/hadoop-3.3.6-src.tar.gz.sha512
sha256sum -c hadoop-3.3.6-src.tar.gz.sha512

创建目录并解压:

sudo mkdir /opt/hadoops
sudo tar -xzvf hadoop-3.3.6-src.tar.gz -C /opt/hadoops --strip-components 1

三、配置Hadoop环境变量

编辑/etc/profile文件,添加:

export HADOOP_HOME="/opt/hadoops/hadoop-3.3.6"
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

刷新环境变量:

source /etc/profile

四、配置Hadoop核心配置文件

编辑core-site.xml

sudo nano $HADOOP_HOME/etc/hadoop/core-site.xml

添加:

fs.defaultFShdfs://localhost:9000

编辑hdfs-site.xml

sudo nano $HADOOP_HOME/etc/hadoop/hdfs-site.xml

添加:

dfs.replication1dfs.namenode.name.dir/opt/hadoops/hdfs/namenode

编辑mapred-site.xml

sudo nano $HADOOP_HOME/etc/hadoop/mapred-site.xml

添加:

mapreduce.framework.nameyarn

编辑yarn-site.xml

sudo nano $HADOOP_HOME/etc/hadoop/yarn-site.xml

添加:

yarn.nodemanager.aux-servicesmapreduce_shuffle

五、设置SSH无密码登录

生成SSH密钥:

sudo su - hadoop
ssh-keygen -t rsa -P ""

复制公钥:

cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

测试连接:

ssh localhost

六、格式化NameNode

hdfs namenode -format

七、启动Hadoop服务

start-dfs.sh
start-yarn.sh

八、验证Hadoop安装

检查集群状态:

hdfs dfsadmin -report

访问NameNode Web界面:http://localhost:9870

完成以上步骤后,您的Debian系统上的Hadoop开发环境就搭建完成了。 请根据实际情况调整路径和Hadoop版本。

今天带大家了解了的相关知识,希望对你有所帮助;关于文章的技术知识我们会一点点深入介绍,欢迎大家关注golang学习网公众号,一起学习编程~

相关阅读
更多>
最新阅读
更多>
课程推荐
更多>