Hadoop伪分布式搭建详细指南
时间:2025-05-22 15:50:45 101浏览 收藏
本文详细介绍了在CentOS-6.6虚拟机上搭建Hadoop伪分布式环境的步骤。首先准备好虚拟机并安装JDK,然后下载并解压Hadoop2.6.5安装包,上传到服务器。接着配置环境变量和Hadoop相关配置文件,包括hadoop-env.sh、mapred-env.sh、yarn-env.sh、core-site.xml和hdfs-site.xml,并设置DataNode节点。最后格式化文件系统,启动HDFS和YARN,成功搭建伪分布式环境,并通过WEB页面验证搭建成功。
软件准备
我使用的是CentOS-6.6的虚拟机,主机名为repo。参考在Windows中安装Linux虚拟机的步骤,我在该虚拟机中安装了JDK,参考在Linux中安装JDK的指南。此外,该虚拟机配置了免秘钥登录自身,参考配置各台虚拟机之间免秘钥登录的设置。Hadoop安装包的下载地址为:https://mirrors.aliyun.com/apache/hadoop/common/,我使用的是hadoop2.6.5版本。
将Hadoop安装包上传到服务器并解压
[root@repo ~]# tar zxvf hadoop-2.6.5.tar.gz -C /opt/apps/
配置环境变量
# 可以直接定位到文件的最后一行 [root@repo hadoop-2.6.5]# vi + /etc/profile export HADOOP_HOME=/opt/apps/hadoop-2.6.5 export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin [root@repo hadoop-2.6.5]# . /etc/profile
修改 hadoop-env.sh、mapred-env.sh、yarn-env.sh 这三个配置文件,添加JAVA_HOME
[root@repo hadoop]# pwd /opt/apps/hadoop-2.6.5/etc/hadoop [root@repo hadoop]# vi hadoop-env.sh export JAVA_HOME=/usr/local/jdk1.8.0_73 [root@repo hadoop]# vi mapred-env.sh export JAVA_HOME=/usr/local/jdk1.8.0_73 [root@repo hadoop]# vi yarn-env.sh export JAVA_HOME=/usr/local/jdk1.8.0_73
修改 core-site.xml 和 hdfs-site.xml 配置文件,配置伪分布式相关的内容
[root@repo hadoop]# vi core-site.xml
fs.defaultFS hdfs://repo:9000 hadoop.tmp.dir /var/hadoop/pseudo dfs.replication 1 dfs.namenode.secondary.http-address repo:50090 修改 slaves 配置文件,指定DataNode所在的节点
[root@repo hadoop]# vi slaves repo
格式化文件系统
[root@repo hadoop]# hadoop namenode --format # 成功信息 17/09/16 21:17:11 INFO common.Storage: Storage directory /var/hadoop/pseudo/dfs/name has been successfully formatted.
启动HDFS和YARN
[root@repo hadoop]# start-dfs.sh Starting namenodes on [repo] repo: starting namenode, logging to /opt/apps/hadoop-2.6.5/logs/hadoop-root-namenode-repo.out repo: starting datanode, logging to /opt/apps/hadoop-2.6.5/logs/hadoop-root-datanode-repo.out Starting secondary namenodes [repo] repo: starting secondarynamenode, logging to /opt/apps/hadoop-2.6.5/logs/hadoop-root-secondarynamenode-repo.out [root@repo hadoop]# start-yarn.sh starting yarn daemons starting resourcemanager, logging to /opt/hadoop-2.7.4/logs/yarn-root-resourcemanager-repo.out repo: starting nodemanager, logging to /opt/hadoop-2.7.4/logs/yarn-root-nodemanager-repo.out [root@repo hadoop]# jps 4368 Jps 3957 ResourceManager 3512 NameNode 3641 DataNode 4058 NodeManager 3805 SecondaryNameNode
访问WEB页面
搭建成功!
理论要掌握,实操不能落!以上关于《Hadoop伪分布式搭建详细指南》的详细介绍,大家都掌握了吧!如果想要继续提升自己的能力,那么就来关注golang学习网公众号吧!
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
187 收藏
-
269 收藏
-
129 收藏
-
478 收藏
-
349 收藏
-
296 收藏
-
175 收藏
-
219 收藏
-
474 收藏
-
213 收藏
-
280 收藏
-
136 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 508次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 484次学习