ubuntu15.10下hadoop2.7.2的安装与配置详解

网上和很多书上都有不少的hadoop在linux系统下的安装教程,但是尝试过的读者会发现,就算是按照这些教程一步步的操作,还是会在某个地方出错,主要原因是版本问题。尤其是书上的版本一般都较老,所以并不建议对着书上的教程来操作,但是可以作为参考。下面给出我自己亲身实践的安装过程,尽量把我知道的原理也写出来,这样就算有些步骤出现问题,知道了原因也是很容易解决的,就怕出现问题了,还不知道问题出在哪?

下面的代码都是在ubuntu的命令窗口(terminal)中输入:

1.工具准备:

1.1 更新apt-get:在命令行窗口中使用apt-get安装软件很方便;

sudo apt-get update

1.2 安装vim:配置文件。

sudo apt-get install vim

根据输出结果,需要输入“Y”来继续。

2.创建hadoop用户:

2.1增加hadoop用户:创建 hadoop 用户,并使用 /bin/bash 作为 shell

sudo useradd -m hadoop -s /bin/bash

2.2设置密码,按提示输入两次密码:

sudo passwd hadoop

2.3为 hadoop 用户增加管理员权限:

sudo adduser hadoop sudo

3.安装SSH、配置SSH无密码登陆

集群、单节点模式都需要用到 SSH 登陆(类似于远程登陆,你可以登录某台 Linux 主机,并且在上面运行命令),Ubuntu 默认已安装了 SSH client,此外还需要安装 SSH server:

sudo apt-get install openssh-server

安装后,可以使用如下命令登陆本机:

ssh localhost

4.安装java环境

4.1安装jdk:

sudo apt-get install openjdk-8-jre openjdk-8-jdk

4.2配置JAVA_HOME

dpkg -L openjdk-8-jdk | grep '/bin/javac'

该命令会输出一个路径,除去路径末尾的 “/bin/javac”,剩下的就是正确的路径了。如输出路径为 /usr/lib/jvm/java-8-openjdk/bin/javac,则我们需要的路径为 /usr/lib/jvm/java-8-openjdk。

如果这里输出错误,那我们怎么知道JAVA_HOME的地址呢?很简单,输入:

java -verbose

输出:usr/lib/jvm/java-8-openjdk/jre/lib/rt.jar

则前面的usr/lib/jvm/java-8-openjdk就是JAVA_HOME的地址。

然后,使用命令 sudo gedit /etc/profile 打开 /etc/profile 文件:

sudo gedit /etc/profile

然后在文件末尾添加如下三行:

export JAVA_HOME=/usr/lib/jvm/java-8-openjdk
CLASSPATH=.:$JAVA_HOME/lib:$JAVA_HOME/jre/lib:$CLASSPATH
export PATH=$JAVA_HOME/bin:$JAVA_HOME/jre/bin:$PATH

然后ctrl+s保存。然后执行如下代码,使更改生效:

$source ~/.bashrc

如果JAVA_HOME还是没有更改过来,可能是文件没有生效,运行

$source /etc/profile

再查看JAVA_HOME,可以发现是我们在文件中设置的路径。

如果上面设置正确的话,$JAVA_HOME/bin/java -version 会输出 java 的版本信息,且和 java -version 的输出结果一样,如下图所示,则配置成功:

5.安装Hadoop

5.1hadoop程序下载:http://mirror.bit.edu.cn/apache/hadoop/common/

建议选择下载 “stable” 下的 hadoop-2.x.y.tar.gz 。

5.2 hadoop安装

输入命令:

sudo tar -zxf ~/Downloads/hadoop-2.7.2.tar.gz -C /usr/local  
cd /usr/local/
sudo mv ./hadoop-2.7.2/ ./hadoop      
sudo chown -R hadoop ./hadoop

Hadoop 解压后即可使用。输入如下命令来检查 Hadoop 是否可用,成功则会显示 Hadoop 版本信息:

cd /usr/local/hadoop
./bin/hadoop version

5.3 hadoop单击配置

Hadoop 默认模式为非分布式模式,无需进行其他配置即可运行。非分布式即单 Java 进程,方便进行调试。

配置尚未完成,由于近期较忙,过两天闲下来了再配置。

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对呐喊教程的支持。如果你想了解更多相关内容请查看下面相关链接

声明:本文内容来源于网络,版权归原作者所有,内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:notice#nhooo.com(发邮件时,请将#更换为@)进行举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。