在centos系統(tǒng)中配置hdfs(hadoop分布式文件系統(tǒng))需要經(jīng)過(guò)幾個(gè)關(guān)鍵步驟,包括安裝hadoop、設(shè)置hdfs參數(shù)以及啟動(dòng)相關(guān)服務(wù)。下面是一份簡(jiǎn)要的指導(dǎo)說(shuō)明:
1. 安裝Hadoop
1.1 獲取Hadoop軟件包
首先,從apache Hadoop官網(wǎng)下載與您系統(tǒng)兼容的Hadoop版本。
wget https://archive.apache.org/dist/hadoop/common/hadoop-3.3.4/hadoop-3.3.4.tar.gz
1.2 解壓縮Hadoop
將下載的文件解壓至指定位置。
tar -xzvf hadoop-3.3.4.tar.gz -C /opt/
1.3 設(shè)置環(huán)境變量
修改/etc/profile文件,加入Hadoop的路徑設(shè)置。
export HADOOP_HOME=/opt/hadoop-3.3.4 export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
執(zhí)行命令讓更改立即生效:
source /etc/profile
2. 配置HDFS
2.1 修改core-site.xml
編輯$HADOOP_HOME/etc/hadoop/core-site.xml文件,插入如下內(nèi)容:
<configuration> <property> <name>fs.defaultFS</name> <value>hdfs://your_namenode_host:9000</value> </property> </configuration>
2.2 調(diào)整hdfs-site.xml
編輯$HADOOP_HOME/etc/hadoop/hdfs-site.xml文件,添加以下配置項(xiàng):
<configuration> <property> <name>dfs.replication</name> <value>3</value> </property> <property> <name>dfs.namenode.name.dir</name> <value>/opt/hadoop-3.3.4/data/namenode</value> </property> <property> <name>dfs.datanode.data.dir</name> <value>/opt/hadoop-3.3.4/data/datanode</value> </property> </configuration>
2.3 配置yarn-site.xml
編輯$HADOOP_HOME/etc/hadoop/yarn-site.xml文件,添加如下內(nèi)容:
<configuration> <property> <name>yarn.nodemanager.aux-services</name> <value>mapreduce_shuffle</value> </property> </configuration>
2.4 配置mapred-site.xml
編輯$HADOOP_HOME/etc/hadoop/mapred-site.xml文件,添加以下內(nèi)容:
<configuration> <property> <name>mapreduce.framework.name</name> <value>yarn</value> </property> </configuration>
3. 格式化HDFS
在啟動(dòng)HDFS之前,必須先對(duì)HDFS進(jìn)行格式化。
hdfs namenode -format
4. 啟動(dòng)HDFS
4.1 啟動(dòng)NameNode和SecondaryNameNode
運(yùn)行以下命令來(lái)啟動(dòng)NameNode和SecondaryNameNode。
start-dfs.sh
4.2 啟動(dòng)YARN ResourceManager和NodeManager
使用此命令啟動(dòng)YARN相關(guān)的服務(wù)。
start-yarn.sh
5. 檢查HDFS狀態(tài)
可以通過(guò)命令行或瀏覽器檢查HDFS的狀態(tài)。
hdfs dfsadmin -report
或者訪問(wèn)Web頁(yè)面:
- NameNode: https://www.php.cn/link/0e11d3d6172598b850bc8bf9837c2792
- ResourceManager: https://www.php.cn/link/3d20badc2e5a7bf74ce0fc12cabfbd92
6. 停止HDFS
確保所有任務(wù)完成后,可以安全地停止HDFS服務(wù)。
stop-dfs.sh stop-yarn.sh
上述步驟展示了如何在centos系統(tǒng)上搭建HDFS的基礎(chǔ)流程。根據(jù)實(shí)際需求的不同,可能還需要進(jìn)一步調(diào)整配置選項(xiàng)。