Hadoop2.X—快速部署，一睹HDFS的芳容

編程語言 Hadoop HDFS Java 卡弗卡大數據 2017-05-02

還是接著上節的內容來講，雖然今天不是視頻，但一樣儘可能的做到內容的完整全面。因為卡弗卡大數據對外分享的內容都比較講究質量，每篇文章都是，包括視頻。為啥不今天發的不是視頻，自己猜去吧，哈哈！

基於上節課的內容，今天我們要搭建hadoop的偽分佈式環境（也就是單節點環境）。先讓我們的HDFS分佈式文件系統跑起來。學了這麼久，大數據說的神乎其神，到底長啥樣呀。所以接下來我們來一探究竟。

看文章比較累，先打點雞血，俺們正式開始。

Hadoop2.X—快速部署，一睹HDFS的芳容

第一步：創建我們要使用的目錄

在自建的系統用（kfk）下創建如下的幾個目錄，以備我們接下來操作的使用。

$ sudo mkdir /opt/softwares
$ sudo mkdir /opt/modules
$ sudo mkdir /opt/tools
$ sudo mkdir /opt/datas

第二步：將新建的目錄所屬用戶改為kfk用戶

也就是此時的目錄用戶為root，我們要把它改為kfk用戶。

$ sudo chown -R kfk:kfk /opt/*

第三步：上傳jdk和hadoop的安裝包

hadoop的安裝包大家去這個網址下載，所有版本介質都來源這裡。

https://archive.apache.org/dist/hadoop/common

JDK版本：1.7 for Linux
Hadoop版本：hadoop2.5.0
上傳工具：FileZilla
上傳目錄：/opt/softwares

第四步：修改安裝文件的可執行權限

如果windows，沒有執行權限是不能安裝軟件的。所以要對剛剛上傳的文件做權限修改。

$ chmod u+x /opt/softwares/*

第五步：安裝JDK-解壓

$ tar -zxf jdk-7u67-linux-x64.tar.gz -C /opt/modules/

第六步：安裝JDK-配置環境變量

$ sudo vi /etc/profile

在profile文件的末尾加上如下的內容：

##JAVA_HOME
export JAVA_HOME=/opt/modules/jdk1.7.0_67
export PATH=$PATH:$JAVA_HOME/bin

保存文件

第七步：讓配置文件生效

切換到root用戶下

$ su
Password:
# source /etc/profile
# exit

第八步：驗證JDK安裝是否完成

$ java -version

第九步：安裝Hadoop-解壓

$ tar -zxf hadoop-2.5.0.tar.gz -C /opt/modules/

第十步：刪除.cmd文件

hadoop安裝文件解壓後，到/hadoop/sbin/目錄下刪除.cmd文件

$ rm -rf ./*.cmd

Hadoop2.X—快速部署，一睹HDFS的芳容

doc目錄都是關於hadoop的相關文檔，佔用磁盤空間比較大，所以我們把它刪掉。與sbin同級的share下找到doc目錄。

$ rm -rf ./share/doc/

第十二步：NotePad工具修改Hadoop的各個配置文件

工具名稱：NotePad

第十三步：刪除etc目錄下的.cmd文件

/opt/modules/hadoop-2.5.0/etc/hadoop下的.cmd文件

$ rm -rf ./*.cmd

第十四步：配置Hadoop中的Java_home

在hadoop-2.5.0/etc下分別打開hadoop-env.sh、mapred-env.sh、yarn-env.sh，修改三個文件中的

JAVA_HOME參數值：

export JAVA_HOME=/opt/modules/jdk1.7.0_67

保存文件

第十五步：驗證Java_home的配置

[[email protected] hadoop-2.5.0]$ bin/hadoop

Hadoop2.X—快速部署，一睹HDFS的芳容

聽個歌曲等會再戰

第十六步：配置etc/hadoop/core-site.xml文件

打開core-site.xml文件，添加內容如下：

<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://bigdata-senior01.kfk.com:9000</value>
</property>
</configuration>

保存文件！

以上配置的是NameNode默認的節點服務，我們把localhost改成我們命名的域名城bigdata-senior01.kfk.com。

第十七步：配置etc/hadoop/slave文件

也就是配置我們的DataNode節點服務，打開slave文件，添加內容如下：

bigdata-senior01.kfk.com

因為我們是偽分佈式的部署安裝，所以我們把NameNode和DataNode放在同一個節點服務器上了。

第十八步：配置etc/hadoop/hdfs-site.xml文件

這裡配置的是HDFS文件的副本數，添加內容如下：

<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
</configuration>

保存文件！

第十九步：格式化文件系統

目的是生成文件的根目錄和元數據。

[[email protected] hadoop-2.5.0]$ bin/hdfs namenode -format

等待執行，如過程沒有報錯，格式化文件就算完成了。

第二十步：啟動HDFS服務

在之前我們講過，HDFS的兩個非常重要的進程。大家還是老老實實一個一個的啟動操作。

$ sbin/hadoop-daemon.sh start namenode
$ sbin/hadoop-daemon.sh start datanode

第二一步：查看服務是否啟動

$ jps
2355 Jps
2206 NameNode
2281 DataNode

這就說明我們的服務都啟動起來了。

第二十二部：瀏覽器訪問HDFS

默認端口為50070，主機名按你自己配置的鞋就OK。

http://bigdata-senior01.kfk.com:50070/

至此我們的HDFS安裝部署就完成了！

Hadoop2.X—快速部署，一睹HDFS的芳容

"通過一個例子來了解如何實現一個Spring Boot Starter。對於我們正在構建的每個Spring Boot應用程序，我們不希望從頭開始實現某些跨領域的問題。相反，我們希望一次性實現這些功能，並根據需要將它們作為組件包含在任何應用程序中。在Spring Boot中，...

Gradle Java 跳槽那些事兒 2019-09-13

'快速搭建ELK日誌分析平臺'

"日誌主要包括系統日誌、應用程序日誌和安全日誌等。系統運維和開發人員可以通過日誌瞭解服務器軟硬件信息、檢查配置過程中的錯誤及錯誤發生的原因。經常分析日誌可以瞭解服務器的負荷，性能安全性，從而及時採取措施糾正錯誤。通常，日誌被分散的儲存不同的設備上。如果你管理數十上百臺服務器...

ElasticSearch Java Linux Windows 虛擬機搜索引擎騰訊TM JSON GnuPG 2019-09-12

'10分鐘快速掌握Docker必備基礎知識'

"專注於Java領域優質技術，歡迎關注作者：張君鴻Docker是時下熱門的容器技術，相信作為一名開發人員，你一定聽說過或者使用過，很多人會把Docker理解為一個輕量級虛擬機，但其實Docker與虛擬機(VM)是兩種不同的計算機虛擬化技術，也有很多人會覺得，有了虛擬機，那為...

Docker 虛擬機操作系統 Linux 雲計算硬件軟件物理技術電腦 Java 中央處理器 Firefox 2019-09-10

'python之父：零基礎學python，如何學習最為快速？這套教程請收好'

"1.Python的設計目標1999年，吉多*範羅蘇姆向DARPA提交了一條名為”Computer Programming For Everybody”的資金申請，並在後來說明了他對Python的目標：1.一門簡單直觀的語言並與主要競爭者一樣強大2.開源，以便任何人都可以為...

Python 設計機器學習數據庫 Java 工程師人工智能算法 2019-09-09

'0基礎學Python從哪入手？3個月快速學會Python的祕訣是什麼？'

"如果已經學習了一點其它編程語言，該怎麼快速瞭解和學習Python呢？如何用3個月快速學會Python？零基礎，我想學一門數據分析的語言，不敢說是謀生用，只是想掌握一種工具。沒事爬點有用的數據資料什麼的。1題主如果想要利用python爬取數據資料，本人目前也正在學習Pyth...

Python 網絡爬蟲 Linux 數據庫 Scrapy 操作系統技術慕課網瀏覽器 HTML 虛擬機編程語言電腦面向對象程序編程坦克大戰 CSS 2019-09-08

'零基礎自學python，如何學習最為快速？阿里大佬：這套教程請收好'

Python 設計機器學習數據庫 Java 算法工程師人工智能 2019-09-07

'什麼是PLC,什麼是可編程控制器，讓你簡單快速瞭解PLC知識和應用'

"一、簡述多年來，可編程控制器（以下簡稱PLC）從其產生到現在，實現了接線邏輯到存儲邏輯的飛躍；其功能從弱到強，實現了邏輯控制到數字控制的進步；其應用領域從小到大，實現了單體設備簡單控制到勝任運動控制、過程控制及集散控制等各種任務的跨越。今天的PLC在處理模擬量、數字運算、...

技術編程語言通信硬件冶金設計機器人彙編語言交通數學石油電腦建築材料體育 2019-09-01

'深入淺出Nginx，如何做到高併發下的高效處理？如何做到熱部署？'

"快，關注米兜Java，一起漲姿勢～熱點推薦推薦27個Mybatis-Plus優秀案例foreach循環中為什麼不要進行remove/add操作微服務架構如何保證安全性？深入淺出Nginx，如何做到高併發下的高效處理？如何做到熱部署？01前言Nginx("engine x"...

Nginx Linux Java 中央處理器程序員 Apache 設計師租房 YouTube 2019-08-31

'Flask + Docker 無腦部署新手教程'

"最近一個朋友在一直微信問我怎麼部署flask。這種情況我有經驗：“google 啥都有，搜 flask 部署去”朋友：“完全看不懂”Python資源共享群：626017123我直覺想反駁，可是想到當初我學部署的時候也一頭霧水肝幾天也沒搞明白（當時是計算機網絡、linux、...

Flask Docker Python Linux Java Google 瀏覽器 Django 電腦阿里雲計算 PHP Sync 2019-08-30

'springboot配合maven打成可執行jar，構建鏡像部署到docker容器中'

"本篇文章將介紹springboot應用如何打成jar包,並將jar構建為docker鏡像部署到docker中應用打包需要配合spring-boot-maven-plugin打包,將以下代碼放到應用pom文件中 <plugin> <groupId>o...

Docker MySQL Java 數據庫 2019-08-28

'用Python 3實現快速排序和插入排序代碼詳解 '

"今天用Python 3版本實現快速排序和插入排序。先對Python語言做個簡單介紹。Python是一種解釋型、面向對象、動態數據類型的高級程序設計語言。Python由Guido van Rossum於1989年底發明，第一個公開發行版發行於1991年。Python 源代碼...

Python 編程語言鏡音雙子人工智能算法 Guido 數據結構 2019-08-27

'零基礎程序員如何快速入門C語言，附視頻教程'

"學習C語言不是一朝一夕的事情，但卻也不是需要花費幾年時間才能精通的。那麼如何以最小的代價，學習C語言呢？這最小的代價也絕不是什麼捷徑，而是以最短的時間去收穫最多的知識，但同時也意味著你需要經歷艱苦的過程。學習C語言是如此，學習其他語言亦是如此。一、要讀就讀好書，否則不如...

C語言程序員編程語言 UNIX Microsoft Visual Studio Windows 編譯器集成開發環境程序設計 Linux 讀書 GCC 歷史 2019-08-26

'鴻卓課工場—8個能夠快速提高編程水平的小遊戲'

"編程是全球僱主要求最高的職業之一。世界上沒有足夠的合格開發人員，每天都有新技術和新公司湧現。這個職業要求非常高，競爭非常激烈，即使你已經是一個專業的開發人員，你也需要不斷地學習和擴展你的知識。當然，有很多方法可以學習如何編碼，有數百本教科書、視頻教程和指南可供選擇。練習是...

小遊戲 Java 編程語言人生第一份工作彙編語言技術設計電腦坦克人工智能工程師算法機器人益智遊戲坦克大戰集成開發環境科幻小說 2019-08-25

'好程序員大數據學習路線分享HDFS總結'

"好程序員大數據學習路線分享HDFS總結HDFS介紹HDFS(Hadoop Distributed File System)是分佈式文件系統,是Hadoop項目的核心子項目.設計思想:將大文件、大批量文件，分佈式存放在大量服務器上，以便於採取分而治之的方式對海量數據進行運算...

HDFS 程序員大數據 Hadoop GFS 設計 Google 2019-08-25

'提升10倍生產力：IDEA遠程一鍵部署SpringBoot'

"IDEA是Java開發利器，springboot是Java生態中最流行的微服務框架，docker是時下最火的容器技術，那麼它們結合在一起會產生什麼化學反應呢？一、開發前準備1.Docker安裝可以參考：https://docs.docker.com/install/2.配...

Docker Java XML Vi Systemd 2019-08-23

'清華教授總結的100天快速學習路線，100天帶你從Python新手到大師'

"Python應用領域和就業形勢分析簡單的說，Python是一個“優雅”、“明確”、“簡單”的編程語言。學習曲線低，非專業人士也能上手開源系統，擁有強大的生態圈解釋型語言，完美的平臺可移植性支持面向對象和函數式編程能夠通過調用C/C++代碼擴展功能代碼規範程度高，可讀性強目...

Python 工程師清華大學 Linux 網絡爬蟲 Scala Java 斐波那契 DevOps C語言 LISP 2019-08-22

'要快速學會Python，謹記3456這四個數字就可以了'

"鑑於大多數書籍在編寫上都結構混亂，無法體現出知識的系統性、邏輯性和層次性。特整理出學Python最基礎的知識學習框架，希望幫助大家快速入門。要快速學會Python，謹記3456這四個數字就可以了。下面我來描述這四個數字的含義！我是按照數字的順序來描述的，但在學習的順序上，...

Python 數據庫 Linux 人工智能 Redis Scrapy 網絡爬蟲 CSS 設計 MongoDB NoSQL 設計模式 HDFS jQuery MySQL SQL 2019-08-20

'IT大牛告訴你：如何快速從零基礎，成為編程大神'

"首先要求這幾點：1、做一名程序員，絕對要耐得住寂寞，並且要一直有點興趣促進你學習。如果你完全沒興趣，你是不可能學會編程。2、能抗壓。咱幹程序員這一行業，沒填幾乎都是面對枯燥的代碼，經常要面臨著加班，除非你特意去很輕鬆的公司上班。滿足了這兩點，那就開始努力學習吧。在分享學習...

Java Python 編程語言 JavaScript 數據庫 C語言 HTML SQL MySQL 大學 Microsoft SQL Server 程序員電腦 Android Studio Android 程序設計人工智能 jQuery CSS JSP 人生第一份工作 2019-08-14

'Python學習任務清單，教你怎麼簡單又快速的學習Python'

"站在風口上，豬都能飛起來。人工智能風口，讓Pyhon這門膠水語言轉變成非常火的網紅語言。編程功力深厚的程序員花一兩個星期就能上手Python，而一些新手程序員花幾個月就可以上手。學編程，用Python確實是一個相當不錯的選擇。不過，面對Python網上有紛雜的資料，一些程...

Python MySQL Linux 面向對象程序編程 JavaScript 程序員數據庫 jQuery Django CSS MongoDB 編程語言 HTML 讀書人工智能算法硬件操作系統物聯網 2019-08-08

推薦中...

Hadoop2.X—快速部署，一睹HDFS的芳容

第一步：創建我們要使用的目錄

第二步：將新建的目錄所屬用戶改為kfk用戶

第三步：上傳jdk和hadoop的安裝包

第四步：修改安裝文件的可執行權限

第五步：安裝JDK-解壓

第六步：安裝JDK-配置環境變量

第七步：讓配置文件生效

第八步：驗證JDK安裝是否完成

第九步：安裝Hadoop-解壓

第十步：刪除.cmd文件

第十一步：刪除解壓目錄下的doc目錄

第十二步：NotePad工具修改Hadoop的各個配置文件

第十三步：刪除etc目錄下的.cmd文件

第十四步：配置Hadoop中的Java_home

第十五步：驗證Java_home的配置

第十六步：配置etc/hadoop/core-site.xml文件

第十七步：配置etc/hadoop/slave文件

第十八步：配置etc/hadoop/hdfs-site.xml文件

第十九步：格式化文件系統

第二十步：啟動HDFS服務

第二一步：查看服務是否啟動

第二十二部：瀏覽器訪問HDFS

相關推薦