架設Spark

Hadoop Server 分工內容

  • hadoop1 Master

  • hadoop3 Worker

  • hadoop4 Worker

配置Hadoop1、3、4

配置Scala

下載Scala到hadoop User家目錄

$ wget https://downloads.lightbend.com/scala/2.12.6/scala-2.12.6.tgz
$ tar -zxvf scala-2.12.6.tgz 
$ mv scala-2.12.6 scala

設定必要環境變數

請在.bashrc新增以下環境變數內容

vi ~/.bashrc 

變數內容

export SCALA_HOME=/home/hadoop/scala
export PATH=$SCALA_HOME/bin:$PATH
export SPARK_HOME=/home/hadoop/spark
export PATH=$SPARK_HOME/bin:$PATH

使環境變數生效

檢查Scala版本號

安裝Spark

下載Spark 2.3.1到Hadoop1 Server的hadoop User家目錄

要下載Source Code版本,原因是要打包沒有Hive版本的Spark

配置spark-env.sh

配置內容

配置slaves

配置內容

將Spark從hadoop1 Server複製到其他Server的hadoop User家目錄

啟動Spark

在hadoop1 Server執行指令

測試

瀏覽hadoop1 Spark網站

看網站是否有順利開啟,以及是否有2個worker

 在hadoop1 Server測試單機執行圓周率任務

在hadoop1 Server測試獨立Spark集群模式執行圓周率任務

在hadoop1 Server測試yarn-cluster集群模式執行圓周率任務

Last updated