架設Spark
Hadoop Server 分工內容
hadoop1 Master
hadoop3 Worker
hadoop4 Worker
配置Hadoop1、3、4
配置Scala
下載Scala到hadoop User家目錄
$ wget https://downloads.lightbend.com/scala/2.12.6/scala-2.12.6.tgz
$ tar -zxvf scala-2.12.6.tgz
$ mv scala-2.12.6 scala設定必要環境變數
請在.bashrc新增以下環境變數內容
vi ~/.bashrc 變數內容
export SCALA_HOME=/home/hadoop/scala
export PATH=$SCALA_HOME/bin:$PATH
export SPARK_HOME=/home/hadoop/spark
export PATH=$SPARK_HOME/bin:$PATH使環境變數生效
檢查Scala版本號
安裝Spark
下載Spark 2.3.1到Hadoop1 Server的hadoop User家目錄
要下載Source Code版本,原因是要打包沒有Hive版本的Spark
配置spark-env.sh
配置內容
配置slaves
配置內容
將Spark從hadoop1 Server複製到其他Server的hadoop User家目錄
啟動Spark
在hadoop1 Server執行指令
測試
瀏覽hadoop1 Spark網站
看網站是否有順利開啟,以及是否有2個worker
在hadoop1 Server測試單機執行圓周率任務
在hadoop1 Server測試獨立Spark集群模式執行圓周率任務
在hadoop1 Server測試yarn-cluster集群模式執行圓周率任務
Last updated