gmnon.cn-疯狂蹂躏欧美一区二区精品,欧美精品久久久久a,高清在线视频日韩欧美,日韩免费av一区二区

站長資訊網
最全最豐富的資訊網站

搭建Spark高可用集群

Spark簡介

官網地址:http://spark.apache.org/

搭建Spark高可用集群

Apache Spark™是用于大規模數據處理的統一分析引擎。

從右側最后一條新聞看,Spark也用于AI人工智能 spark是一個實現快速通用的集群計算平臺。它是由加州大學伯克利分校AMP實驗室 開發的通用內存并行計算框架,用來構建大型的、低延遲的數據分析應用程序。它擴展了廣泛使用的MapReduce計算 模型。高效的支撐更多計算模式,包括交互式查詢和流處理。spark的一個主要特點是能夠在內存中進行計算,及時依賴磁盤進行復雜的運算,Spark依然比MapReduce更加高效。

為什么要學Spark

中間結果輸出:基于MapReduce的計算引擎通常會將中間結果輸出到磁盤上,進行存儲和容錯。出于任務管道承接的,考慮,當一些查詢翻譯到MapReduce任務時,往往會產生多個Stage,而這些串聯的Stage又依賴于底層文件系統(如HDFS)來存儲每一個Stage的輸出結果。 Spark是MapReduce的替代方案,而且兼容HDFS、Hive,可融入Hadoop的生態系統,以彌補MapReduce的不足。

Spark的四大特性

高效性

運行速度提高100倍。 Apache Spark使用最先進的DAG調度程序,查詢優化程序和物理執行引擎,實現批量和流式數據的高性能。

易用性

Spark支持Java、Python和Scala的API,還支持超過80種高級算法,使用戶可以快速構建不同的應用。而且Spark支持交互式的Python和Scala的shell,可以非常方便地在這些shell中使用Spark集群來驗證解決問題的方法。

通用性

Spark提供了統一的解決方案。Spark可以用于批處理、交互式查詢(Spark SQL)、實時流處理(Spark Streaming)、機器學習(Spark MLlib)和圖計算(GraphX)。這些不同類型的處理都可以在同一個應用中無縫使用。Spark統一的解決方案非常具有吸引力,畢竟任何公司都想用統一的平臺去處理遇到的問題,減少開發和維護的人力成本和部署平臺的物力成本。

兼容性

Spark可以非常方便地與其他的開源產品進行融合。比如,Spark可以使用Hadoop的YARN和Apache Mesos作為它的資源管理和調度器,器,并且可以處理所有Hadoop支持的數據,包括HDFS、HBase和Cassandra等。這對于已經部署Hadoop集群的用戶特別重要,因為不需要做任何數據遷移就可以使用Spark的強大處理能力。Spark也可以不依賴于第三方的資源管理和調度器,它實現了Standalone作為其內置的資源管理和調度框架,這樣進一步降低了Spark的使用門檻,使得所有人都可以非常容易地部署和使用Spark。此外,Spark還提供了在EC2上部署Standalone的Spark集群的工具。

Mesos:Spark可以運行在Mesos里面(Mesos 類似于yarn的一個資源調度框架) standalone:Spark自己可以給自己分配資源(master,worker) YARN:Spark可以運行在yarn上面 Kubernetes:Spark接收 Kubernetes的資源調度

Spark的組成

Spark組成(BDAS):全稱伯克利數據分析棧,通過大規模集成算法、機器、人之間展現大數據應用的一個平臺。也是處理大數據、云計算、通信的技術解決方案。

它的主要組件有:

SparkCore:將分布式數據抽象為彈性分布式數據集(RDD),實現了應用任務調度、RPC、序列化和壓縮,并為運行在其上的上層組件提供API。

SparkSQL:Spark Sql 是Spark來操作結構化數據的程序包,可以讓我使用SQL語句的方式來查詢數據,Spark支持 多種數據源,包含Hive表,parquest以及JSON等內容。

SparkStreaming: 是Spark提供的實時數據進行流式計算的組件。

MLlib:提供常用機器學習算法的實現庫。

GraphX:提供一個分布式圖計算框架,能高效進行圖計算。

BlinkDB:用于在海量數據上進行交互式SQL的近似查詢引擎。

Tachyon:以內存為中心高容錯的的分布式文件系統。

應用場景

Yahoo將Spark用在Audience Expansion中的應用,進行點擊預測和即席查詢等 淘寶技術團隊使用了Spark來解決多次迭代的機器學習算法、高計算復雜度的算法等。應用于內容推薦、社區發現等 騰訊大數據精準推薦借助Spark快速迭代的優勢,實現了在“數據實時采集、算法實時訓練、系統實時預測”的全流程實時并行高維算法,最終成功應用于廣點通pCTR投放系統上。 優酷土豆將Spark應用于視頻推薦(圖計算)、廣告業務,主要實現機器學習、圖計算等迭代計算。

spark安裝

上傳spark-安裝包到Linux上

[root@hdp-01 ~]# wget https://d3kbcqa49mib13.cloudfront.net/spark-2.2.0-bin-hadoop2.7.tgz
[root@hdp-01 ~]# tar -zxvf spark-2.2.0-bin-hadoop2.7.tgz -C apps/
[root@hdp-01 apps]# mv spark-2.2.0-bin-hadoop2.7 /spark

進入conf目錄并重命名并修改spark-env.sh.template文件

[root@hdp-01 conf]# mv spark-env.sh.template spark-env.sh  [root@hdp-01 conf]# vi spark-env.sh

在該配置文件中添加如下配置

export JAVA_HOME=/root/apps/jdk1.8.0_152  export SPARK_MASTER_IP=hdp-01  export SPARK_MASTER_PORT=7077

重命名并修改slaves.template文件

[root@hdp-01 conf]# mv slaves.template slaves  [root@hdp-01 conf]# vi slaves

在該文件中添加子節點所在的位置(Worker節點)

hdp-02  hdp-03
hdp-04

將配置好的Spark拷貝到其他節點上

[root@hdp-01 apps]# scp -r spark/ hdp-02:$PWD  [root@hdp-01 apps]# scp -r spark/ hdp-03:$PWD
[root@hdp-01 apps]# scp -r spark/ hdp-04:$PWD

Spark集群配置完畢,目前是1個Master,3個Work,在hdp-01上啟動Spark集群

[root@hdp-01 spark]# sbin/start-all.sh

啟動后執行jps命令,主節點上有Master進程,其他子節點上有Work進程,登錄Spark管理界面查看集群狀態(主節點): http://hdp-01:8080/

搭建Spark高可用集群

到此為止,Spark集群安裝完畢,但是有一個很大的問題,那就是Master節點存在單點故障,要解決此問題,就要借助zookeeper,并且啟動至少兩個Master節點來實現高可靠

配置Spark集群之前一定要把zookper集群啟動

Spark集群規劃:hdp-01,hdp-02是Master;hdp-03,hdp-04是Worker 安裝配置zk集群,并啟動zk集群 停止spark所有服務

集群中Master地址是不固定的 所以必須把export SPARK_MASTER_IP=hdp-01 注釋掉

[root@hdp-01 sbin]# ./stop-all.sh  [root@hdp-01 conf]# vi spark-env.sh    export JAVA_HOME=/root/apps/jdk1.8.0_152  #export SPARK_MASTER_IP=hdp-01  export SPARK_MASTER_PORT=7077  export SPARK_DAEMON_JAVA_OPTS="-Dspark.deploy.recoveryMode=ZOOKEEPER  -Dspark.deploy.zookeeper.url=hdp-01:2181,hdp-02:2181,hdp-03:2181 -Dspark.deploy.zookeeper.dir=/spark"    [root@hdp-01 conf]#scp -r spark-env.sh/ hdp-02:$PWD  [root@hdp-01 conf]#scp -r spark-env.sh/ hdp-03:$PWD  [root@hdp-01 conf]#scp -r spark-env.sh/ hdp-04:$PWD  [root@hdp-01 sbin]# ./start-all.sh
// 啟動hdp-02上的master,如果hdp-01宕機 hdp-02會有worker變為master
[root@hdp-02 spark]# sbin/start-master.sh

測試集群部署

打開瀏覽器  輸入        http://hdp-01:8080/  http://hdp-02:8080/

搭建Spark高可用集群

搭建Spark高可用集群

 standby:備用狀態

現在停掉hdp-01上的Master

[root@hdp-01 sbin]# jps  35473 Master  1682 NameNode  15109 NodeManager  35575 Jps  2200 SecondaryNameNode  14984 ResourceManager  14636 QuorumPeerMain  1839 DataNode  [root@hdp-01 sbin]# kill -9  35473

搭建Spark高可用集群

hdp-02接替hdp-01工作 從Master變為Worker  如果現在再啟動 hdp-01 hdp-01為從節點 不會變為主節點 

如果hdp-02發生故障后 hdp-01就會自動變成Master

Spark Shell

spark-shell是Spark自帶的交互式Shell程序,方便用戶進行交互式編程,用戶可以在該命令行下用scala編寫spark程序。

啟動spark shell

[root@hdp-01 spark]# bin/spark-shell --master spark:/hdp-01:7077 --executor-memory 1g --total-executor-cores 1

搭建Spark高可用集群

出現此logo證明spark shell 啟動成功

集群模式下啟動spark shell

[root@hdp-01 spark]# bin/spark-shell --master spark://hdp-01:7077,hdp-04:7077

注意: 如果啟動spark shell時沒有指定master地址,但是也可以正常啟動spark shell和執行spark shell中的程序,其實是啟動了spark的local模式,該模式僅在本機啟動一個進程,沒有與集群建立聯系。 Spark Shell中已經默認將SparkContext類初始化為對象sc。用戶代碼如果需要用到,則直接應用sc即可

Spark控制臺有一個Running Applications 也就是剛剛啟動的spark shell

 執行Spark程序

Spark程序求圓周率

[root@hdp-01 spark]# bin/spark-submit --master spark://hdp-01:7077 --class org.apache.spark.examples.SparkPi  --executor-memory 1G --total-executor-cores 1 examples/jars/spark-examples_2.11-2.2.0.jar 100

搭建Spark高可用集群

[root@hdp-01 spark]# bin/spark-submit –class org.apache.spark.examples.SparkPi –master spark://hdp-01:7077 examples/jars/spark-examples_2.11-2.2.0.jar 100

參數說明: –master spark://hdp-01:7077 指定Master的地址 –executor-memory 1G 指定每個worker可用內存為1G –total-executor-cores 1 指定整個集群使用的cup核數為1

集群模式執行spark程序

[root@hdp-01 spark]# bin/spark-submit --class org.apache.spark.examples.SparkPi --master spark://hdp-01:7077,hdp-04:7077 --executor-memory 1G --total-executor-cores 2 examples/jars/spark-examples_2.11-2.2.0.jar 100

spark shell中編寫WordCount程序

啟動hdfs 上傳單詞文件到hdfs中

[root@hdp-01 ~]# start-all.sh  [root@hdp-01 ~]# vi spark.txt    helo java  hello spark  hello hdfs  hello yarn  yarn hdfs    [root@hdp-01 ~]# hadoop fs -mkdir -p /spark  [root@hdp-01 ~]# hadoop fs -put spark.txt /spark

spark shell 執行任務

scala> sc.textFile("hdfs://hdp-01:9000/spark").flatMap(split(" ")).map((,1)).reduceByKey(+).collect

將結果輸出到hdfs中

scala> sc.textFile("hdfs://hdp-01:9000/spark").flatMap(.split(" ")).map((,1)).reduceByKey(+).saveAsTextFile("hdfs://hdp-01:9000/outText")  2019-06-25 Comments   

贊(0)
分享到: 更多 (0)
?
網站地圖   滬ICP備18035694號-2    滬公網安備31011702889846號
gmnon.cn-疯狂蹂躏欧美一区二区精品,欧美精品久久久久a,高清在线视频日韩欧美,日韩免费av一区二区
北条麻妃亚洲一区| 91日韩视频在线观看| 亚洲成人av免费看| 玩弄japan白嫩少妇hd| 精品一卡二卡三卡| 欧在线一二三四区| 中文字幕第38页| 国产精品探花在线播放| 一区二区三区日韩视频| 成人在线观看www| avav在线播放| 国产精彩免费视频| 亚洲理论中文字幕| 97在线国产视频| 妓院一钑片免看黄大片| 亚洲女人在线观看| 国产中文字幕二区| 欧美一级黄色影院| 国产日本欧美在线| 各处沟厕大尺度偷拍女厕嘘嘘| 亚洲成熟丰满熟妇高潮xxxxx| 久久久精品高清| 僵尸世界大战2 在线播放| 免费午夜视频在线观看| 日韩av片专区| 久久久性生活视频| 日日干夜夜操s8| 国产美女主播在线播放| 91色国产在线| 男人天堂新网址| 日韩在线一区视频| 日韩精品―中文字幕| 天堂av8在线| 国产视频九色蝌蚪| 糖心vlog在线免费观看| 久久久精品麻豆| 青青青青草视频| 污免费在线观看| 三级在线免费看| 激情伊人五月天| 国产91porn| 午夜xxxxx| 污污的视频免费| 精品久久久久久中文字幕2017| 欧美 亚洲 视频| 一区二区三区四区毛片| 农村妇女精品一二区| 久久久久久www| 国产免费内射又粗又爽密桃视频| 91制片厂毛片| 美女黄色片视频| 欧美女人性生活视频| 狠狠精品干练久久久无码中文字幕| 亚洲精品怡红院| 国产一级不卡毛片| 午夜视频在线瓜伦| 99热手机在线| 色www免费视频| 三级视频中文字幕| 亚洲色图久久久| 性欧美videossex精品| 韩国一区二区av| 午夜激情在线观看视频| 日韩一级免费在线观看| 999香蕉视频| 国产一区二区在线免费播放| 免费激情视频在线观看| www.日日操| 在线观看高清免费视频| 不卡中文字幕在线观看| 欧美日韩久久婷婷| 日本女人高潮视频| av在线免费观看国产| 亚洲国产精品无码av| 国模吧无码一区二区三区 | 中文字幕の友人北条麻妃| 中文字幕第50页| 欧美精品久久久久久久自慰| 国产午夜伦鲁鲁| 日本激情综合网| 不卡中文字幕在线| 日韩精品 欧美| 亚洲77777| 免费网站永久免费观看| 欧美牲交a欧美牲交aⅴ免费真 | 男人添女荫道口图片| 成熟老妇女视频| 91手机视频在线| www国产精品内射老熟女| 国产精品入口免费软件| 六月婷婷激情网| 男人揉女人奶房视频60分 | 91免费视频网站在线观看| 欧美婷婷精品激情| 日本五级黄色片| 污色网站在线观看| 成人免费毛片在线观看| gai在线观看免费高清| 91网站在线观看免费| 男女无套免费视频网站动漫| 黑人巨茎大战欧美白妇| 男人搞女人网站| 奇米影视亚洲色图| www亚洲国产| 国产小视频精品| 免费不卡av在线| 大片在线观看网站免费收看| 亚洲色精品三区二区一区| 欧美人与动牲交xxxxbbbb| 一本岛在线视频| 欧美a v在线播放| 日韩在线视频在线| 国产农村妇女精品久久| 成人免费在线观看视频网站| 国产极品尤物在线| av网站大全免费| 只有这里有精品| 99999精品| 中文字幕 欧美日韩| 三级a在线观看| 国产视频一区二区视频| 黄色片一级视频| a在线视频观看| 免费av手机在线观看| 草草视频在线免费观看| 欧美a级免费视频| 亚洲小说欧美另类激情| 干日本少妇视频| 日本道在线视频| av在线免费观看国产| www.国产在线视频| 国产乱子伦农村叉叉叉| 人妻精品无码一区二区三区 | 欧美交换配乱吟粗大25p| 日本一二三区视频在线| 午夜啪啪福利视频| 老子影院午夜伦不卡大全| 大伊香蕉精品视频在线| 3d动漫一区二区三区| 日本免费一级视频| 精品999在线| aaa一级黄色片| 欧美视频在线第一页| 亚洲中文字幕无码专区| 手机在线看福利| 中文字幕第66页| 男女日批视频在线观看| 国产一区二区视频免费在线观看 | 国产一级不卡毛片| 日韩中文字幕a| 高清无码视频直接看| 亚洲人精品午夜射精日韩| 国产情侣av自拍| 国内外成人激情免费视频| 国产九色porny| 午夜激情av在线| 日本香蕉视频在线观看| 国产免费视频传媒| 黄色a级三级三级三级| 免费看日本毛片| 亚洲欧美偷拍另类| 成年人网站国产| 久久久精品高清| 欧美韩国日本在线| 国产成人亚洲综合无码| 日本精品一区在线观看| 日本一区二区免费高清视频| 欧美 丝袜 自拍 制服 另类| 欧美视频亚洲图片| 国产真实乱子伦| 国产玉足脚交久久欧美| 九九热视频免费| 国产视频手机在线播放| 精品国偷自产一区二区三区| 亚洲一级片av| 久久久国产欧美| 欧美s码亚洲码精品m码| 久久久久久久久久久久久国产| 美女一区二区三区视频| 日韩欧美一区三区| 国产女主播av| 波多野结衣激情| 日本成人xxx| 欧美性受xxxx黒人xyx性爽| 欧美日韩大尺度| 欧美黄色免费影院| 日韩免费一级视频| 97国产精东麻豆人妻电影| www.激情网| 亚洲精品国产suv一区88| 精品一区二区成人免费视频| 欧美成人乱码一二三四区免费| 国产精品欧美激情在线观看| 精品无码国模私拍视频| www.亚洲视频.com| 久久久久久免费看| 国产 日韩 亚洲 欧美| 精品久久一二三| 亚洲色成人一区二区三区小说| www..com日韩|