gmnon.cn-疯狂蹂躏欧美一区二区精品,欧美精品久久久久a,高清在线视频日韩欧美,日韩免费av一区二区

站長資訊網
最全最豐富的資訊網站

Flink開發IDEA環境搭建與測試

一.IDEA開發環境

1.pom文件設置

    <properties>          <maven.compiler.source>1.8</maven.compiler.source>          <maven.compiler.target>1.8</maven.compiler.target>          <encoding>UTF-8</encoding>          <scala.version>2.11.12</scala.version>          <scala.binary.version>2.11</scala.binary.version>          <Hadoop.version>2.7.6</hadoop.version>          <flink.version>1.6.1</flink.version>      </properties>      <dependencies>          <dependency>              <groupId>org.scala-lang</groupId>              <artifactId>scala-library</artifactId>              <version>${scala.version}</version>          </dependency>          <dependency>              <groupId>org.apache.flink</groupId>              <artifactId>flink-java</artifactId>              <version>${flink.version}</version>          </dependency>          <dependency>              <groupId>org.apache.flink</groupId>              <artifactId>flink-streaming-java_${scala.binary.version}</artifactId>              <version>${flink.version}</version>          </dependency>          <dependency>              <groupId>org.apache.flink</groupId>              <artifactId>flink-scala_${scala.binary.version}</artifactId>              <version>${flink.version}</version>          </dependency>          <dependency>              <groupId>org.apache.flink</groupId>              <artifactId>flink-streaming-scala_${scala.binary.version}</artifactId>              <version>${flink.version}</version>          </dependency>          <dependency>              <groupId>org.apache.flink</groupId>              <artifactId>flink-table_${scala.binary.version}</artifactId>              <version>${flink.version}</version>          </dependency>          <dependency>              <groupId>org.apache.flink</groupId>              <artifactId>flink-clients_${scala.binary.version}</artifactId>              <version>${flink.version}</version>          </dependency>          <dependency>              <groupId>org.apache.flink</groupId>              <artifactId>flink-connector-kafka-0.10_${scala.binary.version}</artifactId>              <version>${flink.version}</version>          </dependency>          <dependency>              <groupId>org.apache.hadoop</groupId>              <artifactId>hadoop-client</artifactId>              <version>${hadoop.version}</version>          </dependency>          <dependency>              <groupId>mysql</groupId>              <artifactId>mysql-connector-java</artifactId>              <version>5.1.38</version>          </dependency>          <dependency>              <groupId>com.alibaba</groupId>              <artifactId>fastjson</artifactId>              <version>1.2.22</version>          </dependency>      </dependencies>      <build>          <sourceDirectory>src/main/scala</sourceDirectory>          <testSourceDirectory>src/test/scala</testSourceDirectory>          <plugins>              <plugin>                  <groupId>net.alchim31.maven</groupId>                  <artifactId>scala-maven-plugin</artifactId>                  <version>3.2.0</version>                  <executions>                      <execution>                          <goals>                              <goal>compile</goal>                              <goal>testCompile</goal>                          </goals>                          <configuration>                              <args>                                  <!-- <arg>-make:transitive</arg> -->                                  <arg>-dependencyfile</arg>                                  <arg>${project.build.directory}/.scala_dependencies</arg>                              </args>                          </configuration>                      </execution>                  </executions>              </plugin>              <plugin>                  <groupId>org.apache.maven.plugins</groupId>                  <artifactId>maven-surefire-plugin</artifactId>                  <version>2.18.1</version>                  <configuration>                      <useFile>false</useFile>                      <disableXmlReport>true</disableXmlReport>                      <includes>                          <include>**/*Test.*</include>                          <include>**/*Suite.*</include>                      </includes>                  </configuration>              </plugin>              <plugin>                  <groupId>org.apache.maven.plugins</groupId>                  <artifactId>maven-shade-plugin</artifactId>                  <version>3.0.0</version>                  <executions>                      <execution>                          <phase>package</phase>                          <goals>                              <goal>shade</goal>                          </goals>                          <configuration>                              <filters>                                  <filter>                                      <artifact>*:*</artifact>                                      <excludes>                                          <exclude>META-INF/*.SF</exclude>                                          <exclude>META-INF/*.DSA</exclude>                                          <exclude>META-INF/*.RSA</exclude>                                      </excludes>                                  </filter>                              </filters>                              <transformers>                                  <transformer implementation="org.apache.maven.plugins.shade.resource.ManifestResourceTransformer">                                      <mainClass>org.apache.spark.WordCount</mainClass>                                  </transformer>                              </transformers>                          </configuration>                      </execution>                  </executions>              </plugin>          </plugins>      </build>

2.flink開發流程

Flink具有特殊類DataSetDataStream在程序中表示數據。您可以將它們視為可以包含重復項的不可變數據集合。DataSet數據有限的情況下,對于一個DataStream元素的數量可以是無界的。

這些集合在某些關鍵方面與常規Java集合不同。首先,它們是不可變的,這意味著一旦創建它們就無法添加或刪除元素。你也不能簡單地檢查里面的元素。

集合最初通過在弗林克程序添加源創建和新的集合從這些通過將它們使用API方法如衍生mapfilter等等。

Flink程序看起來像是轉換數據集合的常規程序。每個程序包含相同的基本部分:

1.獲取execution environment,

final StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();

2.加載/創建初始化數據

DataStream<String> text = env.readTextFile("file:///path/to/file");

3.指定此數據的轉換

val mapped = input.map { x => x.toInt }

4.指定放置計算結果的位置

writeAsText(String path)

print()

5.觸發程序執行

在local模式下執行程序

execute()

將程序達成jar運行在線上

./bin/flink run

-m node21:8081

./examples/batch/WordCount.jar

–input  hdfs:///user/admin/input/wc.txt 

–output  hdfs:///user/admin/output2 

二. Wordcount案例

1.Scala代碼

package com.xyg.streaming    import org.apache.flink.api.java.utils.ParameterTool  import org.apache.flink.streaming.api.scala.StreamExecutionEnvironment  import org.apache.flink.streaming.api.windowing.time.Time  /**    * Author: Mr.Deng    * Date: 2018/10/15    * Desc:    */ object SocketWindowWordCountScala {    def main(args: Array[String]) : Unit = {      // 定義一個數據類型保存單詞出現的次數 case class WordWithCount(word: String, count: Long)      // port 表示需要連接的端口      val port: Int = try {        ParameterTool.fromArgs(args).getInt("port")      } catch {        case e: Exception => {          System.err.println("No port specified. Please run 'SocketWindowWordCount --port <port>'")          return        }      }      // 獲取運行環境      val env: StreamExecutionEnvironment = StreamExecutionEnvironment.getExecutionEnvironment      // 連接此socket獲取輸入數據      val text = env.socketTextStream("node21", port, 'n')      //需要加上這一行隱式轉換 否則在調用flatmap方法的時候會報錯     import org.apache.flink.api.scala._      // 解析數據, 分組, 窗口化, 并且聚合求SUM      val windowCounts = text        .flatMap { w => w.split("\s") }        .map { w => WordWithCount(w, 1) }        .keyBy("word")        .timeWindow(Time.seconds(5), Time.seconds(1))        .sum("count")      // 打印輸出并設置使用一個并行度      windowCounts.print().setParallelism(1)      env.execute("Socket Window WordCount")    }  }

2.Java代碼

package com.xyg.streaming;    import org.apache.flink.api.common.functions.FlatMapFunction;  import org.apache.flink.api.java.utils.ParameterTool;  import org.apache.flink.streaming.api.datastream.DataStream;  import org.apache.flink.streaming.api.datastream.DataStreamSource;  import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;  import org.apache.flink.streaming.api.windowing.time.Time;  import org.apache.flink.util.Collector;    /**   * Author: Mr.Deng   * Date: 2018/10/15   * Desc: 使用flink對指定窗口內的數據進行實時統計,最終把結果打印出來   *       先在node21機器上執行nc -l 9000   */ public class StreamingWindowWordCountJava {      public static void main(String[] args) throws Exception {      //定義socket的端口號 int port;      try{          ParameterTool parameterTool = ParameterTool.fromArgs(args);          port = parameterTool.getInt("port");      }catch (Exception e){          System.err.println("沒有指定port參數,使用默認值9000");          port = 9000;      }      //獲取運行環境      StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();      //連接socket獲取輸入的數據      DataStreamSource<String> text = env.socketTextStream("node21", port, "n");      //計算數據      DataStream<WordWithCount> windowCount = text.flatMap(new FlatMapFunction<String, WordWithCount>() {          public void flatMap(String value, Collector<WordWithCount> out) throws Exception {              String[] splits = value.split("\s");              for (String word:splits) {                  out.collect(new WordWithCount(word,1L));              }          }      })//打平操作,把每行的單詞轉為<word,count>類型的數據              //針對相同的word數據進行分組              .keyBy("word")              //指定計算數據的窗口大小和滑動窗口大小              .timeWindow(Time.seconds(2),Time.seconds(1))              .sum("count");      //把數據打印到控制臺,使用一個并行度      windowCount.print().setParallelism(1);      //注意:因為flink是懶加載的,所以必須調用execute方法,上面的代碼才會執行      env.execute("streaming word count");  }        /**       * 主要為了存儲單詞以及單詞出現的次數       */ public static class WordWithCount{          public String word;          public long count;          public WordWithCount(){}          public WordWithCount(String word, long count) {              this.word = word;              this.count = count;          }            @Override          public String toString() {              return "WordWithCount{" +                      "word='" + word + ''' +                      ", count=" + count +                      '}';          }      }    }

3.運行測試

首先,使用nc命令啟動一個本地監聽,命令是:

[admin@node21 ~]$ nc -l 9000

通過netstat命令觀察9000端口。 netstat -anlp | grep 9000,啟動監聽如果報錯:-bash: nc: command not found,請先安裝nc,在線安裝命令:yum -y install nc

然后,IDEA上運行flink官方案例程序

node21上輸入

Flink開發IDEA環境搭建與測試

IDEA控制臺輸出如下

Flink開發IDEA環境搭建與測試

4.集群測試

這里單機測試官方案例

[admin@node21 flink-1.6.1]$ pwd  /opt/flink-1.6.1  [admin@node21 flink-1.6.1]$ ./bin/start-cluster.sh   Starting cluster.  Starting standalonesession daemon on host node21.  Starting taskexecutor daemon on host node21.  [admin@node21 flink-1.6.1]$ jps  2100 StandaloneSessionClusterEntrypoint  2518 TaskManagerRunner  2584 Jps  [admin@node21 flink-1.6.1]$ ./bin/flink run examples/streaming/SocketWindowWordCount.jar --port 9000

程序連接到套接字并等待輸入。您可以檢查Web界面以驗證作業是否按預期運行:

Flink開發IDEA環境搭建與測試

Flink開發IDEA環境搭建與測試

單詞在5秒的時間窗口(處理時間,翻滾窗口)中計算并打印到stdout監視TaskManager的輸出文件并寫入一些文本nc(輸入在點擊后逐行發送到Flink):

Flink開發IDEA環境搭建與測試

Flink開發IDEA環境搭建與測試

三. 使用IDEA開發離線程序

Dataset是flink的常用程序,數據集通過source進行初始化,例如讀取文件或者序列化集合,然后通過transformation(filtering、mapping、joining、grouping)將數據集轉成,然后通過sink進行存儲,既可以寫入hdfs這種分布式文件系統,也可以打印控制臺,flink可以有很多種運行方式,如local、flink集群、yarn等.

1. scala程序

package com.xyg.batch    import org.apache.flink.api.scala.ExecutionEnvironment  import org.apache.flink.api.scala._    /**    * Author: Mr.Deng    * Date: 2018/10/19    * Desc:    */ object WordCountScala{    def main(args: Array[String]) {      //初始化環境      val env = ExecutionEnvironment.getExecutionEnvironment      //從字符串中加載數據      val text = env.fromElements(        "Who's there?",        "I think I hear them. Stand, ho! Who's there?")      //分割字符串、匯總tuple、按照key進行分組、統計分組后word個數      val counts = text.flatMap { _.toLowerCase.split("\W+") filter { _.nonEmpty } }        .map { (_, 1) }        .groupBy(0)        .sum(1)      //打印     counts.print()    }  }

2. java程序

package com.xyg.batch;    import org.apache.flink.api.common.functions.FlatMapFunction;  import org.apache.flink.api.java.DataSet;  import org.apache.flink.api.java.ExecutionEnvironment;  import org.apache.flink.api.java.tuple.Tuple2;  import org.apache.flink.util.Collector;    /**   * Author: Mr.Deng   * Date: 2018/10/19   * Desc:   */ public class WordCountJava {      public static void main(String[] args) throws Exception {          //構建環境          final ExecutionEnvironment env = ExecutionEnvironment.getExecutionEnvironment();          //通過字符串構建數據集          DataSet<String> text = env.fromElements(                  "Who's there?",                  "I think I hear them. Stand, ho! Who's there?");          //分割字符串、按照key進行分組、統計相同的key個數          DataSet<Tuple2<String, Integer>> wordCounts = text                  .flatMap(new LineSplitter())                  .groupBy(0)                  .sum(1);          //打印         wordCounts.print();      }      //分割字符串的方法 public static class LineSplitter implements FlatMapFunction<String, Tuple2<String, Integer>> {          @Override          public void flatMap(String line, Collector<Tuple2<String, Integer>> out) {              for (String word : line.split(" ")) {                  out.collect(new Tuple2<String, Integer>(word, 1));              }          }      }  }

3.運行

Flink開發IDEA環境搭建與測試

贊(0)
分享到: 更多 (0)
?
網站地圖   滬ICP備18035694號-2    滬公網安備31011702889846號
gmnon.cn-疯狂蹂躏欧美一区二区精品,欧美精品久久久久a,高清在线视频日韩欧美,日韩免费av一区二区
国产四区在线观看| 男人添女人下面免费视频| 奇米影视四色在线| 91制片厂毛片| 中文字幕资源在线观看| 久艹视频在线免费观看| 18禁裸男晨勃露j毛免费观看| 男人天堂新网址| 999热精品视频| 8x8x最新地址| mm131午夜| 亚洲第一天堂久久| 欧美日韩黄色一级片| av免费中文字幕| 欧美 国产 精品| 国产精品视频中文字幕| 欧美xxxxxbbbbb| 国产精品入口免费软件| 欧美亚洲国产成人| 800av在线免费观看| 日本黄xxxxxxxxx100| 午夜不卡福利视频| 国产成人美女视频| 国产永久免费网站| 色乱码一区二区三区在线| 成人一区二区三| 蜜臀视频一区二区三区| 一本久道中文无码字幕av| 久久久噜噜噜www成人网| 青青青在线播放| 亚洲人辣妹窥探嘘嘘| 在线免费观看av的网站| 日本黄色福利视频| 亚洲综合123| 免费成人深夜夜行网站视频| 特大黑人娇小亚洲女mp4| 国产又粗又猛又爽又黄的网站| 黄色网在线视频| 日韩国产欧美亚洲| 污网站免费在线| 手机看片日韩国产| 欧洲黄色一级视频| 激情六月丁香婷婷| 天堂在线精品视频| 给我免费播放片在线观看| chinese少妇国语对白| 91视频这里只有精品| 国产三级中文字幕| 免费在线激情视频| 吴梦梦av在线| 日本中文字幕片| 午夜探花在线观看| 91传媒久久久| 久久精品国产露脸对白| 九一免费在线观看| 久久午夜夜伦鲁鲁一区二区| 又色又爽又黄视频| 无码人妻丰满熟妇区五十路百度| www.色偷偷.com| 99久久久精品视频| 在线观看免费不卡av| 国产美女在线一区| www.com久久久| 成人免费观看毛片| www.18av.com| 三上悠亚在线一区| av动漫在线看| 香蕉视频在线网址| 一本岛在线视频| 99视频在线免费播放| 黄色a级三级三级三级| 国产1区2区在线| 每日在线观看av| 91麻豆天美传媒在线| 久久久久久久久久一区二区| 日韩在线综合网| 国产精品视频一二三四区| 色噜噜狠狠一区二区| 免费高清在线观看免费| 国产精品一线二线三线| 日韩不卡一二区| 999热精品视频| 一区二区三区欧美精品| 杨幂毛片午夜性生毛片| 欧美牲交a欧美牲交aⅴ免费真 | 嫩草av久久伊人妇女超级a| 国产精品一色哟哟| 神马午夜伦理影院| 国产日韩第一页| 自拍偷拍视频在线| 香蕉视频在线网址| 91大神免费观看| av不卡在线免费观看| 天天做天天干天天操| 一本一道久久a久久综合蜜桃| 动漫av网站免费观看| 国产成人精品视频免费看| 拔插拔插海外华人免费| 霍思燕三级露全乳照| 人人妻人人做人人爽| 久久这里只有精品23| 黄色大片中文字幕| 黄色动漫在线免费看| 日本成年人网址| 99视频在线免费| 日日躁夜夜躁aaaabbbb| 91看片在线免费观看| 亚洲精品mv在线观看| 波多野结衣免费观看| 欧美国产日韩在线视频| japanese在线播放| 男人的天堂狠狠干| av无码精品一区二区三区| 国产九九在线视频| 午夜影院免费观看视频| 欧美黄色免费网址| 欧美日韩黄色一级片| 天天干天天干天天干天天干天天干| 丁香婷婷激情网| 免费在线观看污污视频| 欧妇女乱妇女乱视频| av观看免费在线| 欧美成人手机在线视频| 男人j进女人j| 国产av天堂无码一区二区三区| 日本三区在线观看| 日韩最新中文字幕| 日本在线观看a| 亚洲免费视频播放| 成年人网站大全| 在线观看18视频网站| 国内外成人免费激情视频| 成人av毛片在线观看| 九色自拍视频在线观看| 91女神在线观看| 日韩在线一级片| 7777在线视频| 手机视频在线观看| 奇米影视亚洲色图| 26uuu成人| 国产精品人人爽人人爽| 黄色一级片国产| 亚洲欧美国产中文| 人妻少妇被粗大爽9797pw| 91免费网站视频| 99视频在线视频| 亚洲中文字幕无码专区| 亚洲热在线视频| 日韩av片网站| 国产成人黄色片| 国产夫妻自拍一区| 精品91一区二区三区| 三上悠亚在线一区二区| 国产亚洲欧美在线视频| 男人天堂a在线| 欧美日韩午夜爽爽| 91网址在线观看精品| 午夜久久久精品| www.99在线| 毛葺葺老太做受视频| 日本一道本久久| 浮妇高潮喷白浆视频| 国产精品成人久久电影| 艳母动漫在线观看| 青少年xxxxx性开放hg| 日本不卡一区在线| 污污的视频免费| 中文字幕视频三区| 天天影视色综合| 中文字幕日韩综合| 国产乱叫456| 北条麻妃亚洲一区| 亚洲区成人777777精品| 久久福利一区二区| 精品国产av无码一区二区三区 | 午夜久久久久久久久久久| 成人手机视频在线| 玖玖精品在线视频| 青青在线免费观看| 成人一区二区免费视频| av免费中文字幕| 久久久久国产一区| 婷婷激情综合五月天| 亚洲一级片免费观看| 在线观看17c| 波多野结衣家庭教师在线播放| 日韩av三级在线| 一区二区三区入口| 日韩精品视频一二三| 国产日本欧美在线| 99国产精品白浆在线观看免费| 人妻激情另类乱人伦人妻| 乱妇乱女熟妇熟女网站| 深夜黄色小视频| 小泽玛利亚av在线| 精品免费国产一区二区| 欧美成人三级在线播放| 欧美人成在线观看| www.夜夜爽| 人妻少妇精品无码专区二区|