欧美一区2区三区4区公司二百,国产精品婷婷午夜在线观看,自拍偷拍亚洲精品,国产美女诱惑一区二区

Storm簡介

1.2 特性

  • Storm是一個分布式實時流式計算平臺。主要特性如下:
  • 簡單的編程模型:類似于MapReduce降低了并行批處理復(fù)雜性,Storm降低了實時處理的復(fù)雜性,只需實現(xiàn)幾個接口即可(Spout實現(xiàn)ISpout接口,Bolt實現(xiàn)IBolt接口)。
  • 支持多種語言:你可以在Storm之上使用各種編程語言。默認支持Clojure、Java、Ruby和Python。要增加對其他語言的支持,只需實現(xiàn)一個簡單的Storm通信協(xié)議即可。
  • 容錯性:nimbus、supervisor都是無狀態(tài)的, 可以用kill -9來殺死Nimbus和Supervisor進程, 然后再重啟它們,任務(wù)照常進行; 當(dāng)worker失敗后, supervisor會嘗試在本機重啟它。
  • 分布式:計算是在多個線程、進程和服務(wù)器之間并行進行的。
  • 持久性、可靠性:消息被持久化到本地磁盤,并且支持數(shù)據(jù)備份防止數(shù)據(jù)丟失。
  • 可靠的消息處理:Storm保證每個消息至少能得到一次完整處理。任務(wù)失敗時,它會負責(zé)從消息源重試消息(ack機制)。
  • 快速、實時:Storm保證每個消息能能得到快速的處理。

1.3 與常用其他大數(shù)據(jù)計算平臺對比

  • Storm vs. MapReduce Storm的一個拓撲常駐內(nèi)存運行,MR作業(yè)運行完了進行就被kill了;storm是流式處理,MR是批處理;Storm數(shù)據(jù)在內(nèi)存中不寫磁盤,而MR會與磁盤進行交互;Storm的DAG(有向無環(huán)圖)模型可以組合多個階段,而MR只可以有MAP和REDUCE兩個階段。

    ?

2. Storm的核心組件

2.1 拓撲結(jié)構(gòu)

  • topology 是storm中運行的一個實時應(yīng)用程序的名稱(拓撲),因為各個組件間的消息流動而形成邏輯上的拓撲結(jié)構(gòu)。

  • Strom在運行中可分為spout與bolt兩個組件,其中,數(shù)據(jù)源從spout開始,數(shù)據(jù)以tuple的方式發(fā)送到bolt,多個bolt可以串連起來,一個bolt也可以接入多個spot/bolt。運行時Topology如下圖:

    ?

2.2 編程模型的一些基本概念

2.2.1 Tuple

  • stream 表示數(shù)據(jù)的流向,流式Storm的核心抽象。一個流是一個無界Tuple序列,Tuple可以包含整性、長整型、短整型、字節(jié)、字符、雙精度數(shù)、浮點數(shù)、布爾值和字節(jié)數(shù)組。用戶可以通過定義序列化器,在本機Tuple使用自定義類型;

2.2.2 Spout組件

  • spout 在一個topology中獲取源數(shù)據(jù)流的組件,通常情況下spout會從外部數(shù)據(jù)源讀取數(shù)據(jù),然后轉(zhuǎn)換為topology內(nèi)部的源數(shù)據(jù);

2.2.3 Bolt組件

  • bolt 接收數(shù)據(jù),然后執(zhí)行處理的組件,用戶可以其中執(zhí)行自己想要的操作(Bolt可以完成過濾、業(yè)務(wù)處理、連接運算、連接訪問數(shù)據(jù)庫等業(yè)務(wù)

  • 核心方法
  • prepare:初始化
    execute:處理一個tuple暑假,tuple對象中包含了元數(shù)據(jù)信息
    cleanup:shutdown之前的資源清理操作

    stream grouping(流分組) 流分組是拓撲定義的一部分,為每個Bolt指定應(yīng)該接收哪個流作為輸入。在bolt的任務(wù)中定義流應(yīng)該如何分區(qū),Storm有7個內(nèi)置的流分組接口(隨機分組(Shuffle grouping)、字段分組(Fields grouping)、全部分組(All grouping)、全局分組(Global grouping)、無分組(None grouping)、直接分組(Direct grouping)、本地或隨機分組(Local or shuffle grouping))

2.2.4 Stream grouping組件

  • stream grouping(流分組) 流分組是拓撲定義的一部分,為每個Bolt指定應(yīng)該接收哪個流作為輸入。在bolt的任務(wù)中定義流應(yīng)該如何分區(qū),Storm有7個內(nèi)置的流分組接口(隨機分組(Shuffle grouping)、字段分組(Fields grouping)、全部分組(All grouping)、全局分組(Global grouping)、無分組(None grouping)、直接分組(Direct grouping)、本地或隨機分組(Local or shuffle grouping))

    ?

文章鏈接: http://www.qzkangyuan.com/14243.html

文章標(biāo)題:Storm簡介

文章版權(quán):夢飛科技所發(fā)布的內(nèi)容,部分為原創(chuàng)文章,轉(zhuǎn)載請注明來源,網(wǎng)絡(luò)轉(zhuǎn)載文章如有侵權(quán)請聯(lián)系我們!

聲明:本站所有文章,如無特殊說明或標(biāo)注,均為本站原創(chuàng)發(fā)布。任何個人或組織,在未征得本站同意時,禁止復(fù)制、盜用、采集、發(fā)布本站內(nèi)容到任何網(wǎng)站、書籍等各類媒體平臺。如若本站內(nèi)容侵犯了原著者的合法權(quán)益,可聯(lián)系我們進行處理。

給TA打賞
共{{data.count}}人
人已打賞
建站教程投稿分享

搭建Discuz論壇示例

2022-12-9 14:21:17

建站教程投稿分享

云服務(wù)器包含的組件

2022-12-12 20:58:32

0 條回復(fù) A文章作者 M管理員
    暫無討論,說說你的看法吧
?
個人中心
購物車
優(yōu)惠劵
今日簽到
有新私信 私信列表
搜索
主站蜘蛛池模板: 洛浦县| 新营市| 枣强县| 云霄县| 卢氏县| 新沂市| 洛川县| 甘德县| 崇明县| 小金县| 寿阳县| 石景山区| 南郑县| 易门县| 达日县| 章丘市| 黄石市| 汉中市| 北川| 塘沽区| 朔州市| 宁南县| 海淀区| 衢州市| 弥渡县| 水城县| 明水县| 天台县| 玉门市| 遂溪县| 昌邑市| 贺州市| 东乡| 仲巴县| 亚东县| 安远县| 洛南县| 吉木萨尔县| 尚志市| 临江市| 东光县|