我的演講題目是關于運維如何從堆積如山的日常工作中解放出來。
我是高效運維的發起人,開放運維聯盟和可信云一樣,我們都是屬于數據中心聯盟底下的組織,作為我們而言是掛靠的關系,我是高效運維社區以及GOPS發起人,同時也是DevOpsDays中國聯合發起人。我自己本人2004年開始一直在做這個行業,目前已經創業,做運維社區以及DevOps的事情。我這邊和我的朋友們一起做了一些運維的。前兩天剛好是第二個724運維日,騰訊游戲等很多公司都有很多活動。我也是國內第一個DevOps Master。高效運維社區是國內最大的垂直運維社區,致力于運維的DevOps轉型。我們的公眾號在一年的時間有188萬人次的訪問,這也是我們感到比較自豪的。最近的兩個活動,一個是728 GOPS全球運維大會·北京站,還有818 DevOpsDays上海站。
運維怎么從堆積如山的日常工作中把自己釋放出來,傳統有三招,在這三招之外還有第四招。先看一下傳統三招,第一招是自動化,自動化的實現有很多途徑,可以你自己去找幾個人,自己去做一個自動化,自己去做一些研發的產品。第二你也可以去買現成的商業級的產品,還有一個,你可以既不是買也不是開發,你可以去騰訊藍鯨,用他們的社區版去做很多上層的建設。運維自動化只能解決部分的問題,第二招是招人,能夠緩解很多壓力,但是招人也比較難。第三招是走人。
對于我們而言,還一個路子,這個路子實際上二十年前就有了,但是我們運維局限在自己的視野里,把很多事情忽略掉了,今天可以把這個事情撿起來看一下。我們自己只有兩只眼睛和兩只手指,運維很多時候的問題在底下,你會同時一天做了十件二十件工作。我們是沒辦法去判斷到底是真的重要緊急還是假的重要緊急,它在公司產生的價值有多大,所以很多時候決定我們在一個時間點做什么,決定誰最著急。這里就會有很多問題。當我們一天要面對很多并發的時候,這個時候我們怎么做一些這樣的優化。這個議題比較有意思,跟我們平時技術的問題關系不是很大。橫坐標如果說是同時并發的數量,縱坐標是這兩個的時間。第一個時間是灰色的,表示我們在每一個項目或者每一個任務上我們的工作時間,或者說有效時間。另外一個是紅色的,因為我們進行一個上下文的切換所導致的丟失的時間。或者簡單說,灰色是代表有效時間,紅色代表務要時間。看一下示意圖,具體情況跟這個不太一樣,如果說我們在這個時刻只是做一件事情,那很明顯,有100%時間都是有效時間。如果我們是同時做兩件事情,這個時候的情況就會不一樣,有效時間這個只是40%,新加坡云主機 香港云主機,另外無效時間是20%。有人會問,加起來不是100%,這個值加起來是100%,因為我們的這個值是說有一個任務的時間,因為你現在是有變化兩個任務,2x40%再加上20%。如果有三個并發,這個時候丟失的時間或者無效時間就是有40%了,如果同時去做5個任務,這個時候實際上我們的無效時間可能達到80%。一天工作8小時,你覺得一個公司能夠創造價值的工作時間是多久,會有4、5個小時嗎,沒有,實際上也就是2、3個小時。怎么把并發的事情去做些優化,怎么能夠讓我們的日常工作做一些簡化或者價值的體現,我們可以這樣來看一下。今天時間有限,實際上我講的是怎么用精益看板來對我們工作進行優化,以及讓我們工作的價值更好的體現出來。
這不是我們獨創的,是由一個德國人創造出來的,我們看看他的玩法。這里是一個小游戲的形式,精益看板一日游。最左側是需求,ABCDEFG,最往前面的肯定是最緊急的,第一步很重要,第一步的價值是告訴我們,到底哪些事情要先做,哪些事情要后做,需要排序。以前我們排序往往是無序的排序。第二列是預備分檢階段。第三個是開發,第四個是測試以及發布。這個時候在底下,開發有2個團隊,測試1個團隊。什么時候效率是最高的,當這個團隊一次只做一件事情的時候,2-2-1是說容量,或者說對于一個團隊而言,最多他們只能同時做兩件事情,這個時候只有一個測試團隊。案例是一個需求,是一個案例開發運維的階段,我還要再補充一點,目前為止,這是一個通用的,對于我們運維而言,很多事情是一個非計劃性的工作,這個事情我們可以新增1個,分配一些人力。目前是這里面的第一頁,剛剛開始的節奏。這個人是PO或者叫項目經理,他一看,分檢這里面是2,最大可以做2個,一開始是0,他就可以把這兩個任務挪過去了。因為我們有2個開發團隊,做任務分解,比如團隊1做A,團隊2做。團隊1和2效率不一樣,這時候可能團隊1把A已經做完了,這個時候這個團隊看到有任務放到“完成”的階段,這個時候他就可以把A由“完成”的狀態拿到“測試”里面去。但是會有意外發生,測試團隊發生A不能部署,這時候團隊2剛好把B做完了,這個時候我問大家,你覺得這個時候團隊2應該去做什么。首先作為團隊2而言,他不應該去D,這個時候2已經是最高限了,這個時候如果去做D,那意味著是3了。所以他可以一起去修A。因為團隊2和團隊1一樣,都是開發團隊,而且他們可能是有一個關系關聯的,這個時候他們的語言是一致的。因為這個里面的限制,這個時候可能會有人幫忙。