我的分享就到這,謝謝大家!
邊緣計算,這是百度在接入層面上一個基礎的布局和規劃,發生計算的核心點仍然是在云數據中心內部,但是它距離我們終端使用的用戶可能會比較遠,我們認為它的延時在10-50ms,這是我們能承受的上線。再到5G時代和MEC,我們能夠和客戶、用戶更近,在MEC的節點上我們能做到2-10ms,MEC再往上,物聯網層面上我們能做到2ms,2ms、10ms、50ms,這是百度對于整個用戶或者應用接入的一個延時上的分段,不同的延時段上我們會有不同的資源提供的和網絡接入的方案。我們也相信在5G時代邊緣計算到來,越來越多的場景需要低延時的通信,需要在本地發生計算,包括智能交通、智能制造、智能家居,這些給我們在網絡延時上又提出來更高的要求,我們在接下來會大力推廣OTE邊緣計算整體框架,當我們成熟之后也會把它開源出來。
今天的主題叫“AI新時代DC新征程”,百度其實是在中國各大互聯網公司里最早在AI上發力的,我們在AI這個領域取得了非常大的成績。AI對于更加底層的基礎設施、數據中心、服務器、網絡也提出來了對以前并不一樣的一些要求。下面跟大家分享一下我們在AI時代里整個百度在數據中心領域新的思考。
10月16日,2018年開放數據峰會(Open Data Center Summit 2018)于上午在北京國際會議中心開幕。作為數據中心行業的一大盛事,ODCC每年都將匯聚數千名數據中心專家與幾十名主流媒體。本屆峰會時間為16日-17日,ODCC將發布最新研究成果,碰撞尖端熱點技術,分享國際技術進展,展示主流產品應用。
AI驅動計算,左邊是百度AI計算系統,在AI時代的計算,百度從芯片層面一直到最往上的推進引擎,以及training的框架,還有很多AI算法的能力在上面,芯片層面,我們不只支持CPU、GPU、FPGA這樣的加速器,我們也會做定制化,定制我們自己的昆侖芯片。另外和我們的伙伴,諸如像寒武紀、海思都有深入合作。目前在系統設計上做了X-Man1.0/2.0/3.0,包括一體機,再往上是互聯層面,PCI-E,包括支持NVLINK,加速器到加速器之間的連接等等,支撐計算加速。再往上是Training Platform,再往上是inference Engine。我們在AI計算上,百度從最底層或最基層的芯片,一直到我們上的框架、引擎,我們提供一個端到端的系統,這個端到端的系統我們的設計之初符合右邊,我們相信要軟硬件結合,我們會有大量多元化的芯片,我們要使用加速系統更好的去加速,做的是軟硬結合的一體方案,全是面向應用來定義的。
在開幕式上,來自百度系統部執行總監侯震宇進行精彩演講。以下為演講實錄:
AI對于計算有新的需求,AI的業務需求也有所不同,整個業務需求對我們數據中心有一些新的挑戰,在數據量上,這一輪以深度學習為代表的人工智能,更多是通過大數據、大規模的數據量激發出來的,在數據規模上遠遠提升了一個數量級。在百度內部來說,我們有萬億級搜索數據,有百億級地圖定位的數據,地圖定位也代表了人生活的軌跡,還有百億級多媒體信息,圖像、視頻等信息。對存儲的要求非常高對,算力上的要求也是非常高的,在2017年到2020年整個計算力的要求會是數量級的增長。算力不僅是基于CPU的通用計算,還有異構性計算,神經網絡,包括我們基礎的數十萬臺的服務器。這是我們整個數據中心的規模,會有數量級的提升,它對網絡的延時會有大幅度的下降,預估到2020年整個數據中心差不多應該有90%的延時的提升,這依賴于5G時代的發展。另外也和ODCC相關,我們在整個生態上,開源計算AI的計算框架,包括一些更加基礎的ABC的基礎體系這種開源的東西也越來越多。
數據中心在我們看來有這么幾個新的趨勢,一個是數據中心本身,我們會逐步朝著更大規模、更低成本上去走,但是我們也會考慮到數據中心規模和數據中心選址上的分散與集中的這種權衡。另外,包括剛才頒獎我們也都看到,異構計算帶來的高功率、高密度,摩爾定律已經發展到一定瓶頸,它的功率會越來越高,我們的服務器包括在數據中心內部的功率密度都會大幅度提升,這是我們能看到在數據中心側的一個比較大的變化。另外在計算和存儲這邊,高性能計算,包括多元芯片、GPU、ASIC等這些在接下來會有飛速的發展。另外是新的一些存儲架構,都有非常多的演進,包括我們在存儲上看到各種新的存儲介質涌現出來。