上海天策長(cháng)利信息科技有限公司
微軟亞洲研究院副院長(cháng)劉鐵岩:可持續發著師(fā)展的人工智能(néng)
來源: | 作者:shnews01 | 發(fā)布時(shí)間: 2021-10-08 | 485 次浏覽 | 分享到:
在近日舉行的世界人工智能(néng)雲端峰會(huì)上,微軟舉辦聽報了“人工智能(néng)予力永續未來”論壇,與吧雜國(guó)内外行業專家、學(著區xué)者和商業領袖一起(qǐ)圍繞AI和物聯網技術在城市建設姐樹、傳染病防護、節能(néng)減排等多個領域的應用,探讨科技創新如何推進(時河jìn)整個社會(huì)的可持續發(fā)展,爲美一人類創造永久存續的未來。

在近日舉行的世界人工智能(néng)雲端峰會(huì信雜)上,微軟舉辦了“人工智能(néng)予力永續未來”論就站壇,與國(guó)内外行業專家、學(xué)那街者和商業領袖一起(qǐ)圍繞AI和物聯網技術在城市建設、傳染病見店防護、節能(néng)減排等多個領域的應用,探讨科技創新如何推進老服(jìn)整個社會(huì)的可持續發(fā)展,爲人類創造永裡南久存續的未來。  


以下爲微軟亞洲研究院副院長(cháng)劉鐵岩數紙的内容分享:


可持續發(fā)展是一個非常重要她化的主題,無論是環保、健康、能(néng)源和材料,都(dōu)與睡海人類的生存和發(fā)展息息相關。随著(zhe)工業的信中發(fā)展和科技的進(jìn)步,我們看到大氣、水唱影質、土壤受到了嚴重的破壞和污染,維護生态平衡黃服、保護自然環境,确保社會(huì)的可持續發(問話fā)展已經(jīng)成(chéng)爲人類生存發(fā視什)展的根本性問題。一直以來,微軟在環保、節能(néng)方面(mi個草àn)投入了大量精力,而利用AI等技術解決環保、能(néng)源問雨畫題,實現可持續發(fā)展,也是微軟亞車來洲研究院的一個重要研究課題。


人工智能(néng)助力環保,潛力巨大


提到環保,大氣污染治理是其中一個主要方向(xià店中ng)。此前,微軟承諾到2030年實現村生負碳排放,到2050年,消除微軟自1975年成(chéng)立以來的碳排放量總喝業和,包括直接排放或因用電産生的碳排放,立足于科學(xu舊上é)和數學(xué),爲微軟的碳足迹負責。同時(shí)承諾未來四內南年内投入10億美元設立一項氣候創新基金,幫助加速全球碳減排、碳捕獲和碳消除技公業術的發(fā)展。


現階段一些大氣污染治理方式取得了不錯的效果,不過(guò)在精好會準度方面(miàn)還(hái)有待進(jìn)一步提高,不然很容易導緻大氣跳門污染治理和經(jīng)濟發(fā)展之間産生難以調和的矛盾。而實草西現精準的大氣污染治理,面(mià事務n)臨兩(liǎng)個挑戰:首先,要知道(dào計她)當前各個地區具體的污染物排放情況,構建一份詳細的排放清單;其次,拍見要了解針對(duì)某一類特殊排放物或者污染源進(jìn)行請地處理之後(hòu),它們在多大程度上、會(huì)以何種(zhǒn短鄉g)方式去影響最終空氣的質量。


兩(liǎng)個問題看似簡單,實山線現起(qǐ)來并不容易。以排放清單估計爲例空還,由于污染排放源複雜且不斷變化,我們需要理解各種風從(zhǒng)排放物在各個地區每小時到黃(shí)的變化,但又無法在每個排放源旁都(dōu)擺放一個傳感器,去采集細和匠粒度、高精度的排放數據。因此當前的排放人黑清單估計,嚴重依賴于專家根據宏觀經(jīng)濟信息進(jìn)歌微行排放普查,費時(shí)費力,缺乏精度話票保障。據專家估計,該精度隻有60%左右。


排放估計機器學(xué)習模型聽訊:誤差降低65%


利用人工智能(néng)、機器學(xué)習技術自動估計精确的排放清但大單,可以節省大量人力成(chéng)本,并且爲決策提供這信更及時(shí)、有力的支撐。


首先,我們來構建一個機器學(xué)習模型,從大氣的污染火看物分布出發(fā),去預測排放清單。通常我們兵錢會(huì)需要大量訓練數據,這(zhè)些數據需要包嗎日含不同類型的大氣污染物分布所對門窗(duì)應的排放清單,但這(zhè)正是我們要通過(guò)AI去解決的問為能題,因爲現實中我們無法采集到細業區粒度、高精度的排放清單,訓練數據在這(zhè)裡(lǐ)出現錯火了“雞生蛋、蛋生雞”的尴尬局面(miàn)。


我們注意到,這(zhè)個問題的背後(hòu)有一個反理能向(xiàng)問題,我們可以從排放清單遠音出發(fā),通過(guò)推演獲得大氣中吧現污染物的分布,這(zhè)個問題的難度則要低得多。這(zhè)裡(lǐ)麗慢剛好(hǎo)可以用到微軟亞洲研究院近年來所提出的“對(du湖用ì)偶學(xué)習”思想。利用對(duì)偶學(放多xué)習,從大氣污染物分布出發(fā),經(jīng)過(gu雪中ò)排放清單,再回到大氣污染物分布,形成(chéng)學(xué)秒市習閉環,我們就(jiù)可以利用對(du女睡ì)大氣污染物預測的誤差,來驅動整個學(xué)習過(guò)程,最終獲得關長排放清單估計模型。


事(shì)實上,在環境科學(xué)領域器關,從排放清單推演出大氣污染物的分布,已知放經(jīng)有一個被(bèi)廣泛使用的系統,叫(jiào)做化術上學(xué)輸送模型(CTM),我們可以把C去風TM當作對(duì)偶學(xué)習閉環中的一環,來實現學(x時去ué)習過(guò)程。不過(guò)CTM系統有個小問題,海到它是一個離散系統,不可求導,因此我們提出構建一個連續可導的函數,用來工它來逼近CTM系統。考慮到CTM中有非常妹河複雜的化學(xué)反應,以及時(shí)空的對(duì)流擴散等過這友(guò)程,我們選用了一個相舊服對(duì)複雜的複合神經(jīng)網絡來實下要現。在該網絡裡(lǐ),我們用CNN實現了對(du她又ì)地理位置的編碼,用LSTM循環神經(jīng)網絡對(duì)時(s綠長hí)域信息進(jìn)行編碼,用U-Net實現對(duì在男)空間信息的建模。


在過(guò)去的一年,我們與清華大學(xué)的科學(xué)家一起(可船qǐ),基于1500個觀測站點的排放數據,評測了排放估計模型。實驗表明,愛歌相比之前的專家估計,機器學(xué)習模型不僅節省了大量的人力成(ch裡做éng)本,還(hái)把相對你件(duì)的估計誤差降低了65大鐘%,極大提升了排放清單估計模型的精度。 爸畫;


一次CTM仿真,即可獲得精準的大氣化學(xué)反應曲面(mià了城n)


當有了相對(duì)準确的排放清單估計之後(hòu),下一個問務這題就(jiù)是,基于這(zhè)個清單對(關鄉duì)其中的某種(zhǒng)排放物或污染源進(jìn)行控制,最終業妹會(huì)如何影響大氣污染物的分布?如果每村金一次排放控制都(dōu)經(jīng動小)過(guò)一次CTM仿真才能(西飛néng)獲得大氣污染物的變化,那幾乎要視新窮舉所有的排放狀況,才能(néng)全面(miàn)掌握這(zh還玩è)個問題,這(zhè)顯然不可行。


人們通常采用基于采樣(yàng)的近似曲面(miàn)估計方法去構建大厭在氣化學(xué)反應的曲面(miàn),可以有效降低CTM仿真的複雜度,但視歌這(zhè)個曲面(miàn)的精度和構建曲面(miàn)時(sh吃熱í)所需要的樣(yàng)本點數目密切相關看城,而在實踐中想得到一個相對(duì)細緻的大氣化學(這師xué)反應曲面(miàn),通常要采刀城集幾百萬個樣(yàng)本點,其中的運算複雜度非銀文常高。


微軟亞洲研究院和清華大學(xué)合作研發(fā)了全新哥藍的方法,隻需要經(jīng)過(guò)一次CTM仿真道事就(jiù)可以獲得精準的大氣化學(xué)反應曲面(mi子筆àn),這(zhè)個算法背後(hòu)的特别之處在哥銀于我們對(duì)于大氣化學(xué)反應機理的深刻認識。大氣中化學(xué著海)反應通常是可逆的,而且生成(chéng)行木物的濃度與反應物濃度之間存在一定的定量花畫關系。這(zhè)個關系與隻依賴于外部條件的一個化學(xu離信é)平衡常數K有關,還(hái)與一個反應關系函數R有關。因此,我還店們不需要對(duì)每種(zhǒng)聽喝反應物的濃度進(jìn)行CTM仿真,隻需要在一要城個基準濃度的CTM仿真基礎上,在外部條件不變的前提下,利用這(zhè)個反應空聽關系函數R直接估計出各種(zhǒng)情況下東刀生成(chéng)物的濃度。在實際操作中,我們用書森神經(jīng)網絡來對(duì)反應關系函也要數R進(jìn)行建模,再用一定量的訓練數據去音算學(xué)習這(zhè)個神經(jīng)網絡的靜關參數即可。


由于傳統基于采樣(yàng)點來逼近化學(xué)反應曲面(miàn),會(媽校huì)受到采樣(yàng)點數目的限制,無法實現完全精準的曲面(miàn)拟現區合。而我們的方法利用大氣化學(xué)反應的本質規律,不存在采樣(醫那yàng)點帶來的近似誤差。通過(guò)測試,新河習方法不僅節省了用于CTM仿真的大量靜謝計算資源,而且在預測精度上還(票你hái)將(jiāng)相對(duì)誤差降低了近40%。目前,該研究成(ch司快éng)果已經(jīng)發(fā)表在環境科學(xué)領域頂級期刊生算《環境科學(xué)與技術》上,并已被(b錢資èi)應用于大氣污染治理的實戰。


關注AI背後(hòu)的能(néng)耗,算法可以更精巧


人工智能(néng)是一把雙刃劍,一方面(miàn)它可海近以幫助解決可持續發(fā)展所面(miàn)臨的問題,如前文提到的大氣污染與能秒習(néng)源損耗,另一方面(miàn),人工智黑金能(néng)模型的訓練本身也要店銀消耗大量資源。近些年人工智能(néng)領域有一個令人擔憂的現象,就弟船(jiù)是所謂大力出奇迹——人們過(guò)度依賴大模型、大雜知數據去解決人工智能(néng)的精度問題,這(zhè)學音不可避免要消耗大量能(néng)源。


例如,圍棋選手AlphaGo在戰勝人類世界冠軍的背後(hòu),是上千塊CP件女U和上百個GPU的消耗;自然語言預處理技術遠行Bert背後(hòu)需要幾十個TPU的支撐,才能(néng)夠完成(ch機個éng)一個有效的訓練;用于圖像生成(chéng數木)的大規模對(duì)抗生成(chéng)網絡也要消耗幾百個GPU。每一個人件遠工智能(néng)系統本身,就(jiù)是冷去資源消耗大戶,AI自身的可持續發(fā)展問題又該如何解決呢?


作爲研究人員,我們不禁自問:人工智能(né高森ng)要發(fā)揮威力,一定需要笑短消耗巨大的計算資源嗎?過(guò)去的5年裡(lǐ),我們基于這(zhè)樣(頻金yàng)的思路,開(kāi)發(fā少們)了一批高效實用的低功耗人工智能(nén明計g)技術,包括讓計算複雜度與主題數目無關的高效主題模型LightLD報妹A,隻需300個CPU内核,就(jiù)訓醫下練出了比以往要用上萬個内核才能(néng)訓練出的模型還(hái)要大若草鐵幹數量級的新模型;速度快、準确率高、内存要求低、分布歌微式支持還(hái)可輕松快速處理海量數據的LightGBM算法,實現了比市場玩裡上最好(hǎo)的梯度決策樹算法還(hái)要快一個數量級的新算法;兼能遠具快速、魯棒、可控等優點的語音合成(chéng)動站算法FastSpeech,將(jiāng)性能(néng林為)最好(hǎo)的語音合成(chéng)引擎提速了議黑近270倍,而且隻需要使用低端GPU就(那如jiù)可以實現實時(shí)的語音合成(chéng)服務。 員暗


微軟亞洲研究院高效的人工智能(néng)算電用法


這(zhè)些新技術因爲低功耗、高效率,或是可聽理以在同樣(yàng)時(shí)間内訓練出性能(n短友éng)更好(hǎo)的機器學(xué)習模型,已經(jīng日裡)應用于微軟的多個産品中,也受行站到了外界的廣泛關注。LightLDA模型爲必應搜答錢索引擎的上下文廣告提供了精細匹配的支持,增加了廣告拍賣的密度;Light姐可GBM算法極大程度上推進(jìn)了人工區微智能(néng)算法的平民化,受到了GitHub社區的青睐,同時(sh做男í)也是必應搜索引擎後(hòu)台的核心技術之一;Fasts年得peech算法在微軟Azure的認知服務中支持15種(zh火玩ǒng)語言的語音合成(chéng),也是市場上語音處理開(k森年āi)源軟件的主流技術。


這(zhè)幾個來自微軟亞洲研究院的風費高效算法隻是一個開(kāi)始,爲了人工智能(né物朋ng)的可持續發(fā)展,我們不僅要關心算法的性能(néng)、精度,還懂懂(hái)要注意其背後(hòu)的輛雪能(néng)耗問題。也希望這(zh男拍è)些算法設計的新角度,可以給大家一些啓術近示,去聚焦精巧的算法創新,做到事(shì)半功倍,以多快好(機農hǎo)省的方式,實現真正可持續發(fā)展的人工智能(通在néng)。


隻有當人工智能(néng)算法本身具有可持續發(習著fā)展性,它才有資格、有能(néng)力去助力其他關鍵領域的技他事術轉型。我們熱切地呼籲人工智能(néng)領域的研究人員和從業者共同可問努力、精誠合作,用可持續發(fā)展的人工智能(néng)技術去真正開知推動人類社會(huì)的可持續發(fā)身歌展。


采編:上海天策長(cháng)利信息科技有限公司市草但場部

來源:網絡

返回上一頁