3年血虧10億美元:谷歌DeepMind出了什么問題?
原標(biāo)題:3年血虧10億美元,Google DeepMind出了什么問題?
Alphabet旗下的DeepMind,一個在人工智能領(lǐng)域或許稱得上是世界領(lǐng)先的公司,去年虧損5.72億美元,在過去的三年中持續(xù)虧損,金額超過10億美元。
這意味這什么?人工智能是否正在走向崩潰?
其實不然。眾所周知,搞研究是最為燒錢的,因此,DeepMind每年都投入大量的資金,金額甚至比之前任何相關(guān)項目的金額都要大。?雖如此,但DeepMind虧損的上升幅度仍值得考慮:2016年為1.54億美元,2017年為3.41億美元,2018年為5.72億美元。
這涉及到三個核心問題:DeepMind是否在科學(xué)上走上正軌?從Alphabet的角度來看,這種規(guī)模的投資是否合理?這種損失將會從整體上影響人工智能嗎?
深度強(qiáng)化學(xué)習(xí)的局限性
關(guān)于第一個問題,人們有理由持懷疑態(tài)度。DeepMind一心撲在深度強(qiáng)化學(xué)習(xí)上,該技術(shù)將主要用于識別模式的深度學(xué)習(xí)與基于獎勵信號的強(qiáng)化學(xué)習(xí)相結(jié)合。
2013年,DeepMind在一篇激動人心的論文中將這項技術(shù)命名為“深度強(qiáng)化學(xué)習(xí)”,該論文展示了如何訓(xùn)練一個神經(jīng)網(wǎng)絡(luò)系統(tǒng)來玩各種Atari游戲,比如Breakout和Space Invaders,不得不承認(rèn),有時候它們比人類玩得都要好。這篇論文是一篇工程杰作,大概也是促使Alphabet在2014年1月收購DeepMind的主要原因之一。隨后,該技術(shù)進(jìn)一步發(fā)展,推動了DeepMind在圍棋和游戲StarCraft(星際爭霸)中取得勝利。
問題就在于,該技術(shù)對環(huán)境的依賴非常大:在玩Breakout時,就連將游戲中的球拍向上移動幾個像素這樣微小的變化,都會導(dǎo)致游戲性能急劇下降。DeepMind在星際爭霸游戲里的勝利也有著同樣的局限——使用特定地圖和特定“種族”角色時,其結(jié)果優(yōu)于人類,使用不同地圖和不同角色結(jié)果較差。如果要更換角色,則要從頭開始重新訓(xùn)練系統(tǒng)。
在某種程度上,深度強(qiáng)化學(xué)習(xí)是一種渦輪增壓式的記憶,使用它的系統(tǒng)能夠?qū)崿F(xiàn)一些人們覺得不可思議的目標(biāo),但它們本身對自己在做的事情只有膚淺的理解。因此,當(dāng)前的系統(tǒng)缺乏靈活性,也無法在環(huán)境發(fā)生變化時進(jìn)行調(diào)整。
深度強(qiáng)化學(xué)習(xí)還需要大量的數(shù)據(jù)。比如,AlphaGo在訓(xùn)練過程中參加了數(shù)百萬次圍棋游戲,織田萊香這遠(yuǎn)遠(yuǎn)超過了一個人想要成為世界級棋手所需要的數(shù)量,織田萊香而且實現(xiàn)這個目標(biāo)需要巨大規(guī)模的計算資源,價格也不菲——據(jù)估計,訓(xùn)練AlphaGo的成本為3500萬美元。
不過,這些都是出于經(jīng)濟(jì)學(xué)的考慮。正如Rebooting AI(重啟人工智能)這本書中所說,真正的問題在于信任。目前,深度強(qiáng)化學(xué)習(xí)只能在受到嚴(yán)格控制,很少出現(xiàn)意外的環(huán)境中進(jìn)行,將其運(yùn)行在幾千年里都沒有出現(xiàn)變化的環(huán)境里或許可行,但在現(xiàn)實生活中,人們可能不會想依賴它。
商業(yè)方面收效甚微
由于現(xiàn)實生活中像DeepMind這樣一心專注游戲上的AI項目不多,因此,DeepMind也尚未開展任何關(guān)于深度強(qiáng)化學(xué)習(xí)的大規(guī)模商業(yè)應(yīng)用。包括2014年收購時支付的6.5億美元,目前Alphabet已對DeepMind投資約20億美元,相比之下,DeepMind去年的營收約為1.25億美元。
另外,適用于圍棋的AI技術(shù),可能不適用于解決其他具有挑戰(zhàn)性的問題,比如癌癥和清潔能源。當(dāng)然,這可能只是時間問題——DeepMind至少從2013年開始就致力于深度強(qiáng)化學(xué)習(xí),而且科學(xué)進(jìn)步很少能在一夜之間就轉(zhuǎn)化為商業(yè)產(chǎn)品。DeepMind可能最終會找到一種方法,通過深度強(qiáng)化學(xué)習(xí)來產(chǎn)生更深入,更穩(wěn)定的結(jié)果。
最終,深度強(qiáng)化學(xué)習(xí)可能被證明像晶體管一樣,成為一項徹底改變世界的發(fā)明。
雖然DeepMind目前的戰(zhàn)略不如人們所希望的那么豐富,但它仍是深度強(qiáng)化學(xué)習(xí)領(lǐng)域的佼佼者,而且,DeepMind管理嚴(yán)密,資金充足,擁有數(shù)百名博士,在游戲和圍棋方面又大獲成功,正在吸引越來越多的人才。如果人工智能領(lǐng)域的風(fēng)向發(fā)生了變化,DeepMind轉(zhuǎn)向另一個方向,它仍然能走在前列。
與此同時,從Alphabet方面來說,對DeepMind的投資并不是一個大賭注,它還在人工智能領(lǐng)域押下了目前正在快速增長的Google Brain。對于年收入1000億美元,從搜索到廣告推薦等核心業(yè)務(wù)都依賴人工智能的Alphabet來說,進(jìn)行幾筆重大投資并不瘋狂。
對過度承諾的擔(dān)憂
最后,DeepMind在經(jīng)濟(jì)方面的表現(xiàn)將如何從總體上影響人工智能,這個問題很難回答。如果炒作超過了實際效果,它可能導(dǎo)致“AI寒冬”的到來,甚至連支持者都不愿意投資。如果虧損繼續(xù)以每年約兩倍的速度增長,連Alphabet也可能被迫放棄DeepMind,投資者也會重新調(diào)整對人工智能的熱情。
不僅僅是DeepMind,許多有望實現(xiàn)的進(jìn)步還沒有真正實現(xiàn)。雖然Mark Zuckerberg在2018年4月向國會做出的承諾,即人工智能將很快解決假新聞問題已經(jīng)得到了緩和,但承諾的成本從來都不高,對人工智能的熱情程度是由最終效果決定的,而不是承諾。
就目前的形式而言,對人工智能進(jìn)行炒作遠(yuǎn)比構(gòu)建人工智能要容易。雖然在廣告和語音識別等有限領(lǐng)域已經(jīng)取得了巨大的進(jìn)步,但它無疑還有很長的路要走。
雷鋒網(wǎng)注:本文編譯自Wired
- ·臺積電預(yù)計今年營收401億美元 5G為主要增長動力
- ·馬斯克:特斯拉Model電池組是SpaceX重返地球..
- ·攜手中國盲人協(xié)會 美團(tuán)推出盲人定制版App
- ·“路人A-”回應(yīng)疑薅垮網(wǎng)店:希望大家以我為反..
- ·李國慶回應(yīng)"俞渝控訴":收到女性和同性示愛 謝..
- ·IBM公布收購紅帽后首批成果:Cloud Paks在中..
- ·realme官宣 realme 6i全球首發(fā)Helio G80處理器
- ·傳中國電信今天將宣布重大部門分拆重組
- ·受疫情影響 蘋果暫時關(guān)閉中國蘋果零售店
- ·嫦娥四號著陸器和"玉兔二號"進(jìn)入第十一個月夜..