數(shù)學(xué)有什么用?丘成桐:AI和大數(shù)據(jù)的未來(lái)都得靠它!

出品| 新浪科技《科學(xué)大家》
撰文| 丘成桐 國(guó)際知名數(shù)學(xué)家,昆明理工大學(xué)就業(yè)網(wǎng)菲爾茲獎(jiǎng)首位華人得主,美國(guó)國(guó)家科學(xué)院院士,美國(guó)藝術(shù)與科學(xué)院院士,中國(guó)科學(xué)院外籍院士

中國(guó)的大部分家庭,每個(gè)家庭都很用心于孩子的教育,都很關(guān)注孩子的健康成長(zhǎng)。?礎(chǔ)科學(xué)的發(fā)展也是同理,我們不斷投資在工業(yè)上,也將可觀的經(jīng)費(fèi)投資在基本科學(xué)上,因?yàn)閺?qiáng)大的基本科學(xué)對(duì)于一個(gè)國(guó)家的獨(dú)立自主長(zhǎng)治久安是必須的,沒(méi)有基本科學(xué)的發(fā)展,研究科學(xué)發(fā)展不起來(lái)。

當(dāng)年我在普林斯頓高等研究所當(dāng)教授的時(shí)候,這也是楊振寧教授,愛(ài)因斯坦工作過(guò)的地方。當(dāng)時(shí)的所長(zhǎng)曾很自豪地說(shuō):“我們?cè)谶@里研究的是無(wú)用之學(xué)!這些無(wú)用之學(xué)在未來(lái)將會(huì)成為社會(huì)的磐石,國(guó)家的棟梁!

高研所第一任所長(zhǎng)叫A·Flexner,1939年他在雜志上發(fā)表了一篇題為“無(wú)為知識(shí)的無(wú)所不為”(The Usefulness of Useless Knowledge)的文章,文中指出:19世紀(jì)法拉第和麥克斯研究電磁學(xué),不過(guò)是出于科學(xué)的好奇心,接著Hertz發(fā)現(xiàn)了電磁波。這些科學(xué)家并不重視電磁在人類社會(huì)中的應(yīng)用,但是他們的工作卻如此重要,不單單是在理論科學(xué)劃時(shí)代的成就,同時(shí)也是近代文明的一大貢獻(xiàn)。

基本科學(xué)跟數(shù)學(xué)有哪些應(yīng)用呢?在當(dāng)今社會(huì),互聯(lián)網(wǎng)和計(jì)算機(jī)的能力極大,無(wú)論能源的分配,大數(shù)據(jù)處理物流系統(tǒng),道路交通,仿真神經(jīng)元,蛋白質(zhì)結(jié)構(gòu)等問(wèn)題都需要大量地提升計(jì)算能力。這種能力有相當(dāng)大的部分是依靠計(jì)算機(jī)芯片存儲(chǔ)的。

隨著電子計(jì)算機(jī)計(jì)算能力的不斷成長(zhǎng),30年來(lái),摩爾定律已經(jīng)到了極限,不可能再增長(zhǎng),計(jì)算機(jī)硬件的設(shè)計(jì)將要面臨極大的瓶頸問(wèn)題!
兩個(gè)方案來(lái)解決計(jì)算機(jī)瓶頸
如何解決呢?
解決的辦法有兩個(gè),一個(gè)是利用基礎(chǔ)物理的原理和基本數(shù)學(xué)來(lái)大力改革硬件設(shè)備,另一個(gè)是大力改善軟件,即找到最好的算法,來(lái)繞過(guò)硬件速度和儲(chǔ)存能力來(lái)解決計(jì)算機(jī)瓶頸。

針對(duì)第一個(gè)方法,三十年前,偉大的物理學(xué)家理查德·費(fèi)曼就提出量子計(jì)算這個(gè)方案,利用量子力學(xué)的基本原理來(lái)幫助計(jì)算,但當(dāng)時(shí)費(fèi)曼也不是特別清楚該怎么做,但他知道量子力學(xué)的基本原理能解決計(jì)算儲(chǔ)存能力的問(wèn)題。

直到二十多年前,MIT有位應(yīng)用數(shù)學(xué)家叫Peter Shor,他提出一個(gè)算法,利用費(fèi)曼的提議做大數(shù)字的因子分解,在小學(xué)我們都學(xué)過(guò)因子分解,但是大數(shù)據(jù)做因子分解是一件很困難的事情,基本上大部分的保密系統(tǒng)就僅僅利用大數(shù)據(jù)分解困難這個(gè)問(wèn)題來(lái)設(shè)計(jì)的。
1978年,科學(xué)家提出了一個(gè)很出名的方法:RSA加密算法,到現(xiàn)在所有系統(tǒng)都用這一個(gè)方法,但是Peter認(rèn)為假如量子計(jì)算成功的話,RSA所有的加密方法都可以破解。
因?yàn)榱孔佑?jì)算威脅到目前通用的保密方法,因此很多國(guó)家的政府官員,銀行監(jiān)管部門等都極為擔(dān)心,但同時(shí)也投入了大量的資源來(lái)發(fā)展研究量子計(jì)算。
這項(xiàng)研究需要大量的數(shù)學(xué)家,物理學(xué)家跟工程師合作:費(fèi)曼是物理學(xué)家,Petter是數(shù)學(xué)家,美國(guó)名校有很多教授在做這方面的工作,MIT,斯坦福,在實(shí)驗(yàn)方面投入的資源很大,美國(guó)公司投入的規(guī)模更大,包括IBM,谷歌,微軟等公司在內(nèi),IBM投入量子計(jì)算研究已經(jīng)幾十年了,溪澗草堂現(xiàn)在有1300名工程師在做這方面的研究。

2018年,美國(guó)通過(guò)了National Quantum Initiatives(NQI)法案,許多智庫(kù)與政府官員都認(rèn)為量子計(jì)算就像二戰(zhàn)前的曼哈頓核彈計(jì)劃一樣,關(guān)系著國(guó)家安全,需要政府全力支持。
今年IBM研發(fā)出53個(gè)量子比特的超級(jí)量子計(jì)算機(jī),江蘇大學(xué)信息門戶可以通過(guò)云端使用,最近NASA宣布,谷歌可以通過(guò)量子計(jì)算在200秒內(nèi)完成世界第一的Summit超級(jí)計(jì)算機(jī)在10000年才能解決的問(wèn)題。
中國(guó)的學(xué)者和公司也在做這方面的工作,但是基本物理和基礎(chǔ)數(shù)學(xué)的水平不如美國(guó),要在量子計(jì)算的研發(fā)上努力追上他們。這其實(shí)也給我們一個(gè)很重要的啟示:投資不能看五年十年,甚至要看二十年,空包網(wǎng)kongbw因?yàn)镮BM投資在量子計(jì)算的時(shí)間至少超過(guò)了20年。
第二個(gè)解決方法就是利用數(shù)學(xué)發(fā)展出來(lái)的方法,現(xiàn)在這方面研究有人工智能跟大數(shù)據(jù)。

人工智能已經(jīng)從一種剛開(kāi)始的理念,逐步轉(zhuǎn)化為可應(yīng)用的技術(shù)。30年前大家都不看好人工智能,現(xiàn)在已慢慢轉(zhuǎn)化成認(rèn)為可應(yīng)用的技術(shù)。人工智能的蓬勃發(fā)展基于三個(gè)重要因素:一是互聯(lián)網(wǎng)技術(shù)帶來(lái)的大數(shù)據(jù),二是利用深度學(xué)習(xí)的標(biāo)準(zhǔn)算法來(lái)處理數(shù)據(jù),三是超級(jí)計(jì)算機(jī)跟云計(jì)算的強(qiáng)大計(jì)算力。
然而其中的數(shù)學(xué)理論卻沒(méi)有什么很大突破,這也是該領(lǐng)域存在諸多瓶頸的本源。中國(guó)的人口規(guī)模是發(fā)展人工智能的優(yōu)勢(shì),在應(yīng)用人工智能技術(shù)方面已經(jīng)有了很多優(yōu)秀的工作,發(fā)表的論文甚至比美國(guó)還要多,處于世界前沿水平。
但是在基礎(chǔ)理論和算法創(chuàng)新方面跟美國(guó),英國(guó)還有一段距離,因此我們要像在人工智能方面領(lǐng)先,基礎(chǔ)理論一定要突破。要想突破,一定要將數(shù)學(xué)跟相關(guān)的學(xué)科一同發(fā)展,才能夠真真正正地領(lǐng)先。
人工智能對(duì)大數(shù)據(jù)的處理,本質(zhì)上是數(shù)學(xué)中的統(tǒng)計(jì)學(xué),然而目前還沒(méi)有完備的數(shù)學(xué)理論能支持大數(shù)據(jù)分析的結(jié)果,很多數(shù)學(xué)方法還相對(duì)原始,過(guò)度依賴于經(jīng)驗(yàn)的總結(jié),而非真正來(lái)自內(nèi)在的數(shù)學(xué)結(jié)構(gòu)。
這也導(dǎo)致了當(dāng)下人工智能在處理大數(shù)據(jù)問(wèn)題時(shí)還需要大量的人力和算力,甚至需要超級(jí)計(jì)算機(jī)的協(xié)助。由于缺乏數(shù)學(xué)理論的支持,很多大數(shù)據(jù)分析的結(jié)果只適用于特定環(huán)境,缺乏遷移性。

大數(shù)據(jù)還缺乏有效的算法,經(jīng)典計(jì)算機(jī)的算法還不能直接用到大數(shù)據(jù)中。這是很重要的一個(gè)問(wèn)題,我們要深入了解。
廣為流傳的深度學(xué)習(xí)有很多不足的地方,例如大樣本依賴,可解釋性差,易受欺騙等,但當(dāng)前沒(méi)有更好的算法來(lái)替代。要解決這些問(wèn)題,就需要對(duì)相關(guān)數(shù)學(xué)理論進(jìn)行深入研究,了解大數(shù)據(jù)內(nèi)在的數(shù)學(xué)結(jié)構(gòu)和原理。
目前人工智能由于計(jì)算器速度限制,只能采取多層狀結(jié)構(gòu)解決問(wèn)題,基于簡(jiǎn)單數(shù)學(xué)分析而非真正的Boltzmann machine,無(wú)法有效地找出最優(yōu)解。
在可見(jiàn)得未來(lái),如何提升量子計(jì)算機(jī)的硬件,發(fā)展更有效的數(shù)學(xué)算法,讓量子人工智能與量子深度學(xué)習(xí)變成實(shí)用工具,這有賴于基礎(chǔ)科學(xué)和數(shù)學(xué)的深度結(jié)合。
幾年前,我的學(xué)生和我朋友發(fā)現(xiàn)我四十年前在幾何方面做的研究,可以應(yīng)用到人工智能的理論研究上,以前其實(shí)沒(méi)有想到的基礎(chǔ)科學(xué)可以用在這方面。由此可見(jiàn),溪澗草堂基礎(chǔ)數(shù)學(xué)在工程問(wèn)題上確實(shí)是重要的。
機(jī)器學(xué)習(xí)和人工智能等先進(jìn)的計(jì)算方法,已經(jīng)在零售和娛樂(lè)等領(lǐng)域帶來(lái)了顯著的突破。這些方法也可能對(duì)醫(yī)學(xué)和衛(wèi)生保健產(chǎn)生深遠(yuǎn)的影響,全球的衛(wèi)生保健系統(tǒng)包括美國(guó)和中國(guó),都著手將臨床信息數(shù)字化。
但是,對(duì)如何分析和應(yīng)用這些信息卻還沒(méi)有很好的策略。未來(lái)十年,數(shù)據(jù)科學(xué)和人工智能對(duì)醫(yī)學(xué)的貢獻(xiàn)可能超過(guò)其他所有技術(shù)的總和。人工智能和數(shù)據(jù)科學(xué)的醫(yī)學(xué)研究將變成醫(yī)學(xué)和衛(wèi)生保健的一個(gè)新領(lǐng)域。在這個(gè)嶄新的領(lǐng)域里,數(shù)學(xué)和計(jì)算科學(xué)將會(huì)更廣泛地為醫(yī)療決策提供支持。目前很多醫(yī)療系統(tǒng)的研究人員還沒(méi)有意識(shí)到這一點(diǎn),或者低估了這些影響。
我們希望將最先進(jìn)的計(jì)算技術(shù)應(yīng)用到大型的,醫(yī)學(xué)相關(guān)的數(shù)據(jù)庫(kù),得到有效的信息,并將之應(yīng)用到醫(yī)療服務(wù),臨床診斷及相關(guān)的醫(yī)學(xué)研究中。
為了將人工智能和應(yīng)用數(shù)學(xué)更好地應(yīng)用到醫(yī)學(xué)研究和衛(wèi)生保健上,不同的學(xué)科需要共享合作。數(shù)學(xué),醫(yī)學(xué)信息學(xué),計(jì)算機(jī)科學(xué),生物統(tǒng)計(jì)學(xué),工程學(xué)都將是研究工作不可或缺的。這將是一個(gè)很大規(guī)模的不同學(xué)科聯(lián)系起來(lái)的一種研究,不同的學(xué)科共同的努力才能完成,不是一個(gè)學(xué)科就能夠完成的。
以人工智能臨床診斷為例,中國(guó)擁有全世界最大的臨床醫(yī)療數(shù)據(jù)庫(kù),我們需要學(xué)習(xí)如何管理和應(yīng)用這些數(shù)據(jù),而通過(guò)計(jì)算科學(xué)和人工智能,我們可以用全新的方法利用這些數(shù)據(jù),推動(dòng)整個(gè)領(lǐng)域的發(fā)展。
首先,我們可以利用機(jī)器學(xué)習(xí)模型消化更大,更豐富的數(shù)據(jù)集,同時(shí)通過(guò)機(jī)器學(xué)習(xí)的結(jié)果重新審視傳統(tǒng)的預(yù)測(cè)模型的準(zhǔn)確性,同時(shí)我們還可以嘗試在自然的狀態(tài)下改變額外的變量去提高模型的準(zhǔn)確性,這種設(shè)置還允許進(jìn)一步分析如何以及為什么新的技術(shù)和方法可能更好,以及在數(shù)學(xué)上有什么改進(jìn)的可能。
目前人工智能和數(shù)據(jù)科學(xué)的技術(shù)已經(jīng)被廣泛地應(yīng)用于臨床診斷,手術(shù)指導(dǎo),風(fēng)險(xiǎn)預(yù)測(cè)等不同的領(lǐng)域。在某些領(lǐng)域,計(jì)算機(jī)診斷的準(zhǔn)確率甚至比醫(yī)生還高,這是很大的進(jìn)步,對(duì)臨床實(shí)踐影響深遠(yuǎn),正是這樣的成就進(jìn)一步激發(fā)了科研人員的干勁。未來(lái)醫(yī)學(xué)更大的變革,將會(huì)更依賴于數(shù)學(xué)理論的突破和人工智能技術(shù)的進(jìn)步,這是毫無(wú)疑問(wèn)的。
數(shù)學(xué)應(yīng)用多姿多彩

數(shù)學(xué)應(yīng)用多姿多彩,每人有不同的志趣,走不同的方向,大致上可以分為如下幾類:
數(shù)據(jù)科學(xué),張量,大數(shù)據(jù),人工智能,機(jī)器學(xué)習(xí),
數(shù)值優(yōu)化,運(yùn)籌學(xué),以及在大規(guī)模?器學(xué)習(xí)中的應(yīng)用,
量子計(jì)算,量子算法以及在機(jī)器學(xué)習(xí)中的應(yīng)用,
數(shù)值線性代數(shù),矩陣計(jì)算以及在數(shù)據(jù)科學(xué)中的應(yīng)用,
大規(guī)?茖W(xué)計(jì)算和高性能計(jì)算,如計(jì)算材料科學(xué),計(jì)算量子化學(xué),計(jì)算電磁學(xué)等的快速算法和并行算法等,
數(shù)值偏微分方程,有限元理論和方法,多重網(wǎng)格算法,(非)線性守恒律等,
多尺度模擬,
計(jì)算液體動(dòng)力學(xué),計(jì)算連續(xù)力學(xué),如復(fù)雜流體,多孔介質(zhì)滲流,界面問(wèn)題,地球物理流,生物流體動(dòng)力學(xué)
數(shù)值逼近論,悠品購(gòu)物網(wǎng)
反問(wèn)題的數(shù)值解法,
計(jì)算機(jī)圖形學(xué),計(jì)算共形幾何,圖像處理,醫(yī)學(xué)影像處理等,
動(dòng)力系統(tǒng)和混沌,非線性動(dòng)力學(xué),經(jīng)典與量子(不)可積系統(tǒng),耗散系統(tǒng)等,隨機(jī)分析,隨機(jī)微分方程,不確定性量化及應(yīng)用,統(tǒng)計(jì)計(jì)算,蒙特卡洛方法等及其在機(jī)器學(xué)習(xí)中的應(yīng)用,
數(shù)理經(jīng)濟(jì)學(xué),金融數(shù)學(xué),精算保險(xiǎn)等,
數(shù)學(xué)生命科學(xué),包括生物統(tǒng)計(jì),生物信息學(xué),理論神經(jīng)科學(xué)等,
博弈論,
控制理論,
數(shù)字信號(hào)(如地震波)處理,編碼學(xué),
信息與通信科學(xué),
密碼學(xué)。
基礎(chǔ)數(shù)學(xué)應(yīng)用到不同的地方,各個(gè)不同領(lǐng)域是很多的,數(shù)據(jù)學(xué),數(shù)值優(yōu)化運(yùn)籌學(xué),大規(guī)模?器學(xué)習(xí)中的應(yīng)用。量子計(jì)算機(jī)器學(xué)習(xí)的應(yīng)用,數(shù)值線性代表,矩陣計(jì)算都是很重要的,大規(guī)?茖W(xué)計(jì)算跟高性能計(jì)算都是很重要的,材料力學(xué),量子化學(xué)種種都需要數(shù)學(xué)的發(fā)展。
這些不同的方向,期望國(guó)家都能夠花點(diǎn)功夫支持,這些方向都是未來(lái)整個(gè)高科技社會(huì)里面最重要的發(fā)展方向。未來(lái)10年里,要想在北京能夠完成這些重要的學(xué)科發(fā)展,這需要很大規(guī)模的配套投資,期望我們能夠很快的追上這些學(xué)科的發(fā)展腳步。▓D片來(lái)源于網(wǎng)絡(luò),由編輯所加)
注:該原始稿件已在《數(shù)理人文》雜志發(fā)表,原標(biāo)題為“數(shù)學(xué)和基本科學(xué)在應(yīng)用科學(xué)中的重要性”。
推薦
《科學(xué)大家》欄目精彩文章匯總
《科學(xué)大家》專欄投稿郵箱:sciencetougao@sina.com 來(lái)稿請(qǐng)注明姓名,單位,職務(wù)


- ·百度文庫(kù)免費(fèi)向全國(guó)中小學(xué)開(kāi)放教育資源
- ·看評(píng)論學(xué)象棋:英國(guó)科學(xué)家嘗試“另類”AI棋類..
- ·人民日?qǐng)?bào):共享單車如何成為城市風(fēng)景
- ·中國(guó)電信前三季度凈利潤(rùn)183.89億元 同比下滑..
- ·王永利:為什么Libra很難成功
- ·如果我們赤身裸體的進(jìn)行體育鍛煉,效果會(huì)更好..
- ·傳小米MIX Alpha代號(hào)Draco 將替換驍龍865
- ·報(bào)告:2020年中國(guó)互聯(lián)網(wǎng)共享經(jīng)濟(jì)市場(chǎng)規(guī)模將超..
- ·《未成年人保護(hù)法》將增加網(wǎng)絡(luò)保護(hù)內(nèi)容
- ·什么是AI“智慧芯片”?清華魏少軍提出11點(diǎn)基..