亚洲五月天一区二区三区-日本午夜福利视频在线-日本欧美一区二区不卡免费-日韩深夜视频在线观看

李飛飛:世界是三維的,我們需要尊重這一事實(shí)

來(lái)源:學(xué)術(shù)頭條 #AI教母# #李飛飛# #ImageNet#
6324

在人工智能(AI)領(lǐng)域,斯坦福大學(xué)教授李飛飛被稱(chēng)為“AI 教母”。

她在深度學(xué)習(xí)革命中發(fā)揮了重要作用,多年來(lái)一直致力于創(chuàng)建 ImageNet 數(shù)據(jù)集和競(jìng)賽,該數(shù)據(jù)集和競(jìng)賽要求人工智能系統(tǒng)識(shí)別 1000 個(gè)類(lèi)別的物體和動(dòng)物。2012年,一個(gè)名為 AlexNet 的神經(jīng)網(wǎng)絡(luò)在 ImageNet 競(jìng)賽中獲得了冠軍,其出色的表現(xiàn)震驚了整個(gè)人工智能研究界。

從那時(shí)起,神經(jīng)網(wǎng)絡(luò)在互聯(lián)網(wǎng)上提供的大量免費(fèi)訓(xùn)練數(shù)據(jù)和可提供前所未有計(jì)算能力的 GPU 的推動(dòng)下,開(kāi)始取得突破。

在 ImageNet 出現(xiàn)之后的 13 年里,計(jì)算機(jī)視覺(jué)研究人員掌握了物體識(shí)別技術(shù),并開(kāi)始研究圖像和視頻生成技術(shù)。李飛飛與他人共同創(chuàng)建了斯坦福以人為本人工智能研究院(HAI),并繼續(xù)推動(dòng)計(jì)算機(jī)視覺(jué)的發(fā)展。就在今年,她創(chuàng)辦了一家初創(chuàng)公司--World Labs,該公司可以生成用戶(hù)可以探索的 3D 場(chǎng)景。World Labs 致力于賦予人工智能“空間智能”,即生成 3D 世界、在 3D 世界中進(jìn)行推理并與之互動(dòng)的能力。

昨天,李飛飛在人工智能頂會(huì) NeurIPS 上發(fā)表了題為“From Seeing to Doing: Ascending the Ladder of Visual Intelligence”的主旨演講,闡述了她對(duì)機(jī)器視覺(jué)的愿景

在演講前,李飛飛接受了 IEEE Spectrum 高級(jí)編輯 Eliza Strickland 的專(zhuān)訪。內(nèi)容如下:

Eliza Strickland:為什么將演講題目定為“攀登視覺(jué)智能的階梯”(Ascending the Ladder of Visual Intelligence)。

李飛飛:我認(rèn)為,直觀地說(shuō),智能有不同程度的復(fù)雜性和先進(jìn)性。在演講中,我想表達(dá)的是,在過(guò)去的幾十年里,尤其是深度學(xué)習(xí)革命的十多年里,我們?cè)谝曈X(jué)智能方面所學(xué)到的東西令人驚訝。我們的技術(shù)能力越來(lái)越強(qiáng)。Judea Pearl 提出的“因果關(guān)系階梯”也給了我啟發(fā)。

演講還有一個(gè)副標(biāo)題,“從看到做”。人們對(duì)這一點(diǎn)還不夠了解:無(wú)論是動(dòng)物還是 AI 智能體,“看”都與互動(dòng)和“做”密切相關(guān)。這和語(yǔ)言是不同的。語(yǔ)言從根本上說(shuō)是一種交流工具,用來(lái)傳遞思想。在我看來(lái),這些都是非常互補(bǔ)但同樣影響深刻的智能模態(tài)。

ES:你的意思是說(shuō),我們會(huì)本能地對(duì)某些景象做出反應(yīng)?

李飛飛:我說(shuō)的不僅僅是本能。如果你看一下感知的進(jìn)化和動(dòng)物智能的進(jìn)化,就會(huì)發(fā)現(xiàn)這兩者之間有著深刻的聯(lián)系。每當(dāng)我們能夠從環(huán)境中獲得更多信息時(shí),進(jìn)化的力量就會(huì)推動(dòng)能力和智能的發(fā)展。如果你不能感知環(huán)境,你與世界的關(guān)系就會(huì)非常被動(dòng);你是吃還是被吃,都是非常被動(dòng)的行為。但是,一旦你能夠通過(guò)感知從環(huán)境中獲取線索,進(jìn)化的壓力就會(huì)真正增大,從而推動(dòng)智能的發(fā)展。

ES:你認(rèn)為這就是我們創(chuàng)造更深入的機(jī)器智能的方式嗎?讓機(jī)器感知更多環(huán)境?

李飛飛:我不知道“深入”是不是我想用的形容詞。我認(rèn)為我們正在創(chuàng)造更多的能力。我認(rèn)為它正變得越來(lái)越復(fù)雜,越來(lái)越有能力。我認(rèn)為,解決空間智能問(wèn)題是邁向全面智能化的基礎(chǔ)和關(guān)鍵一步,我對(duì)這一點(diǎn)深信不疑。

ES:我看過(guò) World Labs 的演示。你為什么想研究空間智能并構(gòu)建這些 3D 世界?

李飛飛:我認(rèn)為空間智能是視覺(jué)智能的發(fā)展方向。如果我們真的要解決視覺(jué)問(wèn)題,并將其與做某些事聯(lián)系起來(lái),有一個(gè)非常簡(jiǎn)單、一目了然的事實(shí):世界是 3D 的。我們生活的世界不是平面的。我們的物理智能體,無(wú)論是機(jī)器人還是設(shè)備,都將生活在 3D 世界中。就連虛擬世界也變得越來(lái)越 3D 化。如果你與藝術(shù)家、游戲開(kāi)發(fā)者、設(shè)計(jì)師、建筑師和醫(yī)生交談,即使他們是在虛擬世界中工作,其中大部分也是 3D 的。如果你能靜下心來(lái),認(rèn)清這個(gè)簡(jiǎn)單而深刻的事實(shí),那么毫無(wú)疑問(wèn),破解 3D 智能問(wèn)題就是根本所在。

ES:我很好奇 World Labs 展示的場(chǎng)景是如何保持物體的持久性和遵守物理定律的。這感覺(jué)像是一個(gè)令人興奮的進(jìn)步,因?yàn)橄?Sora 這樣的視頻生成工具仍然在摸索這些東西。

李飛飛一旦你認(rèn)同了世界的 3D 性,很多事情就自然而然地發(fā)生了。例如,在我們發(fā)布在社交媒體上的一個(gè)視頻中,籃球被投放到一個(gè)場(chǎng)景中。因?yàn)樗?3D 的,所以你可以擁有這種能力。如果場(chǎng)景只是 2D 生成的像素,籃球?qū)o(wú)處可去。

ES:或者,就像在 Sora 中一樣,它可能會(huì)出現(xiàn)在某個(gè)地方,但隨后就消失了。在嘗試推進(jìn)這項(xiàng)技術(shù)的過(guò)程中,你們面臨的最大技術(shù)挑戰(zhàn)是什么?

李飛飛:沒(méi)有人解決過(guò)這個(gè)問(wèn)題,對(duì)吧?這非常非常難。在 World Labs 的演示視頻中,你可以看到我們用一幅梵高的畫(huà),以統(tǒng)一的風(fēng)格生成了它周?chē)恼麄€(gè)場(chǎng)景:藝術(shù)風(fēng)格、燈光,甚至街區(qū)會(huì)有什么樣的建筑。如果你轉(zhuǎn)過(guò)身去,它就變成了摩天大樓,那就完全沒(méi)有說(shuō)服力了。它必須是 3D 的。你必須在其中導(dǎo)航。因此,它不僅僅是像素。

ES:你能說(shuō)說(shuō)你用來(lái)訓(xùn)練它的數(shù)據(jù)嗎?

李飛飛:很多。

ES:你在算力負(fù)擔(dān)方面是否面臨技術(shù)挑戰(zhàn)?

李飛飛算力需求很大。這是公共部門(mén)無(wú)法負(fù)擔(dān)的。這也是我很高興能夠以私營(yíng)部門(mén)的方式來(lái)做這件事的部分原因。這也是我一直推動(dòng)公共部門(mén)算力訪問(wèn)的部分原因,我的親身經(jīng)歷強(qiáng)調(diào)了創(chuàng)新與充足資源的重要性。

ES:如果能賦予公共部門(mén)權(quán)力就更好了,因?yàn)楣膊块T(mén)通常更愿意為自己和人類(lèi)的利益而獲得知識(shí)。

李飛飛知識(shí)的發(fā)現(xiàn)需要資源的支持。在伽利略時(shí)代,是最好的望遠(yuǎn)鏡讓天文學(xué)家觀測(cè)到了新的天體。是胡克(Robert Hooke)意識(shí)到放大鏡可以改進(jìn)成顯微鏡,并發(fā)現(xiàn)了細(xì)胞。每當(dāng)有新的技術(shù)工具出現(xiàn),都有助于知識(shí)的探尋。而現(xiàn)在,在人工智能時(shí)代,技術(shù)工具涉及算力和數(shù)據(jù)。對(duì)于公共部門(mén)來(lái)說(shuō),我們必須認(rèn)識(shí)到這一點(diǎn)。

ES:假設(shè)我們可以讓人工智能系統(tǒng)真正理解 3D 世界,這將給我們帶來(lái)什么?

李飛飛它將為人們釋放大量的創(chuàng)造力和生產(chǎn)力。我想用一種更高效的方式來(lái)設(shè)計(jì)我的房子。我知道很多醫(yī)學(xué)用途都涉及到理解一個(gè)非常特殊的 3D 世界,也就是人體。我們總是在談?wù)撐磥?lái)人類(lèi)將創(chuàng)造機(jī)器人來(lái)幫助我們,但機(jī)器人在 3D 世界中導(dǎo)航,它們需要空間智能作為大腦的一部分。我們還討論了虛擬世界,它將允許人們參觀地方、學(xué)習(xí)概念或娛樂(lè)。這些都使用 3D 技術(shù),尤其是混合技術(shù),我們稱(chēng)之為 AR。我想帶著一副眼鏡穿過(guò)公園,它能告訴我關(guān)于樹(shù)木、小路和云的信息。我也想通過(guò)空間智能學(xué)習(xí)不同的技能。

ES:什么樣的技能?

李飛飛:我舉一個(gè)簡(jiǎn)單的例子,如果我在高速公路上爆胎了,我該怎么辦?現(xiàn)在,我需要打開(kāi)一個(gè)“如何換輪胎”的視頻。但如果我能戴上眼鏡,看到我的車(chē)發(fā)生了什么,然后在指導(dǎo)下完成這個(gè)過(guò)程,那就太酷了。你還可以考慮烹飪,你可以考慮雕刻——有趣的事情。

ES:你認(rèn)為在我們有生之年,我們還能在這方面走多遠(yuǎn)?

李飛飛我認(rèn)為這將在我們的有生之年發(fā)生,因?yàn)榧夹g(shù)進(jìn)步的步伐非???/strong>。你們已經(jīng)看到了過(guò)去 10 年帶來(lái)的變化。這無(wú)疑預(yù)示著接下來(lái)會(huì)發(fā)生什么。

文章來(lái)源:學(xué)術(shù)頭條

責(zé)編: 集小微
來(lái)源:學(xué)術(shù)頭條 #AI教母# #李飛飛# #ImageNet#
THE END
關(guān)閉
加載

PDF 加載中...

中日韩中文字幕无码一本| 女人18片毛片。| 波多野吉衣一区在线观看| 大肉棒操小骚穴视频| 国产精品免费久久久久久| 黑丝美女被操哭边操边尿| 亚洲精品精品精国产| 骚女性爱视频在线看| 久久精品欧美精品免费观看| 18岁以下禁看美女的胸| 区国产精品搜索视频| 欧美亚洲熟妇视频在线观看| 大鸡巴插入骚穴在线观看| 一级特黄大片色欧美精品| 西西大尺度无码免费视频| 我要看成人免费毛片| 美女骚逼被操出白浆| 蜜臀av一区二区三区免费观| 亚洲欧洲综合成人综合网| AV无码超清破解版流出| 咪咪爱一级特黄大片| 大鸡巴抽插小骚逼视频免费| 久久久国产系列丝袜熟女| 国产精品久久久69粉嫩| 大胸瑟瑟黑丝午夜| 久久久久久久久黄片观看| 一区二区三区亚洲av| 男女真人牲交高潮全过程| 24日本精品视频免费| 成人高清在线播放一区二区三区| 一个色综合色综合色综合| 鸡巴插进缝里 日本| 亚洲精品一区二区精华液| 国产女明星一级毛片| 精品久久av免费一区二区三区| 欧美精品第15页| 日本福利一区二区视频| 久久久久亚洲精品无码系列| 亚洲人成在线不卡网| 爱男爽高潮鸡穴视频| 91在线一区二区|