123,123,123

阿里領(lǐng)投2.9億美元研發(fā)新型AI模型

訊石光通訊網(wǎng) 2026/4/15 9:47:51

ICC訊 阿里巴巴云正在投資一種新型人工智能，旨在使用與OpenAI的ChatGPT等聊天機器人不同的方法來更好地模擬現(xiàn)實世界。

這一轉(zhuǎn)變認識到主要基于文本訓練的大語言模型的局限性。開發(fā)者開始更多地關(guān)注基于視頻和真實物理場景構(gòu)建的“世界模型”。

為了趕上這一趨勢，阿里巴巴領(lǐng)投了生數(shù)科技（ShengShu）20億元人民幣（約2.9億美元）的投資，該公司是AI視頻生成工具Vidu背后的初創(chuàng)企業(yè)。好未來和百度風投也參與了此次B輪融資。生數(shù)科技于4月9日宣布了這一消息。

投資背景

這筆投資發(fā)生在大約兩個月前，當時生數(shù)科技剛剛從啟明創(chuàng)投和其他投資方那里籌集了6億元人民幣。該初創(chuàng)公司拒絕透露其估值。

生數(shù)科技表示，最新融資將用于支持“通用世界模型”的開發(fā)，該模型利用人工智能連接兩個目前相互獨立的領(lǐng)域：一個是游戲和AI生成視頻的數(shù)字世界，另一個是自動駕駛和機器人的物理世界。

成立三年的生數(shù)科技在一份聲明中表示：“生數(shù)科技相信，基于視覺、聽覺和觸覺等多模態(tài)數(shù)據(jù)構(gòu)建的通用世界模型，比大語言模型更自然地捕捉物理世界的工作方式?！?

生數(shù)科技創(chuàng)始人朱軍在聲明中補充說：“我們的目標是連接感知和行動”，讓人工智能系統(tǒng)能夠更好地建模并一致地預測現(xiàn)實世界的行為。

根據(jù)Artificial Analysis的數(shù)據(jù)，生數(shù)科技最新發(fā)布的Vidu Q3 Pro模型（1月發(fā)布）在從文本和圖像生成視頻的AI模型中排名前十。該公司在全球范圍內(nèi)推出了Vidu，比OpenAI廣泛提供現(xiàn)已關(guān)閉的Sora工具早了幾個月。中國短視頻公司快手和字節(jié)跳動也發(fā)布了類似的AI視頻生成競爭工具。

世界模型競賽

阿里巴巴擴大了對相關(guān)初創(chuàng)企業(yè)的投資。這家中國科技巨頭和百度風投上個月共同領(lǐng)投了Tripo AI的5000萬美元投資。Tripo AI是一個利用AI從照片中快速生成數(shù)字3D模型的平臺。Tripo表示，它也在遠離語言模型使用的技術(shù)，轉(zhuǎn)向基于物理空間的人工智能工具，并正在開發(fā)自己的世界模型。

去年9月，阿里巴巴還領(lǐng)投了PixVerse的6000萬美元投資。PixVerse在今年早些時候發(fā)布了一個AI世界模型，允許用戶在視頻生成過程中控制視頻的展開方式。

起家于電商的阿里巴巴還發(fā)布了免費的開源AI視頻生成模型，并在2月份發(fā)布了一個用于驅(qū)動機器人的模型。

生數(shù)科技4月9日表示，它與開發(fā)具身智能（與物理世界互動的人形機器人等系統(tǒng)）的公司建立了戰(zhàn)略合作伙伴關(guān)系，應用于工業(yè)、商業(yè)和家庭環(huán)境。

未來展望

美國科技雜志《連線》的聯(lián)合創(chuàng)始人Kevin Kelly上個月在他的Substack上寫道，世界模型對機器人技術(shù)至關(guān)重要，因為該技術(shù)需要的不只是大語言模型。

Kelly表示，最終，要復制人類智能，AI需要三樣東西：推理能力、對物理世界的理解以及持續(xù)學習能力。他說，雖然用于學習類別的AI尚未開發(fā)出來，但基于大語言模型的聊天機器人已經(jīng)創(chuàng)造了知識元素，這使得世界模型成為需要突破的關(guān)鍵領(lǐng)域。