快手自研視頻生成大模型「可靈」開放測試

2024.06.10

中國北京,2024年6月10日 - 領先的內容社區及社交平台,快手科技(香港聯交所港幣櫃檯股票代碼:01024/人民幣櫃檯股票代碼:81024)(與其附屬公司及合併聯屬實體合稱「快手」),近期推出了視頻生成大模型-可靈大模型(以下簡稱「可靈」)。該模型是由快手自研打造的視頻生成大模型,能夠生成大幅度的合理運動,還能模擬物理世界特性。借助這些能力,可靈有能力根據描述文字生成有複雜運動規律和物理特性的,和實拍難以區分的高質量AI視頻。此外,可靈具備強大的概念組合能力和想象力。可靈能生成時長高達2分鐘的超長視頻(幀率30fps),分辨率高達1080p,且支持多種寬高比。

可靈使用了DiT架構,快手還對模型中的隱空間編/解碼、時序建模等模塊進行了升維處理。在隱空間編/解碼上,快手自研了3D VAE網絡,實現時空同步壓縮,獲得了較高的重建質量,在訓練性能和效果之間取得了極佳平衡。在時序信息建模上,快手設計了一款計算高效的全注意力機制作為時空建模模塊。該方法可以巧妙地融合時間與空間的信息,能對視頻數據進行綜合分析和處理,可精准捕捉到視頻幀內的局部空間特徵以及跨幀的時間動態特徵,從而更全面地理解和再現視頻中的運動信息。因此,從快速移動的物體、劇烈變化的場景,到複雜的人物動作,可靈都能精確捕捉,生成的視頻內容動態性十足,同時具有很高的物理世界真實感。

目前可靈大模型已在快手於中國推出的視頻編輯軟件-快影APP中正式開啟邀測,用戶可在快影中註冊並申請可靈的測評資格。用戶也可前往可靈官網http://kling.kuaishou.com/,獲取更多信息並觀看AI視頻示例。

隨著AI大模型時代來臨,作為全球頭部短視頻公司,快手已在AI領域展開全面佈局,AI大模型在快手有豐富的應用場景,能與快手內容生態和商業生態有機融合。快手已先後發佈1,750億參數規模的通用大語言模型“快意”和文生圖大模型產品“可圖”。此次可靈大模型的發佈展現了快手持續加速大模型研發與應用的決心,力求為創作者和用戶帶來更加多元的AI創作與互動體驗。

關於快手

快手作為領先的內容社區及社交平台,其使命是成為全球最痴迷於為客戶創造價值的公司。快手堅持不懈,專注為客戶提供服務,並通過持續創新和優化其產品與服務為客戶創造價值。在快手,任何用戶都可以通過短視頻和直播來記錄和分享他們的生活,呈現和發揮所長。透過與內容創作者和企業緊密合作,快手提供的產品和服務可滿足用戶自然產生的各種需求,包括娛樂、線上營銷服務、電商、網絡遊戲、在線知識共享等。

前瞻性聲明

除過往事實的陳述外,本新聞稿載有若干前瞻性陳述。前瞻性陳述一般可透過所使用前瞻性詞彙識別,例如「或會」、「可能」、「可」、「可以」、「將」、「將會」、「預期」、「認為」、「繼續」、「估計」、「預計」、「預測」、「打算」、「計劃」、「尋求」或「時間表」。該等前瞻性陳述受風險、不確定因素及假設的影響,可能包括業務展望、財務表現預測、業務計劃預測、發展策略及對我們行業預期趨勢的預測。該等前瞻性陳述是根據本集團現有的資料,亦按本新聞稿刊發之時的展望為基準,在本新聞稿內載列。該等前瞻性陳述是根據若干預測、假設及前提作出,當中許多涉及主觀因素或不受我們控制。該等前瞻性陳述或會證明為不正確及可能不會在將來實現。該等前瞻性陳述涉及大量風險及不明朗因素。鑒於上述風險及不明朗因素,本新聞稿內所載列的前瞻性陳述不應視為董事會或本公司聲明該等計劃及目標將會實現,故投資者不應過於依賴該等陳述。除法律要求的情形外,我們並無責任公開發佈可能反映本新聞稿日期後發生的事件或情況或可能反映意料之外事件的該等前瞻性陳述的任何修訂。

投資者及媒體問詢
快手科技
投資者關係
郵箱:ir@kuaishou.com