快手自研视频生成大模型“可灵”开放测试

2024.06.10

中国北京,2024年6月10日 - 领先的内容社区及社交平台,快手科技(香港联交所港币柜台股票代码:01024/人民币柜台股票代码:81024)(与其附属公司及合并联属实体合称“快手”),近期推出了视频生成大模型-可灵大模型(以下简称“可灵”)。该模型是由快手自研打造的视频生成大模型,能够生成大幅度的合理运动,还能模拟物理世界特性。借助这些能力,可灵有能力根据描述文字生成有复杂运动规律和物理特性的,和实拍难以区分的高质量AI视频。此外,可灵具备强大的概念组合能力和想象力。可灵能生成时长高达2分钟的超长视频(帧率30fps),分辨率高达1080p,且支持多种宽高比。

可灵使用了DiT架构,快手还对模型中的隐空间编/解码、时序建模等模块进行了升维处理。在隐空间编/解码上,快手自研了3D VAE网络,实现时空同步压缩,获得了较高的重建质量,在训练性能和效果之间取得了极佳平衡。在时序信息建模上,快手设计了一款计算高效的全注意力机制作为时空建模模块。该方法可以巧妙地融合时间与空间的信息,能对视频数据进行综合分析和处理,可精准捕捉到视频帧内的局部空间特征以及跨帧的时间动态特征,从而更全面地理解和再现视频中的运动信息。因此,从快速移动的物体、剧烈变化的场景,到复杂的人物动作,可灵都能精确捕捉,生成的视频内容动态性十足,同时具有很高的物理世界真实感。

目前可灵大模型已在快手于中国推出的视频编辑软件-快影APP中正式开启邀测,用户可在快影中注册并申请可灵的测评资格。用户也可前往可灵官网http://kling.kuaishou.com/,获取更多信息并观看AI视频示例。

随着AI大模型时代来临,作为全球头部短视频公司,快手已在AI领域展开全面布局,AI大模型在快手有丰富的应用场景,能与快手内容生态和商业生态有机融合。快手已先后发布1,750亿参数规模的通用大语言模型“快意”和文生图大模型产品“可图”。此次可灵大模型的发布展现了快手持续加速大模型研发与应用的决心,力求为创作者和用户带来更加多元的AI创作与互动体验。

关于快手

快手作为领先的内容社区及社交平台,其使命是成为全球最痴迷于为客户创造价值的公司。快手坚持不懈,专注为客户提供服务,并通过持续创新和优化其产品与服务为客户创造价值。在快手,任何用户都可以通过短视频和直播来记录和分享他们的生活,呈现和发挥所长。透过与内容创作者和企业紧密合作,快手提供的产品和服务可满足用户自然产生的各种需求,包括娱乐、线上营销服务、电商、网络游戏、在线知识共享等。

前瞻性声明

除过往事实的陈述外,本新闻稿载有若干前瞻性陈述。前瞻性陈述一般可透过所使用前瞻性词汇识别,例如“或会”、“可能”、“可”、“可以”、“将”、“将会”、“预期”、“认为”、“继续”、“估计”、“预计”、“预测”、“打算”、“计划”、“寻求”或“时间表”。该等前瞻性陈述受风险、不确定因素及假设的影响,可能包括业务展望、财务表现预测、业务计划预测、发展策略及对我们行业预期趋势的预测。该等前瞻性陈述是根据本集团现有的资料,亦按本新闻稿刊发之时的展望为基准,在本新闻稿内载列。该等前瞻性陈述是根据若干预测、假设及前提作出,当中许多涉及主观因素或不受我们控制。该等前瞻性陈述或会证明为不正确及可能不会在将来实现。该等前瞻性陈述涉及大量风险及不明朗因素。鉴于上述风险及不明朗因素,本新闻稿内所载列的前瞻性陈述不应视为董事会或本公司声明该等计划及目标将会实现,故投资者不应过于依赖该等陈述。除法律要求的情形外,我们并无责任公开发布可能反映本新闻稿日期后发生的事件或情况或可能反映意料之外事件的该等前瞻性陈述的任何修订。

投资者及媒体问询
快手科技
投资者关系
邮箱:ir@kuaishou.com