可灵3.0系列模型全面上线 开启“人人皆可当导演”的新时代
香港,2026年2月5日 -- 领先的内容社区及社交平台快手科技(“快手”或“公司”;港币柜台股份代号:01024 / 人民币柜台股份代号:81024)宣布,可灵AI于2月5日正式全球上线3.0系列模型,包括可灵视频3.0、可灵视频3.0 Omni及可灵图片3.0、可灵图片3.0 Omni模型,为创作者带来更强大的叙事控制力和更高的 AI 视频生成一致性。该系列模型在一致性、照片级真实输出、最长 15 秒视频时长,以及多语言、方言与口音的原生音频生成方面实现了重大升级。
可灵3.0系列模型基于All-in-One产品理念构建,支持涵盖文本、图像、音频和视频的全模态输入与输出,将视频的理解、生成和编辑整合到一个高效、流畅的 AI 工作流中。模型将多项任务(包括文本转视频、图像转视频、参考转视频以及视频内编辑)统一融入单一的原生多模态架构,使其能够遵循复杂叙事逻辑、实现精准镜头控制,并保持极高的提示遵循度。
可灵视频3.0:电影级叙事与精准掌控
视频3.0版本通过改进元素一致性进一步提升创作控制,允许创作者上传参考视频和多张图像参考,确保人物、物体和场景在各帧间保持视觉连贯。
可灵视频3.0 全球首创“图生视频 + 主体参考”技术
其核心功能包括:
多语言与方言原生音频:模型支持生成中文、英文、日文、韩文、西班牙文以及多种英语口音和中国方言。它还能制作复杂的多角色对话场景,每个角色可使用不同语言,用户可精准控制内容、语调和发言顺序。
延长视频时长:视频 3.0 支持最长 15 秒的视频生成。更长的时长意味着模型能够处理复杂的序列,包括长镜头和多重剧情转折,并实现平滑、电影般的过渡。
智能多镜头叙事:视频 3.0 理解多场景、多镜头的指令,动态调整机位角度和镜头,以匹配创作方向——从经典的正反打对话到高级的交叉剪辑对话与旁白。
图像中文本更好保留:模型能够高精度保留或生成文本(如标志、字幕、品牌元素)。这对电商广告等场景尤为宝贵,例如角色穿着品牌T恤时,logo 在整个视频中保持清晰可读。
照片级真实输出:视频 3.0 可生成具有生动表情和动态表演的逼真人物,提升整体真实感。
可灵视频3.0 Omni:全能参考与极致一致性
基于可灵视频 O1 的元素构建功能,视频 3.0 Omni版本提供先进的基于参考的生成,实现无与伦比的一致性。创作者可上传参考视频,让 AI 提取人物的视觉特征和声音特征,并在全新场景中忠实复现。
全新 视频 3.0 Omni 模型还推出多镜头故事板功能,允许用户在故事板中为每个镜头指定时长、镜头大小、视角、叙事内容以及镜头运动,生成专业级镜头。
可灵视频3.0 Omni自定义分镜
可灵图片3.0 Omni:超高清视觉与电影级真实感
可灵AI同时推出可灵图片3.0及可灵图片3.0 Omni模型,均支持 2K 和 4K 超高清输出,适用于从虚拟场景可视化到完整专业场景生成。该模型展现出非凡的真实感,以惊人精度和一致性保留纹理、光影以及材质品质。
可灵3.0 系列模型建立在全新推出的 可灵O1 和 2.6 系列基础上,体现了多模态视觉语言框架,从基础视频生成向复杂专业编排的决定性进化,在叙事精度、输出质量和电影级控制方面带来实质性进步。可灵3.0系列模型现已向 Ultra 订阅用户提供独家早期访问权限,并即将向公众开放。
自 2024 年 6 月推出以来,可灵AI 现已服务全球超过 6000 万创作者,累计生成超过 6 亿条视频,并与超过 3 万家企业客户建立合作关系。其应用覆盖电影和广告行业,加速故事板与产品概念的可视化,并优化从动画、电脑生成影像到全新视觉创作的生产流程。
可灵3.0 的亮相标志着 AI 角色从单纯生成工具向智能创意伙伴的根本转变——它能够理解艺术意图,将想法转化为现实,开启“人人皆可将想法拍成电影”的新时代。
有关视频3.0的更多信息,请访问: https://app.klingai.com/global/release-notes/whbvu8hsip?type=dialog
有关图片3.0的更多信息,请访问:: https://app.klingai.com/global/release-notes/rz3idhopum?type=dialog
关于快手
快手作为中国乃至全球领先的内容社区及社交平台,致力于成为全球最痴迷于为客户创造价值的公司。作为一家以人工智能为核心驱动和技术依托的科技公司,快手专注于通过持续的技术创新和产品升级,不断丰富服务和应用场景,为客户创造价值。在快手,用户通过短视频和直播来记录和分享他们的生活,发现所需,发挥所长。通过与内容创作者和企业紧密合作,快手提供的技术、产品和服务可满足用户的多元化的需求,包括娱乐、线上营销服务、电商、本地生活、游戏等。
前瞻性声明
除过往事实的陈述外,本新闻稿载有若干前瞻性陈述。前瞻性陈述一般可透过所使用前瞻性词汇识别,例如"或会"、"可能"、"可"、"可以"、"将"、"将会"、"预期"、"认为"、"继续"、"估计"、"预计"、"预测"、"打算"、"计划"、"寻求"或"时间表"。该等前瞻性陈述受风险、不确定因素及假设的影响,可能包括业务展望、财务表现预测、业务计划预测、发展策略及对我们行业预期趋势的预测。该等前瞻性陈述是根据本集团现有的资料,亦按本新闻稿刊发之时的展望为基准,在本新闻稿内载列。该等前瞻性陈述是根据若干预测、假设及前提作出,当中许多涉及主观因素或不受我们控制。该等前瞻性陈述或会证明为不正确及可能不会在将来实现。该等前瞻性陈述涉及大量风险及不明朗因素。鉴于上述风险及不明朗因素,本新闻稿内所载列的前瞻性陈述不应视为董事会或本公司声明该等计划及目标将会实现,故投资者不应过于依赖该等陈述。除法律要求的情形外,我们并无责任公开发布可能反映本新闻稿日期后发生的事件或情况或可能反映意料之外事件的该等前瞻性陈述的任何修订。
投资者及媒体问询
快手科技
投资者关系
邮箱:ir@kuaishou.com