可灵 AI 发布 Kling 3.0 模型,开启“AI 导演”工作流

603 词

快手可灵 (Kling) 正式迈入 3.0 时代,核心突破在于从“生成片段”向“生成剧情”进化,首创“智能分镜”与“视觉思维链”技术,试图解决 AI 视频长久以来的连贯性与叙事难题。
可灵正式迈入 3.0 时代!All in One, One for All!持续开放中-0001

Video 3.0:原生 15 秒 + 智能分镜

  • AI 导演模式 (Smart Storyboard):这是本次更新的最大亮点。模型不再只能生成单一镜头,而是具备了“导演思维”。它能根据脚本自动调度景别(如正反打、特写接全景),在单次生成中输出包含多个分镜的连贯片段。
  • 原生音画同步:不再依赖后期配音,模型支持中、英、日、韩、西 5 种语言的口型精准同步,且支持多人场景下的定向发声(指定谁说话)。
  • 时长突破:原生视频生成时长提升至 15 秒(此前主流为 5-10 秒),支持 3-15 秒灵活设置。

Image 3.0:引入“视觉思维链” (vCoT)

  • 推理后绘图:借鉴 LLM 的思维链技术,Image 3.0 在渲染像素前会先进行“视觉思考”,规划构图逻辑和光影布局,从而大幅提升复杂 prompt 的执行准确率。
  • 工业级输出:支持原生 2K/4K 分辨率输出,无需后期超分。
  • 组图模式:新增“连续绘图”能力,支持单图或多图输入,批量生成逻辑连贯、画风统一的系列分镜图,专为影视预演(Pre-viz)设计。

Video 3.0 Omni:全能一致性

  • 音色与形象双重锁定:用户只需上传一段 3-8 秒的视频,模型即可提取并锁定角色的视觉特征声音特征(Voice Tone),在后续生成中保持高度一致。