可灵 AI 发布 Kling 3.0 模型，开启“AI 导演”工作流

2026-02-05

AI资讯

603 词

快手可灵 (Kling) 正式迈入 3.0 时代，核心突破在于从“生成片段”向“生成剧情”进化，首创“智能分镜”与“视觉思维链”技术，试图解决 AI 视频长久以来的连贯性与叙事难题。

Video 3.0：原生 15 秒 + 智能分镜

AI 导演模式 (Smart Storyboard)：这是本次更新的最大亮点。模型不再只能生成单一镜头，而是具备了“导演思维”。它能根据脚本自动调度景别（如正反打、特写接全景），在单次生成中输出包含多个分镜的连贯片段。
原生音画同步：不再依赖后期配音，模型支持中、英、日、韩、西 5 种语言的口型精准同步，且支持多人场景下的定向发声（指定谁说话）。
时长突破：原生视频生成时长提升至 15 秒（此前主流为 5-10 秒），支持 3-15 秒灵活设置。

推理后绘图：借鉴 LLM 的思维链技术，Image 3.0 在渲染像素前会先进行“视觉思考”，规划构图逻辑和光影布局，从而大幅提升复杂 prompt 的执行准确率。
工业级输出：支持原生 2K/4K 分辨率输出，无需后期超分。
组图模式：新增“连续绘图”能力，支持单图或多图输入，批量生成逻辑连贯、画风统一的系列分镜图，专为影视预演（Pre-viz）设计。

音色与形象双重锁定：用户只需上传一段 3-8 秒的视频，模型即可提取并锁定角色的视觉特征与声音特征（Voice Tone），在后续生成中保持高度一致。