可灵 AI 发布 Kling 3.0 模型，开启“AI 导演”工作流

2026-02-05

AI资讯

603 词

快手可灵 (Kling) 正式迈入 3.0 时代，核心突破在于从“生成片段”向“生成剧情”进化，首创“智能分镜”与“视觉思维链”技术，试图解决 AI 视频长久以来的连贯性与叙事难题。

Video 3.0：原生 15 秒 + 智能分镜

AI 导演模式 (Smart Storyboard)：这是本次更新的最大亮点。模型不再只能生成单一镜头，而是具备了“导演思维”。它能根据脚本自动调度景别（如正反打、特写接全景），在单次生成中输出包含多个分镜的连贯片段。
原生音画同步：不再依赖后期配音，模型支持中、英、日、韩、西 5 种语言的口型精准同步，且支持多人场景下的定向发声（指定谁说话）。
时长突破：原生视频生成时长提升至 15 秒（此前主流为 5-10 秒），支持 3-15 秒灵活设置。

Image 3.0：引入“视觉思维链” (vCoT)

推理后绘图：借鉴 LLM 的思维链技术，Image 3.0 在渲染像素前会先进行“视觉思考”，规划构图逻辑和光影布局，从而大幅提升复杂 prompt 的执行准确率。
工业级输出：支持原生 2K/4K 分辨率输出，无需后期超分。
组图模式：新增“连续绘图”能力，支持单图或多图输入，批量生成逻辑连贯、画风统一的系列分镜图，专为影视预演（Pre-viz）设计。

Video 3.0 Omni：全能一致性

音色与形象双重锁定：用户只需上传一段 3-8 秒的视频，模型即可提取并锁定角色的视觉特征与声音特征（Voice Tone），在后续生成中保持高度一致。

昆仑万维发布“天工 Skywork”桌面端：本地化 OS Agent 与多模型聚合

2026-02-04

AI资讯

656 词

此举标志着昆仑万维从单一模型厂商向“AI 操作系统（OS Agent）”平台转型，主打“本地沙盒隐私安全”与“Claude/Gemini 模型聚合”，意在抢占 Windows 生态的系统级办公入口。

本地化 OS Agent 架构：
与传统的网页端对话不同，Skywork Desktop 强调 “不上传云端” 的隐私处理机制。通过本地虚拟机隔离环境（Local VM Isolation），应用可直接读取并解析本地硬盘中的海量文件（Word/PDF/Excel/代码），建立持久化的语义索引，而非单次会话的临时上传。
多模型聚合策略 (Model Aggregation)：
打破了单一自研模型的限制，该客户端集成了 Claude Opus/Sonnet 4.5 和 Gemini 3 Pro 等外部 SOTA 模型（注：基于2026年时间线的模型版本）。提供 “Auto” 模式，根据任务复杂度自动路由选择最适合的模型，或由用户手动指定，实现了“模型自由”。
跨格式工作流自动化：
重点突破了单一文档处理的局限，支持跨文件格式的任务链。例如：
Doc to Excel：从需求文档自动提取要素生成任务追踪表。
Excel to PPT：基于数据表格自动生成周报演示文稿。
Doc/PPT to Website：直接将文档内容转换为网页代码。
商业模式：
采用订阅制（Basic/Plus 会员），直接对标海外的 Claude Cowork，但在 Windows 生态适配上更深入，被官方定位为“Windows 版 Claude Cowork”。

OpenClaw 发布 2026.2.2：强制安全重置与生态清洗

2026-02-04

AI资讯

785 词

OpenClaw 2026.2.2 是针对近期 CVE-2026-25253 RCE 漏洞的强制性安全修复版本。该版本废除所有旧版 Token（Classic Tokens），引入了隔离的浏览器环境，并对充斥着恶意插件的 ClawHub 生态启动了清洗机制。建议所有自托管用户立即更新。

安全重置
Token 强制撤销: 2026.2.2 版本宣布所有旧版“Classic Tokens”失效。这是对 CVE-2026-25253 的彻底响应，该漏洞曾允许攻击者通过恶意链接劫持 WebSocket 连接，实现单次点击远程代码执行 (1-click RCE)。
WebSocket 来源验证: 修复了 Gateway 的 WebSocket Origin 验证逻辑，封堵了跨站 WebSocket 劫持 (CSWSH) 攻击面。
权限收束: 新增了针对 /elevated 权限的会话级开关，默认禁止 Agent 获取宿主机 Root/Admin 权限，除非用户显式开启。
隔离浏览器环境
沙盒化自动化: 引入 openclaw-managed 浏览器配置。Agent 现在可以在一个完全隔离的 Chrome/Brave 配置文件中运行，与用户的个人浏览器数据（Cookie、密码）物理隔离。
功能: 支持确定性的标签页控制、AI 截图 (Snapshot) 及无头模式运行，解决了此前 Agent 直接操作用户主浏览器导致的数据泄露风险。
生态治理
ClawHub 恶意插件: 安全审计公司 Koi Security 在 ClawHub 市场中发现了 341 个恶意 Skill（窃取 SSH 密钥、AWS凭证）。
新机制: 2026.2.2 内置了针对 Skill 的举报与签名验证机制，任何未经验证的 Skill 在安装时将触发高风险警报。
企业级部署
NEAR AI 集成: 官方宣布支持 NEAR AI Cloud 的机密计算环境 (TEE)，允许在加密隔离区运行 OpenClaw，解决了企业用户对数据隐私的顾虑。

OpenAI 独立版 Codex 应用重磅登场

2026-02-03

AI资讯

480 词

OpenAI 正式发布了专为开发者打造的 Codex 独立桌面应用。这标志着 AI 编程工具从单纯的“代码补全”模式，正式向**“多智能体异步协作”转型。在这款应用中，开发者不再是单纯地和 AI “对话”，而是成为了首席架构师**。你可以同时启动多个 AI 智能体（Agents），让它们在后台并行处理不同模块的任务。 💡

🚀 核心功能：打破传统的开发逻辑
根据交叉验证的最新技术细节，Codex 独立版带来了以下突破：

多智能体并行： 内置「工作区」支持，让不同智能体在后台自动重构代码、编写测试用例或修复 Bug，互不干扰。 💻
深层上下文关联： 该应用不再受限于单一文件的视口，而是能够感知整个项目架构，实现跨文件的逻辑推理。
自定义技能（Skills）： 开发者可以将特定框架的开发规范封装成“技能”，让 AI 像资深员工一样熟悉你的项目“黑话”。 🛠️

这次发布最令人兴奋的是，Codex 独立应用将开发者从繁琐的语法细节中解放出来，转向**“任务委派”**模式。这种“指挥中心”式的交互范式，极大地降低了构建复杂软件的门槛。随着多智能体技术的成熟，一个人就是一个技术团队的时代已经真正到来！ 🌈

20260203-221157

最新文章

标签

分类

归档

可灵 AI 发布 Kling 3.0 模型，开启“AI 导演”工作流

Video 3.0：原生 15 秒 + 智能分镜

Image 3.0：引入“视觉思维链” (vCoT)

Video 3.0 Omni：全能一致性

昆仑万维发布“天工 Skywork”桌面端：本地化 OS Agent 与多模型聚合

OpenClaw 发布 2026.2.2：强制安全重置与生态清洗

OpenAI 独立版 Codex 应用重磅登场

最新文章

标签

分类

归档

Video 3.0：原生 15 秒 + 智能分镜

Image 3.0：引入“视觉思维链” (vCoT)

Video 3.0 Omni：全能一致性

搜索文章