603 词

快手可灵 (Kling) 正式迈入 3.0 时代,核心突破在于从“生成片段”向“生成剧情”进化,首创“智能分镜”与“视觉思维链”技术,试图解决 AI 视频长久以来的连贯性与叙事难题。
可灵正式迈入 3.0 时代!All in One, One for All!持续开放中-0001

Video 3.0:原生 15 秒 + 智能分镜

  • AI 导演模式 (Smart Storyboard):这是本次更新的最大亮点。模型不再只能生成单一镜头,而是具备了“导演思维”。它能根据脚本自动调度景别(如正反打、特写接全景),在单次生成中输出包含多个分镜的连贯片段。
  • 原生音画同步:不再依赖后期配音,模型支持中、英、日、韩、西 5 种语言的口型精准同步,且支持多人场景下的定向发声(指定谁说话)。
  • 时长突破:原生视频生成时长提升至 15 秒(此前主流为 5-10 秒),支持 3-15 秒灵活设置。

Image 3.0:引入“视觉思维链” (vCoT)

  • 推理后绘图:借鉴 LLM 的思维链技术,Image 3.0 在渲染像素前会先进行“视觉思考”,规划构图逻辑和光影布局,从而大幅提升复杂 prompt 的执行准确率。
  • 工业级输出:支持原生 2K/4K 分辨率输出,无需后期超分。
  • 组图模式:新增“连续绘图”能力,支持单图或多图输入,批量生成逻辑连贯、画风统一的系列分镜图,专为影视预演(Pre-viz)设计。

Video 3.0 Omni:全能一致性

  • 音色与形象双重锁定:用户只需上传一段 3-8 秒的视频,模型即可提取并锁定角色的视觉特征声音特征(Voice Tone),在后续生成中保持高度一致。
656 词

此举标志着昆仑万维从单一模型厂商向“AI 操作系统(OS Agent)”平台转型,主打“本地沙盒隐私安全”与“Claude/Gemini 模型聚合”,意在抢占 Windows 生态的系统级办公入口。
20260204-210008

  • 本地化 OS Agent 架构
    与传统的网页端对话不同,Skywork Desktop 强调 “不上传云端” 的隐私处理机制。通过本地虚拟机隔离环境(Local VM Isolation),应用可直接读取并解析本地硬盘中的海量文件(Word/PDF/Excel/代码),建立持久化的语义索引,而非单次会话的临时上传。

  • 多模型聚合策略 (Model Aggregation)
    打破了单一自研模型的限制,该客户端集成了 Claude Opus/Sonnet 4.5Gemini 3 Pro 等外部 SOTA 模型(注:基于2026年时间线的模型版本)。提供 “Auto” 模式,根据任务复杂度自动路由选择最适合的模型,或由用户手动指定,实现了“模型自由”。

  • 跨格式工作流自动化
    重点突破了单一文档处理的局限,支持跨文件格式的任务链。例如:

  • Doc to Excel:从需求文档自动提取要素生成任务追踪表。

  • Excel to PPT:基于数据表格自动生成周报演示文稿。

  • Doc/PPT to Website:直接将文档内容转换为网页代码。

  • 商业模式
    采用订阅制(Basic/Plus 会员),直接对标海外的 Claude Cowork,但在 Windows 生态适配上更深入,被官方定位为“Windows 版 Claude Cowork”。

785 词

OpenClaw 2026.2.2 是针对近期 CVE-2026-25253 RCE 漏洞的强制性安全修复版本。该版本废除所有旧版 Token(Classic Tokens),引入了隔离的浏览器环境,并对充斥着恶意插件的 ClawHub 生态启动了清洗机制。建议所有自托管用户立即更新。
iShot_2026-02-04_20.31.35

  • 安全重置

  • Token 强制撤销: 2026.2.2 版本宣布所有旧版“Classic Tokens”失效。这是对 CVE-2026-25253 的彻底响应,该漏洞曾允许攻击者通过恶意链接劫持 WebSocket 连接,实现单次点击远程代码执行 (1-click RCE)。

  • WebSocket 来源验证: 修复了 Gateway 的 WebSocket Origin 验证逻辑,封堵了跨站 WebSocket 劫持 (CSWSH) 攻击面。

  • 权限收束: 新增了针对 /elevated 权限的会话级开关,默认禁止 Agent 获取宿主机 Root/Admin 权限,除非用户显式开启。

  • 隔离浏览器环境

  • 沙盒化自动化: 引入 openclaw-managed 浏览器配置。Agent 现在可以在一个完全隔离的 Chrome/Brave 配置文件中运行,与用户的个人浏览器数据(Cookie、密码)物理隔离。

  • 功能: 支持确定性的标签页控制、AI 截图 (Snapshot) 及无头模式运行,解决了此前 Agent 直接操作用户主浏览器导致的数据泄露风险。

  • 生态治理

  • ClawHub 恶意插件: 安全审计公司 Koi Security 在 ClawHub 市场中发现了 341 个恶意 Skill(窃取 SSH 密钥、AWS凭证)。

  • 新机制: 2026.2.2 内置了针对 Skill 的举报与签名验证机制,任何未经验证的 Skill 在安装时将触发高风险警报。

  • 企业级部署

  • NEAR AI 集成: 官方宣布支持 NEAR AI Cloud 的机密计算环境 (TEE),允许在加密隔离区运行 OpenClaw,解决了企业用户对数据隐私的顾虑。

480 词

OpenAI 正式发布了专为开发者打造的 Codex 独立桌面应用。这标志着 AI 编程工具从单纯的“代码补全”模式,正式向**“多智能体异步协作”转型。在这款应用中,开发者不再是单纯地和 AI “对话”,而是成为了首席架构师**。你可以同时启动多个 AI 智能体(Agents),让它们在后台并行处理不同模块的任务。 💡

🚀 核心功能:打破传统的开发逻辑
根据交叉验证的最新技术细节,Codex 独立版带来了以下突破:

  • 多智能体并行: 内置「工作区」支持,让不同智能体在后台自动重构代码、编写测试用例或修复 Bug,互不干扰。 💻
  • 深层上下文关联: 该应用不再受限于单一文件的视口,而是能够感知整个项目架构,实现跨文件的逻辑推理。
  • 自定义技能(Skills): 开发者可以将特定框架的开发规范封装成“技能”,让 AI 像资深员工一样熟悉你的项目“黑话”。 🛠️

这次发布最令人兴奋的是,Codex 独立应用将开发者从繁琐的语法细节中解放出来,转向**“任务委派”**模式。这种“指挥中心”式的交互范式,极大地降低了构建复杂软件的门槛。随着多智能体技术的成熟,一个人就是一个技术团队的时代已经真正到来! 🌈

20260203-221157