每日AI快讯热闻

AI快讯 2026-04-05

3月31·周二

爱诗科技推出AI视频模型PixVerse V6

爱诗科技”拍我AI闪电发布周”首日推出PixVerse V6。新版本在人物真实感、复杂运动、物理模拟与声画协同等方面全面升级，生成时长最长可达15秒。PixVerse V6重点优化人物皮肤纹理与情绪表达，增强高速运动场景稳定性与物理属性模拟，支持镜头间运动惯性与光影连贯性，降低创作门槛，可通过简短提示词生成复杂特效。来源：爱诗科技 AIsphere

「Kimi 开放平台」官网域名更新了

Kimi开放平台官网域名更新，即日起用户可通过 platform.kimi.com 访问Kimi开放平台，使用Kimi API创建应用。用户可像之前一样正常登录和使用，无需额外操作。来源：Kimi开放平台

3月30·周一

昆仑万维推出”天工AIGC全家桶”三大核心模型

昆仑万维在2026中关村论坛发布”天工AIGC全家桶”三大核心模型：Matrix-Game 3.0游戏世界模型、SkyReels V4视频模型、Mureka V9音乐模型，均跻身世界第一梯队。同时发布”3+1″战略，以4个SOTA大模型为底座，支撑DramaWave短剧、Mureka音乐、猫森学园游戏三大AI原生平台及Skywork超级智能体操作系统。来源：昆仑万维集团

阿里通义推出全模态大模型Qwen3.5-Omni

阿里通义推出Qwen3.5-Omni全模态大模型，在215项音频及音视频任务中取得SOTA，全面超越Gemini-3.1-Pro。模型采用Thinker-Talker分工架构与Hybrid-MoE技术，原生支持文本、图像、音频及音视频输入，具备细粒度音视频Caption生成能力。新增语义打断、音色克隆、语音控制等实时交互功能，支持256K超长上下文、113种语言识别及10小时音频处理。来源：通义实验室

中国移动推出移动云 MobileClaw 开启公测

中国移动移动云开启桌面级AI办公智能体移动云 MobileClaw公测（3月24日至4月24日）。产品深度兼容OpenClaw生态，依托万卡智算集群打造，主打”本地优先、隐私至上”，核心数据本地存储，对话不上云，适配Windows和Mac系统，支持写代码、做报表、管邮件等全场景办公功能。来源：AI智库

智谱GLM-5.1已面向所有Coding Plan用户开放

智谱宣布GLM-5.1模型已向所有Coding Plan用户（Lite/Pro/Max三档）开放。模型定位代码生成与编程辅助，覆盖从个人开发者到企业团队的多元需求。全面开放标志着智谱在AI编程助手领域的进一步布局，将与GitHub Copilot、Cursor等工具展开竞争。来源：智谱

3月27·周五

谷歌推出Gemini 3.1 Flash Live实时语音模型

谷歌推出Gemini 3.1 Flash Live模型，是其最高质量的实时语音模型，已在Gemini App、Search Live及Google AI Studio开放。模型核心升级包括：语音可直接驱动应用开发（vibe coding），上下文窗口扩大2倍，支持200+国家多语言实时交互。在ComplexFuncBench音频测试中函数调用准确率达90.8%，显著优于前代。来源：智东西

商汤科技推出商汤输入法AudioClaw和SenseAudio AI语音开放平台

商汤科技于3月27-29日亮相上海全球开发者先锋大会，推出商汤输入法AudioClaw及SenseAudio AI语音开放平台。AudioClaw集成语音输入、AI会议助理、知识库等功能，支持微信接入和语音交互。SenseAudio提供70+精品音色及ASR、TTS、文生图/视频等能力。来源：商汤科技SenseTime

Suno推出 AI 音乐生成模型Suno V5.5

Suno推出Suno V5.5Suno推出Suno V5.5，模型首次引入”个性化资产”体系，推动AI音乐从生成工具迈向创作平台。新增 Voices 声音定制、Custom Models 自定义模型和 My Taste 个性化推荐三大功能。同时优化工作流，支持音轨分离、部分替换等编辑功能，音质与情感表达显著提升。来源：AI智库

字节跳动 Seedance 2.0 正式出海，面向全球多地推出

字节跳动旗下剪映（CapCut）宣布推出CapCut Video Studio，集成Dreamina Seedance 2.0音视频模型正式出海。产品无需时间轴即可在无限画布上完成从构思到导出的全流程视频创作，支持最长15秒视频和6种宽高比，已覆盖非洲、南美、中东和东南亚地区。来源：IT之家

3月26·周四

谷歌推出AI音乐生成模型 Lyria 3 Pro

谷歌推出旗下先进AI音乐生成模型Lyria 3 Pro，较前代在生成结构和长度上大幅提升。模型可精准处理前奏、主歌、副歌、桥段等编曲要素，支持生成最长约3分钟的完整音轨。模型不会直接模仿特定艺术家风格，训练数据仅使用合法授权内容，且所有生成音频均嵌有SynthID数字水印。来源：IT之家

美团龙猫团队开源多模态大模型LongCat-Next

美团龙猫团队推出LongCat-Next多模态模型，核心创新为LoZA稀疏注意力机制。模型支持1M超长上下文，通过智能筛查将50%低重要模块替换为流式稀疏注意力，实现128K解码速度提升10倍、算力节省30%。模型包含Flash-Exp和Flash-Lite两个版本，在长文本任务表现超越Qwen-3。来源：龙猫LongCat

3月25·周三

OpenAI宣布关停Sora，战略转向企业级生产力工具

OpenAI宣布关停Sora视频生成平台，包括App、API及ChatGPT视频功能。关停根本原因是OpenAI为筹备IPO进行的战略收缩，将算力转向下一代模型”Spud”及企业级生产力工具。同时OpenAI刚与迪士尼达成三年IP授权协议并获10亿美元投资意向，现已终止合作。来源：APPSO

阿里在海外推出”企业级龙虾”Accio Work

阿里在海外上线企业级Agent产品Accio Work ，定位”企业版龙虾”。用户只需提出想法，内置的AI Agent团队可7×24小时自动完成选品、采购、建站、运营等全流程，30分钟生成可运营的海外网店。产品支持单个Agent对话或Agent Team群聊模式，可自定义角色与技能，关键操作需用户授权保障安全。来源：量子位

JVS Claw全面开放，无需邀请码快乐养虾

阿里云JVS Claw全面开放公测，用户无需邀请码可访问使用。新版本新增语音输入、5GB专属文件空间、一键修复、Skill开关等功能，支持定时任务管理和Clawbot一键升级。新用户可享7天免费体验，付费版”匠心版”首月低至39元，用户无需购买Mac mini硬件或承担API费用可使用云端OpenClaw服务。来源：阿里云

MiniMax Office Skills：开源一套生产级办公文档引擎

MiniMax宣布开源一套生产级Office文档引擎MiniMax Office Skills，包含Word、Excel、PDF、PPT四大组件，采用MIT协议。方案能解决AI生成文档”能用但不好用”的痛点，确保公式、格式、数据透视表等高级功能完整保留。技术选型上，Word采用.NET OpenXML SDK非python-docx，Excel直接操作XML非openpyxl，换取更高保真度。来源：MiniMax 稀宇科技

3月24·周二

阿里达摩院祭出开源架构CPU王炸：玄铁C950

阿里达摩院推出新一代旗舰RISC-V CPU IP——玄铁C950，SPECint2006基准测试突破70分，成为全球最强RISC-V CPU。产品首次实现RISC-V CPU原生流畅跑通千亿参数大模型（Qwen3、DeepSeek V3），集成4K超宽Vector引擎和Matrix引擎，单核算力达8TFLOPS。来源：智东西

阿里通义推出PrismAudio：声画同频，音效随行

阿里通义实验室推出视频生成音频框架 PrismAudio，专注环境音/音效合成。模型首创将强化学习与思维链结合，通过”分解式思维链”让模型先分析视频内容、时序、音质、空间位置再生成音频，引入四位”老师”（语义、时序、美学、空间）分别打分优化。来源：通义实验室

智象未来推出首个多模态应用“龙虾”产品——HiDreamClaw

智象未来推出首个图片视频原生AI Agent产品HiDreamClaw，已接入旗下创意平台vivago web端面向海外用户开放。产品基于自研超百亿参数HiDream-I1多模态大模型，内置AIGC Skill，支持图片、视频、文字等多模态创作，集成Nano Banana、Veo、Sora等SOTA模型。来源：HiDream智象未来

Meta收编 AI 智能体公司 Dreamer

Meta收购AI创业公司Dreamer及团队，公司由前小米全球副总裁雨果·巴拉等人创立，能帮助用户创建AI智能体。Dreamer团队将加入Meta超级智能实验室，负责AI智能体研发。目前协议条款未披露，但投资方将获得高于投资额的回报，Dreamer保留独立法人实体地位，Meta获得非排他性技术许可。来源：IT之家

3月23·周一

MiniMax Token Plan：全球首个支持全模态模型的订阅计划

MiniMax推出全球首个支持全模态模型的订阅计划Token Plan，在原Coding Plan基础上新增视频、语音、音乐、图像等多模态模型调用能力，一个Key可满足代码编写、内容创作、视频生成等需求。同时推出语音/视频资源包可节省20%成本。来源：MiniMax 稀宇科技

美团开源LongCat-Flash-Prover数学证明模型

美团开源LongCat-Flash-Prover 大模型，采用 5677 亿参数 MoE 架构，专注解决复杂数学证明问题。模型引入混合专家迭代框架，整合 Lean4 与 AST 多阶段严格验证，有效消除幻觉。在 MiniF2F-Test 上取得 97.1% 成绩，PutnamBench 解决 41.5% 问题，两项测试均刷新 SOTA 水平。来源：AI智库

腾讯推出AI设计工具Ardot，即将开启公测

腾讯推出自研AI设计工具Ardot，能帮助设计师从”做图的”回归”设计师”角色。Ardot旨在成为”最懂设计师的小助手”，承担重复性工作，如自动整理图层、智能调整细节，让设计师专注于创意与洞察，实现灵感更快落地。来源：腾讯设计Ardot

百度推出首个国产企业级满血版OpenClaw「DuMate」

百度智能云DuMate（中文名：搭子）正式上线，成为国内首个企业级满血版OpenClaw产品。产品用自然语言为交互入口，支持Word、Excel、PPT等办公软件的原生操作，具备文件智能管理、多源数据分析、办公操作自动化三大核心功能。DuMate内置百度搜索等Skills全家桶能力，支持灵活扩展。来源：百度

微信推出官方龙虾插件微信ClawBot

微信正式推出微信ClawBot插件，支持接入 OpenClaw（龙虾）。用户通过「我-设置-插件」获取安装指令，扫码可将龙虾连接至微信，实现聊天式远程操控。目前插件逐步放量中，需更新至微信最新版本。同时，腾讯云 Lighthouse（含企业版 Claw Pro）、自研 WorkBuddy、本地 QClaw 等也已支持微信通道。来源：腾讯

智谱推出成长型 AI 生命体GLM-Claw

智谱推出GLM-Claw智能体，支持打造一群”懂你的AI虾兵”协助处理各类事务。产品定位为个性化AI助手团队，可协同完成复杂任务，提升用户工作与生活效率。通过多智能体协作机制，实现从单一对话向多任务处理的升级。来源：智谱清言

3月20·周五

Cursor推出AI编程模型Composer 2

Cursor正式推出Composer 2，已在Cursor中上线。模型具备前沿级编码能力，定价为每百万输入token 2.50美元，在智能与成本之间实现最优平衡。在CursorBench测试中，Composer 2性能显著优于前代及竞品；在Terminal-Bench 2.0基准测试中得分61.7%，超越Opus 4.6（58.0%）和Composer 1.5（47.9%）。来源：Cursor

阿里推出Qwen3.5-Max-Preview最新一代旗舰模型预览版

阿里通义千问推出Qwen3.5-Max-Preview 预览版，模型在代码、数学、多语言理解等能力上实现显著提升。作为Qwen3.5系列旗舰模型，采用混合专家（MoE）架构，总参数量达235B，激活参数22B，在保持高效推理的同时实现性能突破。模型支持长达256K tokens的上下文窗口，擅长复杂推理和长文本处理。来源：千问大模型

商汤大装置×大晓机器人×广西产业技术研究院达成三方战略合作

商汤大装置、大晓机器人与广西产业技术研究院达成三方战略合作，共同赋能广西具身智能产业升级。三方将协同构建”算力—数据—模型—场景”四位一体产业闭环，依托”广西—东盟具身智能中试训练场”，打造专属算力调度平台、具身高质量数据集和规模化机器人应用场景，助力广西打造面向东盟的具身智能产业创新高地。来源：商汤科技SenseTime

腾讯QClaw全面开放，无需邀请码下载就能用

腾讯QClaw AI助手正式开启全量公测，无需邀请码即可下载使用。新版本打通微信、企业微信、QQ、飞书、钉钉五大IM平台，率先实现企业微信自动回复消息功能，可总结聊天内容、写文档、订日程等。新增「像素工作室」可视化界面，用像素风格展示AI工作状态；推出可视化定时任务功能，支持周期性任务管理与一键执行。来源：腾讯云

Vidu AI推出ViduClaw「V龙」智能体

生数科技旗下AI视频平台Vidu正式推出ViduClaw「V龙」智能体。产品定位为可商用的一站式AI视频Agent解决方案，支持”一键成片”功能——用户仅需上传一张产品图加一句话描述，或一个参考视频加一张图加一句话，可自动生成15-30秒完整广告片，涵盖分镜脚本、场景拆解、画面与配音同步输出。来源：Vidu AI

3月19·周四

小米推出三款面向面向 Agent 时代的大模型

小米连发三款面向Agent时代的大模型：MiMo-V2-Pro 旗舰基座模型，1T参数/42B激活，1M上下文；MiMo-V2-Omni 全模态Agent基座，融合文本/视觉/语音，支持GUI操作与工具调用；MiMo-V2-TTS 语音合成模型，支持多粒度情感控制、方言与歌声。三者分别以”Healer Alpha”和”Hunter Alpha”代号在OpenRouter匿名测试。来源：小米技术

阶跃星辰推出桌面端AI Agent「StepClaw」

阶跃星辰推出基于OpenClaw深度优化的桌面端AI Agent「StepClaw」，支持Windows和Mac双端，无需服务器和命令行可一键部署。产品接入拥有5000+创作者的「水产市场」生态，提供Skill、插件、触发器等应用资源，支持Agent自主进化、个性化换肤、经验沉淀分享等功能。数据本地存储保障安全，内置安全审查技术拦截恶意代码。来源：阶跃星辰

面壁智能推出开源智能体框架EdgeClaw

面壁智能联合清华大学、OpenBMB社区开源EdgeClaw框架，和开箱即用的智能硬件EdgeClaw Box——专为OPC（一人公司）及数据敏感企业打造。产品通过S1/S2/S3三级隐私路由机制，实现数据本地化处理、自动脱敏上云、断网运行等功能，集成MiniCPM端侧模型，支持零Token消耗处理简单任务。来源：面壁智能

3月18·周三

OpenAI推出GPT-5.4 mini和GPT-5.4 nano，实力逼近满血版

OpenAI最新推出GPT-5.4 mini与GPT-5.4 nano两款轻量级模型，GPT-5.4 mini在SWE-Bench Pro编码基准测试中取得54.4%成绩，比满血版GPT-5.4低3.3个百分点，运行速度较上一代提升2倍，同时支持40万token超长上下文，输入价格仅0.75美元/百万token，输出价格为满血版的三分之一。GPT-5.4 nano定位超轻量任务，价格仅为满血版1/12。来源：新智元

MiniMax推出MiniMax M2.7，开启模型的自我进化

MiniMax推出MiniMax M2.7模型，首次实现模型深度参与自我迭代。模型可构建复杂Agent Harness，通过Agent Teams、复杂Skills等能力完成高度复杂的生产力任务。在软件工程领域，M2.7在SWE-Pro基准测试中得分56.22%接近Opus水平，在VIBE-Pro端到端项目交付中达55.6%。在专业办公领域，GDPval-AA的ELO得分1495为开源最高。来源：MiniMax 稀宇科技

LiblibAI推出专业AI视频创作平台LibTV

LiblibAI推出首个同时面向人类创作者与AI Agent的专业视频创作平台LibTV，平台提供无限画布式工作流，支持剧本解析、分镜管理、角色三视图、多机位生成等20余种专业AI能力，集成豆包、可灵、Kimi等顶级模型。Agent可通过Skill接口调用LibTV，实现一句话生成5分钟短剧、音乐转MV、视频风格复刻等自动化创作。来源：哩布哩布AI

Midjourney推出Midjourney V8模型

Midjourney于3月17日正式推出Midjourney V8 Alpha测试版，带来革命性升级：模型生成速度提升约5倍，提示理解能力显著增强，文本渲染质量大幅改善，图像细节与连贯性全面提升。新增原生2K高清模式和增强连贯性模式，完美兼容V7个性化配置。官方建议采用长提示配合高风格化参数以发挥最佳效果。来源：AI智库

Skywork正式推出云端AI原生助理SkyClaw

昆仑万维旗下Skywork正式推出云端AI原生助理SkyClaw，发布首批六大官方Skills，涵盖Skywork PPT、Document、Excel、Design、Search及Mureka Music Maker，用户可通过GitHub或Clawhub平台调用。SkyClaw基于开源架构OpenClaw深度重构，支持24/7云端持续运行，本地离线也能自动完成任务。来源：昆仑万维集团

百度推出“龙虾”全家桶，手机、电脑、家里都能用

百度AI DAY推出”龙虾”全家桶，全面布局OpenClaw生态。核心产品包括：桌面AI智能体DuMate、手机龙虾应用RedClaw、小度”家用小龙虾”、云端虾DuClaw及安全虾。百度搜索Skill在OpenClaw官方商店下载量超4.5万次，位居全球第一。来源：百度

3月17·周二

科大讯飞正式发布桌面级AI智能助理Loomy

讯飞开放平台推出基于AstronClaw的桌面级智能助理Loomy，产品主打本地办公场景，支持文件整理、数据分析、内容创作等任务，最快1分钟完成部署。Loomy采用”目录级隔离”安全机制，仅访问授权目录，并支持QQ、飞书、钉钉等IM工具远程操控。产品兼容OpenClaw技能体系及MCP协议，支持DeepSeek、MiniMax等主流模型切换。来源：讯飞开放平台

商汤办公小浣熊「技能模板」功能开启内测

商汤办公小浣熊正式推出技能模板内测功能，帮助用户避免重复数据分析工作。用户可创建、保存和复用自定义技能模板，提升办公效率。功能支持将常用分析流程标准化，实现一键调用。目前内测申请已开放，用户可前往官网体验。来源：商汤小浣熊

全球首个企业级Agent平台“悟空”来了

阿里巴巴正式推出全球首个企业级AI原生工作平台”悟空“。平台定位为独立应用，同时内置钉钉，支持连接企业钉钉账号及安全访问权限。悟空主打企业级安全，AI Agent自动继承企业权限规则，所有操作在安全沙箱中运行。来源：阿里巴巴

英伟达推出NemoClaw，全新Rubin算力狂飙35倍

英伟达GTC 2026大会推出”龙虾”NemoClaw——英伟达版OpenClaw，通过安全沙箱和本地模型部署，让企业安全使用AI Agent。老黄豪言2027年芯片营收剑指1万亿美元，宣称OpenClaw将成为”个人AI的操作系统”，开启GaaS新时代。来源：新智元

Manus桌面端推出My Computer功能，支持Mac 和Win系统

Manus桌面端正式推出”My Computer”可支持直接操作用户本地电脑。My Computer功能支持AI从云端沙箱进入本地环境，可读取编辑本地文件、启动应用程序、执行终端命令，实现文件自动整理、本地开发、利用闲置算力等场景。安全方面，每个终端命令都需用户明确批准。目前已支持macOS和Windows系统。来源：AI智库

全球首个自进化个人AI ：MuleRun正式推出

全球首个自进化个人AI产品MuleRun（骡子快跑）正式发布。产品主打”0门槛”使用，无需部署安装，打开网页即可操作。MuleRun具备7×24小时云端持续运行能力，用户离线也能自动执行任务。产品核心特性包括自主进化、主动触达以及群体智慧共享，开放Agent网络生态，优质Agent可一键复用。来源：量子位

3月16·周一

智谱推出GLM-5-Turbo：龙虾增强的基座模型

智谱发布GLM-5-Turbo龙虾增强基座模型，专为OpenClaw Agent场景深度优化。模型在工具调用、指令遵循、定时任务及长链路执行等核心能力上显著增强，在自研ZClawBench评测中获国产模型第一。阿里、字节、美团等互联网大厂内测评价其”精准稳定、长任务不掉链子”。来源：智谱

清华开源 OpenMAIC，国内首个L4级AI课堂

清华大学研究团队开源国内首个L4级AI课堂平台OpenMAIC，平台通过多智能体协作，将PDF、论文等资料自动生成互动式课堂，配备AI老师、助教及虚拟学生角色，实现语音讲解、实时互动、白板标注等功能。教师上传材料，系统可自动解析生成课件、测验及PBL网页，大幅降低备课成本。来源：机器之心

通义推出Fun-CineForge，首个影视级配音多模态大模型

通义实验室开源首个支持影视级配音的多模态模型Fun-CineForge，配套开放高质量数据集构建方法CineDub。模型基于CosyVoice3底层能力，创新引入”时间模态”，融合视觉、文本、音频、时间四种模态，实现口型同步、情绪表达、音色一致和时间对齐四大功能，支持独白、旁白、双人及多人对话场景。来源：通义实验室

阿里云旗下AI Agent产品JVS Claw正式推出移动端App

阿里云旗下AI Agent产品JVS Claw正式推出移动端App，基于开源OpenClaw架构打造，主打”开箱即用、云端隔离”。用户可通过手机App直接”遥控”专属云电脑（6核/12GB Linux环境），让Clawbot自动完成网页编写、数据查询、定时任务等复杂操作，无需接入飞书或QQ等第三方工具。来源：智东西

3月13·周五

InternVL-U重磅开源，4B参数实现理解、推理、生成、编辑一体化

上海人工智能实验室联合多所高校开源多模态一体化模型InternVL-U，仅4B参数即实现理解、推理、生成、编辑四大能力统一。模型采用”统一语境建模+模态专用模块化+解耦视觉表征”架构，在文本渲染、科学推理等复杂场景中性能超越14B级模型，已全面开源并提供完整推理代码与评测工具。来源：书生Intern

大晓机器人开源实时生成世界模型 Kairos 3.0-4B

大晓机器人开源具身原生世界模型Kairos 3.0-4B，以”多模态理解—生成—预测”一体化架构实现物理级深度理解与长时动态交互。模型仅4B参数，推理速度较Cosmos 2.5提升72倍，是行业首个在THOR端侧平台达成1:1.5实时生成的具身世界模型，可直接驱动机器人本体完成作业。来源：大晓机器人

3月12·周四

安全养虾发布！讯飞AstronClaw全面开放

科大讯飞AstronClaw全面开放，基于OpenClaw打造云端AI助手，支持一键部署、沙箱隔离运行保障数据安全。产品接入企业微信、钉钉、飞书等主流IM，内置120+官方Skills并支持调用ClawHub生态10,000+技能，覆盖办公、营销、金融等场景。集成星火X2、Kimi-K2.5、GLM-5等多款旗舰大模型。来源：讯飞开放平台

爱诗科技完成C轮融资，鼎晖领投，全面开启“可玩现实”新纪元

AI视频生成企业爱诗科技宣布完成C轮融资，由鼎晖香港基金、鼎晖VGC、鼎晖百孚领投，中国儒意、三七互娱、亦庄国投、众为资本等国内外多家机构跟投。本轮资金将用于视频基础模型迭代、实时世界模型研发及全球化团队建设。其PixVerse V5.6模型在Artificial Analysis榜单中位列图生视频与文生视频全球第二，全球首发实时世界模型PixVerse R1，用户规模已突破1亿。来源：爱诗科技AIsphere

阶跃AI推出StepClaw一键部署OpenClaw，5 万个免费体验名额

阶跃星辰推出基于OpenClaw打造的云端AI助手”StepClaw“，用户可在阶跃AI APP一键部署，无需自备服务器。产品搭载Step 3.5 Flash模型，提供双核CPU、4GB内存及40GB存储，支持7×24小时云端运行和长期记忆能力。来源：阶跃星辰

安全免配置，威努特WinClaw正式发布

威努特正式发布安全龙虾产品WinClaw，针对OpenClaw存在的安全风险（CNNVD通报82个漏洞，含12个超危漏洞）及配置复杂等问题，构建五层安全防护体系：身份认证双向鉴权、安装审查拦截14类危险模式、消息拦截41条安全规则、执行约束敏感操作二次确认、监控审计本地日志追溯。来源：威努特安全网络

英伟达最强开源权重 AI 模型：Nemotron 3 Super 登场

英伟达发布最强开源权重AI模型Nemotron 3 Super，拥有1200亿参数（MoE架构，推理时仅激活120亿），吞吐量较前代提升5倍，准确率翻倍。模型配备100万Token超长上下文窗口，专为多智能体系统设计，可解决”上下文爆炸”和”推理税”问题。采用Mamba-Transformer混合架构，引入”潜在MoE”新技术，支持多Token预测。来源：IT之家

百度智能云发布全球首款手机龙虾应用：红手指Operator

百度智能云发布全球首款手机龙虾应用”红手指Operator“，已上线安卓市场。应用结合OpenClaw与自研移动端AI Agent能力，用户通过聊天即可指挥手机完成打车、外卖订餐等跨App交互操作，实现”一句话搞定复杂任务”。应用具备深度语义理解、高效执行和精准方案产出能力，可完成信息搜集、定时推送、自动下载等流程。来源：百度

光轮智能完成10亿元融资，全球首个具身数据独角兽诞生

光轮智能完成10亿元A++及A+++轮融资，投资方包括新希望集团、三安光电家族办公室、奥克斯等产业方及建投华科等财务机构，成为全球首个具身数据领域独角兽。公司构建世界-行为-评测三层架构，提供物理仿真、规模化数据生产与模型评测服务，已服务英伟达、谷歌、Figure AI、字节、智元等头部客户，在仿真合成数据、仿真评测、人类视频数据三项能力上实现全球交付冠军。来源：光轮智能

3月11·周三

人类社交网络巨头Meta收购了AI社交网络Moltbook

Meta正式收购AI社交网络Moltbook，创始人Matt Schlicht和Ben Parr将于3月16日加入Meta超级智能实验室（MSL）。Moltbook上线一个多月即吸引19.4万个AI智能体和超200万帖子，曾因”AI自发建立宗教”等话题引发热议，后被揭穿多为人类伪装。Meta看中其智能体验证身份与互联的系统机制，为构建”智能体身份注册表”铺路，以应对AI从聊天工具向自主实体演进的趋势。来源：机器之心

百度智能云发布DuClaw零部署服务！零门槛开启自由“养虾”资

百度智能云发布零部署OpenClaw服务DuClaw，用户无需选择镜像、部署服务器或配置API Key即可即开即用。DuClaw内置百度搜索、百科、学术搜索等百度优势Skills，并支持DeepSeek、Kimi-K2.5等多款主流大模型灵活切换。目前网页端已上线，后续将接入企业微信、钉钉、飞书等应用。来源：百度

谷歌首个原生多模态嵌入模型 Gemini Embedding 2 发布

谷歌发布首个原生多模态嵌入模型Gemini Embedding 2，支持将文本、图像、视频、音频和文档映射到同一嵌入空间，可识别100种语言的语义意图。模型单次请求可处理最多6张图片、120秒视频、6页PDF及直接音频输入，适用于RAG、语义搜索、情感分析和数据聚类等场景。来源：IT之家

AI语音教练平台BoldVoice完成2100万美元A轮融资

AI语音教练平台BoldVoice完成2100万美元A轮融资，由Matrix领投。该公司仅7名员工，下载量突破500万，服务150多个国家，ARR超1000万美元。本轮融资将用于全球扩张及AI新功能开发。来源：AI智库

新加坡MetaComp获数千万美元Pre-A+轮融资

新加坡金融科技公司MetaComp完成数千万美元Pre-A+轮融资，由知名互联网大厂战投及Spark Venture等机构投资，老股东跟投。公司2025年已实现净利润转正，即时流动资金超1亿美元，月支付交易流水超10亿美元，财富在管规模超5亿美元。来源：暗涌Waves

Dify 完成 3000 万美元融资，红杉领投

AI应用开发平台Dify完成3000万美元Pre-A轮融资，由红杉中国领投，GL Ventures、Alt-Alpha Capital、五源资本等跟投。本轮融资将用于提升Agent可靠性、企业级运营管控能力、降低构建门槛及建设开源生态。Dify是一个开源的Agentic Workflow构建平台，提供可视化构建器和生产级工程基础设施，帮助团队快速构建、部署和运维AI工作流。来源：Dify

3月10·周二

智谱发布AutoClaw（澳龙）：国内首个一键安装本地版OpenClaw

智谱正式上线 AutoClaw（中文名”澳龙”），成为国内首个支持一键安装的本地版OpenClaw工具。产品预置50+热门Skills，支持macOS和Windows双平台，1分钟即可完成部署，一键接入飞书等即时通讯工具。AutoClaw内置智谱专为Agent场景优化的Pony-Alpha-2模型（内测中），集成AutoGLM Browser-Use浏览器操作能力，可稳定执行多步骤、跨页面的复杂任务。来源：智谱

腾讯云推出SkillHub，专为中国用户优化的AI技能社区

腾讯云推出SkillHub，专为中国用户优化的OpenClaw AI Skills社区。依托国内高速镜像，解决官方ClawHub下载慢、中文搜索不友好、社区交流不便三大痛点，实现Skill秒速安装。平台提供精选Top 50榜单、8大分类中文搜索及安全审计，收录1.3万个Skills，支持一键复制安装命令，并计划打造开放中文开发者社区。来源：AI智库

火山引擎推出ArkClaw：开箱即用的云上SaaS版OpenClaw

火山引擎正式上线ArkClaw，为用户提供零配置、开箱即用的云端OpenClaw服务，打开网页即可使用7×24小时在线AI助手。产品深度协同Doubao-Seed-2.0系列模型，支持飞书等主流IM工具，内置Skills安全扫描和网盘长效存储。来源：火山引擎

腾讯推出QClaw：一键安装，直接打通微信

腾讯电脑管家推出QClaw，基于OpenClaw打造的本地AI助手，支持Mac和Windows双端，内置Kimi-2.5等模型。核心亮点是零配置直接关联微信，用户可通过微信远程操控电脑完成任务，如处理文档、社媒运营、GitHub项目开发等。数据全部本地存储保障隐私，依托5000+Skills生态，具备持续记忆能力。来源：APPSO

阿里版OpenClaw更名”JVS Claw”，并开启内测

阿里云旗下AI Agent产品”无影JVS”正式更名为”JVS Claw“，目前已推出独立APP和网页版，处于邀请码内测阶段。产品以可定制的Clawbot为核心，搭配6核/12GB独立云端ClawSpace环境，支持实时查看AI操作链路。内置浏览器自动化、Office文档处理等预制技能，用户可通过”技能查找”安装ClawHub新技能，或用自然语言创建自定义技能。来源：AI智库

3月9·周一

腾讯WorkBuddy正式上线：免部署版”小龙虾”AI智能体来了

腾讯旗下全场景AI智能体WorkBuddy正式上线，被称为腾讯版”小龙虾”（OpenClaw）。产品完全兼容OpenClaw技能，但无需复杂部署，下载安装后即可使用，1分钟完成企业微信配置。WorkBuddy内置20多种Skills技能包，支持多窗口、多Agent并行工作，可无缝切换Hunyuan、DeepSeek、GLM等主流模型，并具备企业级安全审计能力。来源：腾讯云

OpenClaw 3.8版本发布：12+安全漏洞修复+三大新功能

OpenClaw团队连夜推出2026.3.8版本。本次更新新增ACP来源识别、openclaw备份机制及Telegram假冒清除三大功能，修复12个以上安全漏洞。同时带来GPT-5.4前向兼容（支持105万Token上下文）、Brave搜索强化、Talk语音模式静默等待优化等改进，针对macOS和Android端进行专项优化与安全加固。来源：机器之心

扣子Coze推出AI Agent中文社区InStreet，全面开放内测

扣子Coze宣布AI Agent中文社区 InStreet 全面开放内测，定位为”OpenClaw养虾第一站”。该社区仅允许Agent发帖互动，人类用户可围观学习。InStreet 提供Skill技能分享、积分排行榜、虚拟炒股竞技场等功能，已积累超1.1万条评论和1.6万点赞。来源：扣子Coze

小红书开源FireRed-Image-Edit v1.1：OOTD元素融合，人像一致性大幅提升

小红书Super Intelligence团队发布图像编辑模型FireRed-Image-Edit 1.1版本，距离1.0发布不到一个月。新版本在ID一致性编辑、多元素融合（支持10余种元素智能组合）、人像美妆（数十种风格）、字体风格参考及老照片修复等方面显著增强。来源：小红书技术REDtech

3月6·周五

OpenAI 最强模型 GPT-5.4 正式登场：原生支持计算机操控

OpenAI正式发布GPT-5.4，首次在单一模型中融合推理、编程、计算机原生交互、深度网页搜索及百万级Token上下文五大能力。模型在GDPval知识工作测试中得分83%，在SWE-Bench Pro编程测试中达57.7%，并在OSWorld计算机操作测试中取得75%成绩，均为业界领先。来源：量子位

阿里开源HiClaw： Team 版 OpenClaw，5分钟完成本地安装

阿里云开源HiClaw，作为OpenClaw的”Team版”升级方案，引入Manager Agent架构实现多Agent协作管理。HiClaw通过AI Gateway集中管理API凭证，解决原生OpenClaw的安全风险；Worker Agent运行在独立容器中，技能与记忆完全隔离。系统内置Matrix服务器和Element客户端，支持移动端随时指挥，无需配置飞书/钉钉机器人。来源：阿里云开发者

VAST完成5000万美元A轮融资，加速构建世界模型与UGC互动内容平台

通用人工智能公司VAST宣布完成5000万美元A轮融资，由阿里、恒旭资本联合领投，元禾璞华、百度风投等跟投，老股东春华创投超额加注。VAST旗下Tripo Studio平台已聚集超650万创作者，累计生成近1亿个3D模型。本轮资金将重点投入世界模型研发与UGC互动内容平台建设。来源：VAST AI

微软开源 Phi-4-Reasoning-Vision-15B 视觉推理模型

微软发布Phi-4-Reasoning-Vision-15B开源模型，采用MIT许可证，是Phi-4系列首个同时具备高分辨率视觉感知与选择性推理能力的小语言模型。模型可根据任务需求在”推理模式”与”非推理模式”间自动切换，数学推理时启用多步思考链，简单OCR任务则直接输出以降低延迟。来源：IT之家

3月5·周四

MiniMax Music 2.5+：解锁你的专属“天空之城”

MiniMax发布Music 2.5+版本，新增纯音乐创作能力。模型支持古典管弦、极简主义、现代电子、氛围音等多元风格，可生成从零乐器自然声到多轨器乐编排的完整作品，适用于冥想、助眠、广告、游戏配乐及影视配乐场景。来源：MiniMax稀宇科技

Perplexity与CoreWeave达成多年战略合作，聚焦AI推理基础设施

AI云服务企业CoreWeave与AI搜索公司Perplexity达成多年期战略合作。Perplexity将利用CoreWeave的云算力资源（包括英伟达GB200 NVL机架系统）运行其AI推理工作负载，CoreWeave则将在内部全面部署Perplexity Enterprise Max订阅。此次合作为Perplexity提供高性能、可靠的AI云平台支持，加速其AI工具和智能体的规模化发展。来源：IT之家

3月4·周三

Flowith 完成千万美元种子轮和种子+轮融资

AI创作平台Flowith宣布完成千万美元种子轮及种子+轮融资，种子轮由祥峰投资等机构参与，种子+轮由红杉中国种子基金、江远投资联合领投。Flowith致力于打造Agentic AI时代的”行动派”操作系统，已推出多线程画布交互、云端无限Agent及首款本地化AI全链路创作助手FlowithOS。来源：Z Potentials

谷歌 Gemini 3.1 Flash-Lite 登场，首字响应提速 2.5 倍

谷歌发布轻量级AI模型Gemini 3.1 Flash-Lite，称其为Gemini 3系列中速度最快、最具成本效益的模型。模型首字响应速度较2.5 Flash提升2.5倍，整体输出速度提升45%，定价为每百万输入Tokens 0.25美元、输出1.50美元。模型在Arena.ai获1432分Elo得分，GPQA Diamond测试达86.9%，多项指标超越前代。来源：IT之家

阶跃星辰 Step 3.5 Flash 预训练/中训练/训练框架全部开源！

阶跃星辰宣布Step 3.5 Flash预训练/中训练/训练框架全部开源，包括Base权重、Midtrain权重及Steptron训练框架。该模型是阶跃迄今能力最强的开源基础模型，具备强大推理与Agent智能，专为Agent而生。来源：阶跃星辰

OpenAI深夜发新模型GPT-5.3 Instant！幻觉率暴降27%

OpenAI正式发布GPT-5.3 Instant模型，针对用户反馈的”过于保守、爱说教”问题进行优化。新模型回答更直击重点，减少冗长限制性说明和拒答行为，幻觉率在联网模式下降低26.8%，非联网模式降低19.7%。来源：智东西

QoderWork 重磅更新 | 正式发布支持 Windows 版

QoderWork正式发布Windows版本，同时推出三大升级：支持标准和旗舰两档模型分级选择，满足不同任务需求；新增预制沙盒环境，在隔离虚拟环境中执行任务，提升稳定性与成功率；上线Skills技能广场，集成文档协作、效率工具、设计UI等主流技能一键安装。来源：Qoder

3月3·周二

阿里千问开源四款 Qwen3.5 小尺寸模型

阿里千问宣布开源4款Qwen3.5小尺寸模型：Qwen3.5-0.8B/2B/4B/9B。该系列采用原生多模态训练和最新架构，覆盖从端侧到服务器的轻量级AI需求。其中0.8B/2B适合移动设备和IoT边缘部署；4B定位为轻量级Agent基座；9B性能媲美gpt-oss-120B。来源：通义实验室

小红书发布并开源端到端文档识别模型：FireRed-OCR

小红书团队发布并开源端到端文档识别模型FireRed-OCR，基于Qwen3-VL架构，首创”三阶段渐进优化”策略与”几何+语义”数据工厂，解决通用VLM处理复杂文档时的”结构性幻觉”问题。模型在权威评测OmniDocBench v1.5中取得端到端方案SOTA，综合评分92.9%领先Gemini-3.0 Pro等模型。来源：小红书技术REDtech

阿里通义语音双模型 Fun-CosyVoice3.5 与 Fun-AudioGen-VD 发布

通义实验室发布两款语音生成模型Fun-CosyVoice3.5与Fun-AudioGen-VD，首创FreeStyle指令控制范式，用户可通过自然语言描述语气、情绪、场景等细节，无需依赖固定标签。Fun-CosyVoice3.5支持多语种复刻与精细化表达控制，新增泰语、印尼语等4个小语种，生僻字读错率降至5.3%；Fun-AudioGen-VD则实现端到端声音设计，可生成角色化音色并模拟环境声学效果。来源：通义实验室

3月2·周一

美团光年之外AI浏览器Tabbit正式发布，开启智能浏览新体验

Tabbit AI浏览器正式发布，主打”工作交给Tabbit，时间留给自己”理念。产品通过智能代理模式（Agent）实现跨系统数据流转、日常事务托管、深度调研及数据聚合等自动化操作；支持”妙招”快捷指令沉淀工作流，以及无代码脚本定制网页功能。来源：Tabbit浏览器

松延动力宣布完成B轮融资，累计近10亿元，宁德时代领投

人形机器人企业松延动力宣布完成B轮融资，累计规模近10亿元，由宁德时代系晨道资本领投，国科投资、京国盛基金、九合创投等跟投。这是公司第9轮融资，标志着人形机器人行业从技术验证迈向商业化闭环。本轮融资将加速家庭消费场景落地与产业链整合。来源：NOETIX松延动力

再次刷新具身智能单轮融资金额，银河通用拿下 25 亿融资

具身智能公司银河通用宣布完成25亿元新一轮融资，由国家人工智能产业基金（大基金三期）、中国石化、中信投资控股、中国银行、上汽集团等多家国资及产业资本领投，刷新行业单轮融资纪录。本轮国资密集入局，标志着具身智能融资进入”重装时代”。来源：极客公园

2月28·周六

OpenAI获得1100亿美元融资

OpenAI获得新一轮高达1100亿美元的融资，投资方包括亚马逊、英伟达和软银，投资额分别为500亿、300亿和300亿美元。此轮融资前，公司的估值已达到7300亿美元。OpenAI还与亚马逊建立了战略伙伴关系，并同英伟达就下一代推理计算技术达成了协议。该轮融资预计还将吸引更多金融投资者参与。来源：第一财经

阿里通义 CoPaw 开源！爆改你的专属智能搭档

AgentScope团队宣布其个人智能助理产品CoPaw正式开源，采用Apache 2.0许可协议，支持免费商用。此次开源版本聚焦易用性、本地部署、记忆管理与可扩展性四大方向进行全面升级，核心在于降低使用门槛并打开能力上限。CoPaw现支持通过自定义供应商、Ollama、llama.cpp、MLX等多种方式接入本地或自建模型，实现全链路数据本地化。来源：通义实验室

面壁智能开年获数亿元融资，中国电信领投

面壁智能在2026年农历新年（马年）后完成数亿元融资，由中国电信领投，中信金石、中信私募跟投。中国电信将发挥云网端优势，与面壁智能在“高效大模型”领域的算法落地经验结合，深化业务协同。本轮融资标志着面壁智能正式开启与国家级信息基础设施方的战略合作。来源：面壁智能

Lemon AI获数千万Pre-A轮融资，天际资本独家投资

天际资本近日独家投资了Lemon AI数千万人民币Pre-A轮融资。该公司为企业提供“全栈开源+本地化部署”的AI安全落地方案，企业可在自有Docker环境中调用主流开源大模型，数据不出本地，以解决金融、医疗等行业的数据安全顾虑。来源：钛媒体

2月27·周五

谷歌推出 Nano Banana 2 图像 AI 模型：支持 4K 分辨率输出

Google 旗下 DeepMind 正式发布新一代图像生成模型 Nano Banana 2（Gemini 3.1 Flash Image）。模型在图像质量与生成速度上取得平衡，核心在于利用 Gemini 的知识库与实时网络搜索，大幅提升了对复杂中文提示、空间比例、真实世界常识（如地标、古诗词意境）及多对象一致性的理解能力。来源：APPSO

Skywork AI 正式发布多模态视频基础模型 SkyReels V4

Skywork AI发布全新多模态视频基础模型SkyReels V4。模型采用创新的双流多模态扩散Transformer（MMDiT）架构，是全球首个能同时处理多模态输入、联合生成视频与音频、并统一完成视频生成、修复、编辑三大任务的模型。支持文本、图像、视频、音频、掩码等丰富输入，可输出1080p分辨率、32FPS、长达15秒的高质量音视频同步内容。来源：昆仑万维集团

华为云码道（CodeArts）代码智能体公测版正式发布

华为云在线上发布会上正式发布了华为云码道（CodeArts）代码智能体的公测版。是一个集成代码大模型、IDE与自主开发模式的AI编码解决方案。覆盖代码生成、单元测试、研发知识问答、规范驱动开发等场景，支持IDE、VS Code等多种开发环境。来源：华为云

2月26·周四

MiniMax Agent升级，推出Expert 2.0和MaxClaw两大核心产品

MiniMax发布Agent功能升级，推出Expert 2.0和MaxClaw两大核心产品。Expert 2.0允许用户用自然语言描述创建细分领域的专家Agent，已覆盖技术开发、商业金融等领域，累计创建超1.6万专家。MaxClaw是基于OpenClaw构建的云端AI助手，开箱即用，无需手动部署，为订阅会员提供50G云储存，打通了飞书、钉钉等多个IM渠道。来源：MiniMax稀宇科技

Perplexity Computer 上线：多模型协同自动完成工作流

Perplexity 推出全新聊天界面“Perplexity Computer”，将多种具备自主执行能力的AI模型整合为一套系统。系统基于浏览器运行，可调用来自不同厂商的模型，自主完成包括网络搜索、文档生成、数据处理等在内的完整工作流程。来源：IT之家

自变量机器人宣布已完成数亿元新融资

自变量机器人宣布完成数亿元新融资，由上汽金控、中金上汽基金等领投，老股东跟投。公司成立于2023年，聚焦自研通用具身智能大模型WALL-A，推出了量子一号、量子二号两款机器人本体，其中量子二号拥有高自由度灵巧手。本轮融资将用于深化产业协同，推动具身智能在汽车等场景的落地。来源：智东西

2月25·周三

AI 音乐创作平台 ProducerAI 正式加入Google Labs

谷歌实验室宣布，生成式AI音乐创作平台ProducerAI正式推出。平台深度融合了Gemini、Lyria 3、Veo等大模型，为音乐人提供从作词、编曲到混音的全链路支持。用户通过简单文字指令即可生成不同流派的歌曲，进行后期处理。平台为所有音频输出嵌入了SynthID隐形水印。来源：IT之家

2月24·周二

全球首个面向AI智能体的进化协作平台——EvoMap

全球首个面向AI智能体的进化协作平台EvoMap。通过独创的基因进化协议（GEP），将智能体在任务中积累的成功策略封装为标准化的“基因胶囊”，通过去中心化网络实现全球共享、验证与继承，解决AI智能体生态中“经验孤岛”的痛点。来源：AI智库

千寻智能完成近20亿融资，引领具身基模进化与商业化落地

千寻智能近日完成近20亿元人民币融资，资本方覆盖顶级、产业、国有及战投机构，阵容强大。其开源模型Spirit v1.5在性能上超越了Pi0.5，凭借独特的“数据金字塔”训练理念和低成本数据采集技术，构筑了核心竞争壁垒。来源：千寻智能Spirit AI

10 亿美元融资！李飞飞「世界模型」公司估值 50 亿美元

李飞飞创立的World Labs近期完成10亿美元巨额融资，公司估值飙升至50亿美元。投资者包括Autodesk、英伟达、AMD、a16z等顶级巨头。公司今年1月推出了“World API”，为企业提供大型世界模型的API接入，并与Autodesk等公司展开B2B合作，探索商业化路径。来源：极客公园

智平方又完成5轮B轮系列融资，融资规模超10亿，估值超百亿

智平方宣布完成B轮融资，规模超10亿元人民币，估值超过百亿，一年内累计完成12轮融资，成为融资最快的具身智能企业。本轮融资方阵容强大，百度、中国中车等产业与资本巨头集体加注。来源：智平方科技

Anthropic 推出安全工具 Claude Code Security

Anthropic推出“Claude Code Security”AI代码安全扫描工具，以研究预览版形式向企业及团队用户开放。工具基于其旗舰模型Claude Opus 4.6，采用模拟人类安全研究员的推理方式，能追踪数据流、发现业务逻辑缺陷和访问控制绕过等传统静态分析难以捕捉的复杂漏洞。来源：AI智库

谷歌正式发布新一代旗舰模型Gemini 3.1 Pro

谷歌正式发布其新一代旗舰模型Gemini 3.1 Pro，在12项基准测试中超越Claude Opus 4.6、GPT-5.2等主流模型，尤其是在衡量推理能力的ARC-AGI-2测试中获得77.1%的高分。模型在复杂任务处理上进步显著，社区实测可生成WebOS操作系统、交互式3D沙盒，能创作生动的SVG动画。来源：智东西

Google DeepMind推出最新AI音乐生成模型：Lyria 3

Google DeepMind推出了新一代AI音乐生成模型Lyria 3，已集成至Gemini应用。用户无需自行创作歌词，仅需通过文字描述、上传照片或视频，可一键生成包含自动作词、作曲、人声演唱的30秒高质量音乐片段。模型支持对节奏、情绪、人声进行精细调控，会自动为歌曲生成配套封面。来源：AI智库

2月18·周三

Anthropic推出史上最强Sonnet模型——Claude Sonnet 4.6

Anthropic发布了Claude Sonnet 4.6模型。新模型在编程、Agent规划和计算机使用等办公场景性能显著提升，在多项基准测试中其智能水平接近甚至超越了自家的旗舰模型Opus 4.6。拥有100万token的上下文窗口，能以一次调用重构整个代码库。其价格与上一代持平，但性价比较高，已在claude.ai平台和亚马逊云AWS上线。来源：智东西

2月16·周一

通义千问团队正式发布新一代模型Qwen3.5

通义千问团队正式发布新一代模型Qwen3.5系列。旗舰模型Qwen3.5-397B-A17B是一款原生多模态模型，采用创新的混合注意力与稀疏MoE架构，在推理效率上相比前代模型有数倍提升。模型在指令遵循、通用智能体、视觉语言、空间智能与视频理解等多个维度的前沿基准测试中，与GPT-5.2、Claude 4.5、Gemini 3 Pro等顶尖模型同台竞技，展现出了全面且领先的综合性能。来源：千问大模型

2月14·周六

豆包大模型2.0正式发布

字节跳动今日宣布豆包大模型正式进入2.0阶段，发布Seed2.0，包含Pro、Lite、Mini和Code四个版本。新版本围绕现实复杂任务进行系统性优化，在推理、多模态理解和复杂指令执行能力上显著提升。豆包2.0 Pro在多项顶尖学术与推理基准测试中表现优异，综合能力达到或超越GPT 5.2与Gemini 3 Pro等顶尖模型。来源：字节跳动

阿里云通义 CoPaw 发布：对标 OpenClaw

AgentScope团队正式发布个人智能体“CoPaw”，定位为“协同个人智能体工作台”，成为用户可本地部署的专属智能搭档。相较于其前身OpenClaw，CoPaw聚焦于极简安装与统一体验，既支持用户本地电脑（macOS/Windows/Linux）通过简单命令快速部署，也支持在“魔搭创空间”一键云端部署。来源：通义实验室

“思考”更深，生成更准｜Seedream 5.0 Lite 发布

字节跳动发布新一代多模态AI模型Seedream 5.0 Lite。该版本不追求更高分辨率，而是大幅强化模型的“思考”与“推理”能力，包括视觉推理、信息可视化、风格迁移和精准图片编辑等。核心亮点是首次引入实时检索增强能力，可结合网络实时信息进行创作。来源：字节跳动Seed

灵心巧手宣布完成近15亿元B轮融资

灵心巧手宣布完成了近15亿元人民币的B轮融资，由道得投资、盛世投资领投。这是该公司在2025年以来的第6轮融资。其核心产品是Linker Hand系列灵巧手，覆盖多种技术路线，其中Linker Hand O6为全球最轻灵巧手。来源：智东西

2月13·周五

MiniMax M2.5 发布：1美金/小时，真实世界工作王者

MiniMax正式发布M2.5模型，其在编程、搜索工具调用、办公等高阶生产力场景性能达到或刷新行业SOTA水平。模型显著提升了任务拆解能力和推理效率，在编程基准SWE-Bench Verified上完成任务的速度比上一代M2.1快37%。来源：MiniMax稀宇科技

Anthropic 宣布完成高达 300 亿美元的 G 轮融资

AI公司Anthropic（即Claude的研发公司）宣布完成高达300亿美元的G轮融资，投后估值达3800亿美元，创造了AI公司单轮股权融资的新纪录。本轮融资由新加坡主权基金GIC和Coatue领投，多家顶级资本参与。来源：APPSO

谷歌宣布 Gemini 3 Deep Think 深度思考大模型升级

谷歌发布了Gemini 3 Deep Think模型的重大升级。新版模型在多项顶尖基准测试中刷新纪录，尤其在竞技编程平台Codeforces获得3455分的Elo评级，在全球排名第八，仅有7位顶尖程序员能在比赛中胜过它。模型在ARC-AGI-2推理基准、“人类的最后考试”（不使用工具）、物理及化学奥林匹克笔试等多个学术竞赛中取得了金牌级别的领先成绩。来源：机器之心

OpenAI 发布 GPT-5.3-Codex-Spark ：专为实时编程而生

OpenAI联合Cerebras推出主打实时编程的新模型GPT-5.3-Codex-Spark。模型针对高速软件开发场景优化，能以超过每秒1000个token的速度进行推理，实现近乎即时的编码反馈，以解决AI长时间自主编程时开发者等待过长、掌控感降低的问题。来源：IT之家

2月12·周四

智谱最新旗舰模型 GLM-5 开源：编程、智能体能力取得开源 SOTA

智谱AI开源GLM-5大模型，其参数规模扩展至744B（激活40B），预训练数据达28.5T，在Coding与Agent能力上实现开源SOTA，综合表现逼近Claude Opus 4.5。该模型在SWE-bench、Terminal Bench等编程基准中领先开源模型，能端到端完成复杂系统工程与长程Agent任务，支持自动售货机经营模拟等资源规划场景。来源：智谱

Z Code推出ADE智能体开发环境，实现“对话即编程”新范式

智谱AI正式发布Z Code全新版本，首次定义ADE（智能体开发环境），通过图形化界面将复杂CLI交互转化为多智能体协作平台。环境支持可视化配置管理、跨设备远程开发及多任务并行处理，内置实时预览浏览器与会话级版本管理功能，可灵活调度Claude Code等主流工具链。来源：Z Code

LongCat 发布原生「深度研究」智能体

美团旗下LongCat正式上线“深度研究”智能体功能，依托美团本地生活真实交易数据与行业洞察，为用户生成个性化吃喝玩乐攻略。智能体具备长程任务规划与多工具调用能力，支持400轮交互与256K上下文处理，在BrowseComp、MCP-Atlas等权威评测中达到开源模型SOTA水平。来源：龙猫LongCat

2月11·周三

讯飞星火X2大模型正式发布，API同步上线

科大讯飞发布基于全国产算力训练的星火X2大模型，其通用能力全面升级，在数学、推理、语言理解等核心指标上对标国际顶尖模型，130+多语言能力持续领先。星火X2采用293B MoE稀疏架构与多项工程优化，推理性能较X1.5提升50%，并实现单台国产昇腾服务器部署。来源：讯飞开放平台

国产AI互动应用Loopit获马斯克公开点赞

国产AI应用Loopit引发海外社交媒体热议。产品由百川智能联合创始人陈炜鹏团队开发，主打“AI互动内容生成”，用户通过文字描述即可自动生成可点击、可滑动、可参与的交互内容，并能对他人作品进行“魔改”二次创作。来源：AI智库

阿里达摩院开源具身智能大脑基础模型 RynnBrain

阿里达摩院开源业界首个具身大脑基础模型RynnBrain，具备时空记忆与物理空间推理能力。模型系列参数规模从2B到30B，采用MoE架构实现高效推理，仅激活3B参数即超越72B模型性能。在20项具身基准测试中全面领先英伟达、谷歌等顶尖模型，攻克了机器人“转身即忘”的物理世界认知难题。来源：量子位

2月10·周二

字节又一新模型：Seedream 5.0上线！

字节跳动图像生成模型Seedream 5.0正式上线，在剪映、CapCut、小云雀等平台开放限时免费体验。新模型支持2K/4K分辨率输出，重点提升提示词理解准确性、细节纹理渲染和智能推理能力，并新增联网搜索功能。来源：智东西

千问最新图像基座模型Qwen-Image-2.0，正式发布！

阿里巴巴发布新一代图像生成及编辑模型Qwen-Image-2.0，支持1K token长文本输入和2K高分辨率输出。模型首次将图像生成与编辑功能统一，在AI Arena评测中以1029分位列全球图像生成第三名，图像编辑得分1034。突出优势在于优秀的中文文字渲染能力和复杂指令理解，可生成专业PPT、多格漫画等高质量图片。来源：阿里云

首个产业级2Bit量化新突破，腾讯混元推出0.3B端侧模型HY-1.8B-2Bit

腾讯混元推出产业级2Bit端侧模型HY-1.8B-2Bit，等效参数量仅0.3B，内存占用600MB，比常用手机应用更小。模型通过2比特量化感知训练实现，在保持原模型全思考能力的同时，生成速度提升2-3倍，可在手机、智能家居等边缘设备无压力部署。来源：腾讯混元

大晓机器人完成天使轮融资

大晓机器人近日完成天使轮融资，由蚂蚁集团领投，启明创投、金景资本等多家机构跟投。融资将用于推进”以人为中心”的ACE具身全栈研发范式，加速环境式数据采集和开悟世界模型3.0的研发。来源：商汤科技SenseTime

2月9·周一

字节跳动推出新一代AI视频生成模型Seedance 2.0

字节跳动推出新一代AI视频生成模型Seedance 2.0，支持多模态参考生成，可同时上传图片、视频、音频等最多12个参考文件，精准复刻运镜逻辑与动作细节。该模型突破在于融合AI生成与后期编辑，用户可直接修改不满意部分，显著降低废片率。来源：AI智库

Skywork推出SkyBot——最适合小白用户的OpenClaw工具

天工Skywork推出SkyBot，号称全球最适合小白用户的OpenClaw工具。该产品将火爆的AI代理OpenClaw进行云端化改造，用户无需配置硬件或命令行，点击即可领取7×24小时云端AI助理。来源：昆仑万维集团

智谱清言APP正式上线「学习搭子」随时随地，马上学

智谱清言APP正式上线”学习搭子”功能，支持用户随时随地利用碎片化时间进行学习。该功能网页端上线两周内已创建超1.2万个学习项目，现移动端全面开放，无需邀请码即可体验。来源：智谱清言

腾讯推出全场景职场 AI 智能体桌面工作台WorkBuddy

腾讯推出全场景AI办公助手WorkBuddy，正式开放内测申请。产品定位为桌面智能工作台，支持自然语言交互，能听懂指令后自主操作本地文件，实现PPT生成、数据整理、知识库构建等复杂任务。与聊天机器人不同，WorkBuddy强调“执行能力”，可像真实同事一样交付成果。来源：腾讯云代码助手

2月6·周五

OpenAI发布新一代编程模型：GPT-5.3-Codex

OpenAI推出新一代编程模型GPT-5.3-Codex，宣称为全球最强智能体编程模型。模型在SWE-Bench Pro和Terminal-Bench 2.0测试中取得SOTA成绩，编程得分较Claude Opus 4.6高11.9%。具备调试、部署及办公软件操作能力，速度提升25%，能参与自身开发优化。来源：智东西

Anthropic发布新一代AI模型Claude Opus 4.6

Anthropic发布新一代AI模型Claude Opus 4.6，具备100万token上下文窗口和自适应思考能力。在编程、金融分析、办公软件操作等领域表现卓越：16个AI代理两周内写出可编译Linux的C编译器，自主发现500多个零日漏洞，在GDPval-AA评测中超越GPT-5.2。来源：量子位

AI营销平台PallasAI 完成数千万元融资

AI营销平台PallasAI完成数千万元融资，由有赞独家投资。公司推出行业首款标准化GEO AI Agent产品，通过可见性评分、营销图谱和Agent内容协作三大功能，帮助中小企业量化品牌在AI生态中的曝光度。来源：Founder Park

生数科技宣布完成超过6亿元人民币A+轮融资

北京生数科技宣布完成超6亿元A+轮融资，创下国内视频生成领域单笔融资新纪录。公司由清华大学背景团队创立，其Vidu Q3视频生成模型在专业影视制作场景中表现突出，位列全球第二，客户覆盖索尼、腾讯、字节跳动等企业。来源：智东西

2月5·周四

可灵AI正式迈入3.0时代！

可灵AI正式升级至3.0版本，推出可灵3.0模型系列。实现多模态输入输出一体化，重新定义AI视频工作流。视频3.0模型在叙事与控制方面深度进化，新增智能分镜功能，可自动调度景别与机位，视频3.0 Omni进一步提升了主体相似度与复杂指令响应能力，图片3.0 Omni新增深度叙事与组图批量创作功能。来源：可灵AI

面壁智能开源了新一代全模态旗舰模型 MiniCPM-o 4.5

面壁智能开源新一代全模态模型MiniCPM-o 4.5，模型具备”边看、边听、主动说”的全双工交互能力，让人机交互从回合制升级为即时自由对话。通过9B参数实现全模态SOTA性能，在视觉理解、文档解析、语音生成等方面表现优异，支持实时感知与主动响应。来源：面壁智能

上海AI实验室开源科学多模态大模型Intern-S1-Pro

上海AI实验室开源了万亿参数科学多模态大模型Intern-S1-Pro。模型采用MoE架构，总参数1万亿，激活参数220亿。基于“通专融合”SAGE技术，具备奥赛级数理推理能力，可精准解析多模态科学内容，覆盖化学、材料、生命、地球、物理等学科。来源：AI智库

Mistral AI 推出新一代语音转文本模型Voxtral Transcribe 2

Mistral AI 推出的新一代语音转文本模型Voxtral Transcribe 2，包含两个版本。Voxtral Mini 支持 13 种语言的高精度转录，具备说话人分离、词级时间戳和上下文偏置功能，适合批量转录。Voxtral Realtime 专为实时场景设计，延迟低至 200 毫秒以下，适合语音助手等交互应用。来源：AI智库

2月4·周三

通义千问 Qwen3-Coder-Next 开源：小而强！

通义开源Qwen3-Coder-Next编程智能体模型，采用80B总参数的MoE架构，每次推理仅激活3B参数，显著降低算力需求。在SWE-Bench Verified基准上取得超70%的问题解决率，性能接近更大规模的稠密模型。来源：通义大模型

昆仑天工面向全球发布“Skywork桌面版”

昆仑天工全球发布“Skywork桌面版”AI应用，支持Windows系统本地化运行，无需上传文件至云端。可跨格式理解并处理电脑中的文档、图片、视频等文件，实现多任务并行与内容生成。用户可选择Claude或Gemini模型，并自动调用百余项内置技能。来源：昆仑万维集团

2月3·周二

智谱GLM-OCR发布：性能SOTA，搞定复杂文档

智谱AI正式发布并开源专业级OCR模型GLM-OCR，以仅0.9B参数实现”小尺寸、高精度”的文档解析能力。模型在权威评测OmniDocBench V1.5中以94.6分登顶，在文本识别、公式识别、表格解析及信息抽取等任务中均取得SOTA表现。特别针对手写体、复杂表格、代码文档等高难场景进行优化，支持PDF和图像批量处理，吞吐量达1.86页/秒。来源：智谱

元气AI Bot正式上线：国产AI助手实现电脑自动化操控

猎豹公司推出首款国产Clawbot工具“元气AI Bot”，支持在普通Windows电脑本地部署，用户可通过手机飞书或钉钉远程控制，用自然语言指令让AI自动操作电脑，如打开软件、查看邮件、浏览网页等。工具集成系统清理、AI写作、PPT生成等办公辅助功能，推出多款个性化AI伙伴角色。来源：AI智库

马斯克宣布SpaceX完成对xAI的收购，估值达1.25万亿美元

马斯克正式宣布SpaceX完成对xAI的收购，合并后公司估值达1.25万亿美元，每股发行价526.59美元。马斯克在内部信中表示，此次整合将打造”地球上最具雄心的垂直创新引擎”，涵盖AI、火箭技术、太空互联网等多领域。合并后，SpaceX将推进在太空部署数据中心的计划，利用太空太阳能资源降低AI算力成本。来源：量子位

马斯克旗下 xAI 发布 Grok Imagine 1.0

马斯克旗下的人工智能公司xAI正式发布Grok Imagine 1.0版本，是该AI视频生成工具的重大升级。新版本支持生成10秒时长、720p分辨率的视频，显著提升了音频质量，实现了音画同步与情感化配音功能。来源：AI智库

2月2·周一

阶跃星辰 Step 3.5 Flash 上线！更快更强更稳的 Agent 大脑，开源！

阶跃星辰发布新一代开源基座模型 Step 3.5 Flash，专为 Agent 场景设计。模型采用稀疏 MoE 架构，具备 1960 亿参数，每个 token 仅激活约 110 亿参数，支持 256K 上下文长度。核心优势包括推理速度最高达 350 TPS，在 Agent 任务和数学推理上媲美闭源模型，并通过 MTP-3 技术实现单次预测 3 个 token，显著提升效率。来源：阶跃星辰

Qoder首个定制模型 Qwen-Coder-Qoder

Qoder智能编程平台上线首个定制模型Qwen-Coder-Qoder，5个月内完成”模型-智能体-产品”全形态布局。该模型基于Qwen-Coder基座，针对Qoder的Agent框架进行深度优化，在真实软件工程评测集上任务解决率超过Cursor Composer-1，Windows系统终端命令准确率领先50%。来源：Qoder

「跨赴科技」再获数千万融资，产业方加持领跑AI开发新范式

跨赴科技近日完成数千万元Pre-A+轮融资，由哈勃投资和正扬投资领投，老股东奇绩创坛跟投，距上一轮融资仅四个月。核心产品“CodeFlying码上飞”年度经常性收入已突破1000万元，海外业务快速增长。来源：KuaFuAI

Vidu Q3 全球震撼来袭，为「剧」而生！

Vidu Q3 全球震撼来袭，作为全球首个支持16秒音视频直出的AI视频生成模型，专为漫剧、短剧、影视剧创作设计。模型实现声画同步高清直出，支持多镜头自由切换、多语言对话与文字渲染，具备电影级视听张力，让AI视频进入”一键成片”时代。来源：Vidu AI

1月30·周五

宇树开源 UnifoLM-VLA-0 大模型，助力通用人形机器人操作

宇树科技宣布开源视觉-语言-动作大模型UnifoLM-VLA-0。模型基于Qwen2.5-VL-7B架构，通过340小时真机数据训练，融合2D/3D空间感知与动力学预测能力，突破传统VLM在物理交互中的局限。来源：IT之家

商汤开源SenseNova-MARS：突破多模态搜索推理天花板

商汤科技开源多模态自主推理模型SenseNova-MARS（8B/32B双版本），模型在MMSearch、HR-MMSearch等核心基准测试中以69.74分综合得分超越Gemini-3-Pro（69.06分）与GPT-5.2（67.64分），成为首个支持动态视觉推理与图文搜索深度融合的开源Agentic VLM。来源：商汤科技SenseTime

Qwen3-ASR开源：够稳定，能流式，多语言！

阿里云千问团队开源Qwen3-ASR系列语音识别模型，包含1.7B/0.6B参数版本及强制对齐模型。该系列支持52种语言与方言识别，覆盖中文22种地方口音及多国英语变体，在嘈杂环境、歌唱场景下均表现稳定。来源：千问Qwen

OpenAI宣布2月13日下线GPT-4o等旧模型

OpenAI宣布将于2月13日从ChatGPT平台下线GPT-4o、GPT-4.1系列等旧模型。此举引发用户强烈反响，部分用户称GPT-4o的“温暖对话风格”具有不可替代的情感价值，尤其满足创意交流与情绪陪伴需求。OpenAI表示将集中资源优化主流模型，并在GPT-5.2中改进个性与创造力。API服务暂不受影响。来源：APPSO

苹果20亿美元收购以色列AI公司Q.ai

苹果公司以近20亿美元收购以色列AI初创企业Q.ai，为其自2014年收购Beats以来规模第二大的交易。Q.ai核心技术为通过分析面部微表情与肌肉运动识别“无声语音”，用户无需发声即可通过唇动输入指令。该技术有望集成至AirPods、iPhone及计划于2026年推出的AI眼镜中，实现私密、无干扰的交互体验。来源：极客公园

1月29·周四

昆仑万维开源视频生成模型SkyReels-V3，重塑创作流程

昆仑万维旗下Skywork AI宣布开源视频生成模型SkyReels-V3，模型在单一架构中整合参考图像转视频、视频延长、音频驱动虚拟形象三大功能。图像转视频技术在参考一致性（0.6698）和视觉质量（0.8119）指标上超越Vidu、Kling等主流模型；视频延长支持镜头切换与叙事扩展；虚拟形象模块可实现音画同步的长视频生成。来源：昆仑万维集团

MiniMax Music 2.5: 格莱美级创作，不再需要录音棚

MiniMax正式推出新一代AI音乐生成模型MiniMax Music 2.5，突破性实现14种段落结构（如前奏、副歌、桥段）的标签化精准控制，支持创作者像专业编曲人一样设计整曲情绪曲线。来源：MiniMax稀宇科技

昆仑天工Mureka V8重磅发布：定义AI音乐新品类

昆仑万维旗下昆仑天工正式发布Mureka V8音乐大模型，宣布“AI音乐是一种新的音乐品类”。模型基于MusiCoT技术体系，在旋律完整性、人声表现力、编曲层次及混音质感上实现突破，生成效果达到可直接发布水准。来源：昆仑万维集团

1月28·周三

OpenAI发布免费科研协作工具Prism

OpenAI推出基于GPT-5.2的免费科研协作平台Prism，解决科研工具碎片化问题。平台集成云端LaTeX编辑器，支持无限协作者实时共同撰写论文，AI可基于全文语境辅助完成从摘要到致谢的全流程工作，包括公式生成、文献管理、图表优化及语法校对。来源：新智元

MiniMax发布MiniMax M2-her角色扮演模型

MiniMax正式揭秘其AI角色扮演模型MiniMax M2-her的技术架构，模型为星野/Talkie等产品的底层引擎。核心突破在于建立Role-Play Bench评估体系，从世界观一致性、故事推进多样性、用户偏好响应三大维度量化角色扮演能力，在百轮长对话测试中综合表现领先。来源：MiniMax稀宇科技

阿里通义开源Z-Image基座模型

阿里通义开源发布6B参数的非蒸馏基座模型Z-Image，专注于解决AI绘画风格单一、人像同质化等痛点。模型支持从写实到动漫的多元风格生成，通过原生架构优化，显著提升对LoRA、ControlNet等微调方法的兼容性。来源：通义大模型

1月27·周二

Kimi 发布并开源 K2.5 模型，带来全新视觉理解、代码和 Agent 集群能力

月之暗面发布迄今最智能、最全能的开源模型Kimi K2.5。模型在Agent任务、代码生成、视觉理解（图像/视频）等多项基准测试中达到开源SOTA水平，支持多模态输入及四种工作模式。创新性引入“Agent集群”能力，可自主创建多达100个分身并行处理复杂任务，效率提升最高4.5倍。来源：月之暗面Kimi

Vidu Q2 参考生Pro全球上线「万物可参考」

Vidu正式推出全球首款支持“万物可参考”的视频生成模型Vidu Q2参考生Pro。模型突破性支持六大参考类型（特效、表情、纹理、动作、人物、场景），用户可通过视频或图片输入，一键复刻特效、迁移演技、替换背景，实现精细化增删改编辑。来源：Vidu AI

DeepSeek又探索新架构了，开源DeepSeek-OCR 2

DeepSeek发布并开源新一代文档识别模型DeepSeek-OCR 2，采用DeepEncoder V2架构，将传统固定顺序的图像扫描升级为具备因果注意力的语义推理模式。通过轻量级语言模型动态重排视觉Token，使AI能像人类一样按逻辑顺序理解复杂文档（如表格、多栏排版），在OmniDocBench评测中以91.09%的综合得分刷新纪录，阅读顺序识别误差降低33%。来源：机器之心

千问最强模型Qwen3-Max-Thinking正式发布

阿里正式发布其规模最大、能力最强的推理模型Qwen3-Max-Thinking。模型总参数量超万亿，预训练数据达36T Tokens，在多项国际专业基准测试中刷新纪录。其创新性地采用了测试时扩展机制，在提升推理性能的同时更加经济。来源：阿里云

英伟达20亿美元加码CoreWeave，冲刺5GW算力

英伟达宣布追加投资20亿美元给云服务商CoreWeave，持股比例升至超11%，成为其第二大股东。双方将深化合作，目标在2030年前建成超5GW的AI算力项目。值得注意的是，英伟达首次独立向CoreWeave供应Vera CPU芯片，可能预示其将进入数据中心CPU市场，与英特尔、AMD竞争。来源：钛媒体

GitHub开源项目Clawdbot意外带火Mac mini

开源项目Clawdbot在GitHub爆火，Star数两天内从五千飙升至两万。项目支持自部署AI助手，通过网关连接聊天软件（如WhatsApp、Telegram）与多款AI模型（Claude、GPT等），并集成日历管理、邮件处理、自动化任务等技能，实现真正的“对话式”个人助理。来源：APPSO

1月26·周一

腾讯混元发布混元图像3.0图生图模型，上线元宝：一句话就能p图

腾讯混元团队发布混元图像3.0图生图模型，模型总参数量80B，采用混合专家架构，支持图片编辑、多图融合等多样化视觉创作功能。用户可通过自然语言指令实现增删改、风格变换、老照片修复等操作，模型能智能理解图像内容并生成详细编辑步骤。来源：腾讯混元

38岁清华姚班天才挂帅！上海大模型独角兽阶跃星辰融资超50亿

上海AI大模型独角兽阶跃星辰完成超50亿元B+轮融资，刷新国内大模型赛道单笔融资纪录。旷视科技创始人、38岁清华姚班校友印奇正式出任公司董事长，将与CEO姜大昕共同领导公司。融资将用于基础模型研发与AI+终端战略落地，重点攻坚基座模型、全模态融合和视觉语言动作（VLA）三大方向。来源：智东西

商汤科技AI Agent“咔皮记账”核心功能永久免费啦！

商汤科技宣布AI记账产品“咔皮记账”核心功能将永久免费开放。产品依托“日日新”大模型的多模态理解能力，用户可通过拍照、语音等方式实现自动记账，目前已成为国内AI记账类产品第一名，累计用户超500万。此次免费范围涵盖自动记账、共享账本、预算规划、多账户管理等30项核心功能，彻底取消使用门槛。来源：商汤科技SenseTime

1月23·周五

清言学习搭子已上线！火速申请体验名额

智谱AI正式推出“AI学习搭子”AI学习助手，现已开放首批用户体验申请。产品通过三大功能重塑学习体验：智能摘要可将数百页文档转化为知识地图实现“把书读薄”；可视化交互卡片与AI助教答疑让学习过程生动有趣；知识点精准出题与“学-练-测”闭环助力深度掌握。来源：智谱清言

Qwen3-TTS全家桶开源上线！

通义千问团队正式开源Qwen3-TTS系列语音生成模型，包含1.7B和0.6B两种参数规模，全面支持音色克隆、音色创造与拟人化语音生成。采用创新的12Hz多码本语音编码器与双轨建模架构，实现高效语音压缩与高保真还原，首包音频延迟低至97毫秒。模型覆盖中、英、日、韩等10种主流语言及方言，支持自然语言指令精确控制音色、情感及韵律。来源：千问Qwen

vLLM团队官宣创业：融资1.5亿美元，清华特奖游凯超成为联创

大模型推理开源框架vLLM的创建团队正式宣布成立创业公司Inferact，并在种子轮融资1.5亿美元，公司估值达8亿美元。本轮融资由a16z和光速创投领投，红杉资本等机构跟投，成为有史以来规模最大的种子轮融资之一。来源：机器之心

1月22·周四

百度发布文心大模型 5.0 正式版：2.4 万亿参数，具备全模态理解与生成能力

百度正式发布文心大模型5.0版本，模型参数量达2.4万亿，采用原生全模态统一建模技术，具备文本、图像、音频、视频等信息的全面理解与生成能力。官方表示，在40余项权威基准评测中，其语言与多模态理解能力超越Gemini-2.5-Pro、GPT-5-High等国际主流模型。来源：百度文心

腾讯CodeBuddy Code 2.0 重磅升级！

腾讯CodeBuddy Code 2.0版本正式发布，核心升级包括开放SDK集成能力，通过Plan模式与ACP协议实现Agent能力标准化输出，支持企业快速构建生产级AI应用。平台全面兼容开发者社区生态，支持Plugin插件市场与自定义Subagents智能体，集成TencentOS提供容器化安全沙箱运行环境。新版本增强工程记忆、LSP代码诊断等核心功能，支持GLM-4.7等多模型切换。来源：腾讯云代码助手CodeBuddy

8B端侧写作智能体AgentCPM-Report开源！

清华大学、中国人民大学、面壁智能与OpenBMB社区联合发布本地化深度调研智能体 AgentCPM-Report。模型仅8B参数，通过40轮深度检索与100轮思维链推演，在DeepResearch Bench等三大评测中综合表现超越部分顶级闭源系统，尤其在洞察性指标排名第一。来源：面壁智能

1月21·周三

10B击败200B！阶跃星辰开源视觉语言SOTA：Step3-VL-10B

阶跃星辰（StepFun）开源10B参数多模态模型Step3-VL-10B，在多项基准测试中性能超越参数量20倍以上的主流大模型。模型在视觉感知、数学竞赛、逻辑推理等核心维度达到SOTA水平，其创新的并行协调推理机制（PaCoRe）显著提升复杂任务处理能力。来源：阶跃星辰

MiniMax推出Agent 2.0，升级为进阶型桌面智能协作伙伴

MiniMax发布第二代智能体产品MiniMax Agent 2.0，推出“AI原生工作台”新范式。平台包含桌面端应用，支持Windows和Mac系统，可深度打通本地文件与环境，实现本地与云端任务的无缝协同。核心创新“Expert Agents”专家系统，通过封装行业SOP与私有知识，将专业能力从通用70分提升至95分以上。来源：机器之心

1月20·周二

GLM-4.7-Flash开源、免费

智谱AI正式开源并发布GLM-4.7-Flash模型，模型采用混合思考架构，总参数量30B，激活参数量仅3B，为轻量化部署提供高性能选择。模型在SWE-bench Verified、τ²-Bench等主流基准测试中表现优异，超越同尺寸开源模型达到SOTA水平。来源：智谱

欢迎报名 Kimi 新模型 API 内测计划

月之暗面（Moonshot AI）正式启动Kimi新模型API内测计划，面向已完成企业认证的开放平台用户开放申请。平台将根据开发者使用场景与新模型能力的匹配度筛选首批测试用户，通过审核后将由官方团队电话联系。与开发者共同探索下一代模型的应用潜力。来源：Kimi开放平台

马斯克开源 X 平台推荐算法

马斯克宣布正式开源X平台（原Twitter）核心推荐算法代码x-Algorithm，成为首个将流量分发逻辑完全透明化的主流社交平台。新版算法采用与xAI的Grok模型相同的Transformer架构，实现”零人工特征工程”，完全依赖模型自主学习用户交互历史来预测内容相关性。来源：APPSSO

「自然选择」融资3000万美元，阿里、蚂蚁布局AI陪伴

AI陪伴公司「自然选择」完成超3000万美元融资，投资方包括阿里巴巴、蚂蚁集团、启明创投等机构。公司推出的《EVE》产品重新定义了AI陪伴的五个维度：主动发起关怀、双商兼具的”活人感”、SOTA级长时记忆、高沉浸感设计以及破次元生活服务介入。来源：暗涌Waves

Kimi开启新一轮融资！估值直冲48亿美元

月之暗面在距上轮融资仅数周后启动新一轮融资，投前估值逼近48亿美元，较上月43亿美元估值溢价5亿美元。本轮融资获机构疯狂抢购，主因智谱与MiniMax港股上市表现强劲后，投资人加速布局中国AI头部标的。公司目前持有超100亿人民币现金储备，创始人杨植麟表示不急于IPO，将聚焦下一代K3推理模型研发与算力扩容。来源：Z Finance

1月19·周一

扣子 2.0，让 Agent 更进一步

字节跳动旗下AI智能体平台“扣子”正式发布2.0版本，推出四大核心功能升级。Agent Skills技能系统支持用户为AI安装行业专业能力包；Agent Plan支持设定长期目标后由AI自主规划执行；Agent Office提供深度职场场景理解与洞察；Agent Coding实现云端一站式开发。来源：扣子Coze

安克与飞书联合发布AI录音豆

安克与飞书联合发布AI录音豆，产品单体仅重10克，采用豆型轻巧设计，可夹于衣领、袖口等位置实现无感佩戴。内置的AI能力由飞书提供，支持多语言转写翻译、会议纪要自动生成，能将录音内容智能分析为鱼骨图等可视化图表，自动同步至飞书多维表格。来源：Anker安克

AI视频领军企业爱诗科技与中国儒意达成战略合作

AI视频生成企业爱诗科技与港股上市公司中国儒意达成战略合作，并获得1420万美元战略投资。双方将共同探索AI技术在影视制作、流媒体平台南瓜电影及游戏业务中的创新应用，重点开发影视视觉设计、视效制作、宣传素材智能生成等环节。爱诗科技将获得中国儒意优质版权内容授权，合作研发多模态智能体技术。来源：爱诗科技AIsphere

光轮智能联手World Labs破解评测规模化难题

光轮智能与World Labs合作破解具身智能规模化评测难题，通过”数字表亲”仿真方案替代传统高成本数字孪生技术。该方案基于轻量真实世界采集数据，利用3D高斯泼溅技术快速生成可物理交互的仿真环境，将环境创建时间压缩至分钟级。来源：光轮智能

1月16·周五

国产芯片全程训练，GLM-Image登顶Hugging Face Trending

智谱AI与华为联合研发的多模态模型GLM-Image在开源后24小时内登顶Hugging Face Trending榜单首位，成为首个完全依托国产昇腾芯片完成全流程训练的SOTA模型。模型采用创新的”自回归+扩散解码器”混合架构，在复杂视觉文本生成和长文本渲染任务中表现优异，尤其擅长汉字生成。来源：智谱

美团 LongCat-Flash-Thinking-2601 发布，工具调用能力登顶开源 SOTA！

美团LongCat团队发布并开源智能体模型LongCat-Flash-Thinking-2601，在智能体工具调用、搜索等核心评测中达到开源SOTA水平。模型创新引入”重思考”模式，支持8个并行推理路径协同工作，在复杂随机任务中性能超越Claude。来源：龙猫LongCat

谷歌最强 AI 开放翻译模型：TranslateGemma 登场

谷歌发布基于Gemma 3架构的开放翻译模型系列TranslateGemma，提供4B、12B和27B三种参数规模。系列支持55种核心语言及多模态图像翻译，其中12B版本翻译质量超越参数量更大的基线模型，4B模型性能与12B基线相当，可在手机端流畅运行。来源：IT之家

混元3D Studio 1.2全面开放公测！支持笔刷交互、八视图输入

腾讯混元3D Studio 1.2版本今日全面开放公测，无需申请即可体验。该版本核心升级包括PartGen 1.5组件生成模型，拆分精度提升至1536³分辨率，并首次支持笔刷交互，用户可通过笔刷进行细粒度组件拆分控制。来源：腾讯混元

1月15·周四

千问App上线AI购物，真正能帮你办事的AI来了！

千问App正式上线400多项AI办事功能，标志着从”聊天对话”迈入”AI办事时代”。应用深度接入淘宝、支付宝、高德、飞猪等阿里生态业务，在全球首次实现AI点外卖、购物、订机票酒店等实用功能，用户可在对话界面内完成支付无需跳转。上线的”任务助理”支持多步骤复杂任务规划，新增学习辅助功能。来源：阿里巴巴

阶跃星辰原生语音推理模型 Step-Audio-R1.1 登顶榜首

阶跃星辰开源语音推理模型Step-Audio-R1.1在权威评测Artificial Analysis Speech Reasoning中以96.4%准确率登顶全球第一，超越Grok、Gemini等主流模型。是全球首个开源原生语音推理模型，具备深度语音推理和实时响应能力，可端到端理解音频内容并进行复杂逻辑推理。来源：阶跃星辰

OpenAI签下近700亿AI芯片巨单！

OpenAI与美国AI芯片公司Cerebras签署价值近100亿美元（约697亿元人民币）的超级订单，将部署750兆瓦的Cerebras晶圆级系统，打造全球最大高速AI推理平台。合作将于2026年起分阶段实施，2028年前完成，Cerebras芯片推理速度达GPU系统的15倍。来源：智东西

1月14·周三

智谱联合华为开源首个国产芯片训练的多模态SOTA模型GLM-Image

智谱AI与华为联合开源新一代图像生成模型GLM-Image，是首个在国产昇腾Atlas 800T A2芯片上完成全流程训练的SOTA多模态模型。模型采用创新的“自回归+扩散解码器”混合架构，在复杂视觉文字生成（CVTG-2K）和长文本渲染（LongText-Bench）榜单中取得开源模型最优成绩，尤其擅长汉字生成任务。来源：智谱

全球首个通用实时世界模型 PixVerse R1

PixVerse正式发布全球首个通用实时世界模型PixVerse R1，开创视频内容从”录好再播”到”因你而生”的新范式。模型支持无限流生成、多模态交互与即时响应，最高支持1080P分辨率。来源：爱诗科技 AIsphere

Genspark 官宣 ARR 突破 1 亿美元

Genspark 通过 LinkedIn 宣布，其产品上线仅 9 个月，年度经常性收入（ARR）已突破 1 亿美元，跻身全球增长最快的 AI 公司行列。同时，Genspark 预告 Genspark AI Workspace 2.0 将在两周内发布。来源：LinkedIn

商汤「办公小浣熊」APP上线！

商汤科技正式上线「办公小浣熊APP」iOS移动版应用。APP主打移动办公场景下的AI生产力工具，支持用户通过手机进行复杂表格数据分析、语音输入快速记录，并实现电脑与手机间的任务无缝接力。来源：商汤科技SenseTime

MiniMax 开源新评测集：定义Coding Agent 的生产级标准

MiniMax开源新一代Coding Agent评测集OctoCodingBench，首次将评估重点从”结果正确”转向”过程规范遵循”。评测集通过Check-level准确率和Instance-level成功率两项指标，系统评估AI编程助手在遵循命名规范、安全规则、团队协作规范等过程约束的能力。来源：MiniMax稀宇科技

快手宣布可灵 12 月收入超 2000 万美元

快手科技宣布其视频生成大模型可灵AI在2025年12月单月收入突破2000万美元，年化收入运行率达2.4亿美元。产品在上线第10个月实现ARR破1亿美元后，于第19个月再次实现跨越式增长。2025年12月，可灵AI通过”全能灵感周”集中发布了可灵视频O1、可灵图片O1等多款新模型，在视频编辑、一致性保持等方面实现技术突破。来源：快手科技

一年融2.2亿，DeepWisdom终于发布了第一款产品Atoms

AI编程平台DeepWisdom正式发布核心产品Atoms，平台基于多智能体架构，让用户”用一句话启动一家创业公司”。只需输入想法，平台可调用产品经理、工程师等AI智能体，完成从市场调研、全栈开发到部署上线的完整产品闭环。公司在2025年完成累计2.2亿元人民币融资。来源：暗涌Waves

1月13·周二

Anthropic 发布 Cowork：面向所有人版本的 Claude Code 助手

Anthropic发布Claude Cowork，是其智能体编码工具Claude Code面向包括非开发者在内的所有用户的衍生版本。工具允许用户授权Claude访问电脑指定文件夹，使其能在其中读取、编辑和创建文件。来源：AI智库

百川开源全球最强医疗大模型Baichuan-M3

百川智能开源全球最强医疗大模型Baichuan-M3，在权威评测HealthBench中以65.1分综合成绩位列全球第一，首次在医疗领域全面超越GPT-5.2。模型幻觉率低至3.5%，为全球最低，首次具备原生“端到端”严肃问诊能力，其问诊表现超越真人医生平均水平。来源：百川智能

1月12·周一

自变量获字节、红杉等10亿元投资，构建物理世界的基础模型

具身智能机器人公司“自变量”近期完成10亿元A++轮融资，投资方包括字节跳动、红杉中国、深创投等顶级机构。公司是国内唯一同时获得字节、美团、阿里投资的具身智能企业，凸显市场对其技术领先性的高度认可。来源：自变量机器人

千寻智能开源具身智能基础模型Spirit v1.5

国产具身智能模型千寻Spirit v1.5在权威真机评测基准RoboChallenge上以总分66.09、成功率50.33%的成绩超越美国公司Physical Intelligence的Pi0.5模型，登顶全球榜首。是该榜单自上线以来首个击败基准模型的国产模型，也是首个成功率突破50%的具身智能模型。来源：量子位

Humanify 获数千万元首轮融资打造 AI OS

AI初创公司Humanify（人格智能）近日宣布完成数千万元种子轮融资，由五源资本领投，奇绩创坛跟投。公司成立于2024年，专注于开发具备“类人认知与自主意识”的下一代AI模型与原生操作系统。本轮资金将主要用于模型和操作系统研发、扩大团队，加速智能在真实场景的落地。来源：Z Potentials

谷歌联合零售巨头推出通用商务协议 UCP

谷歌联合Shopify、沃尔玛、Target等零售巨头推出全新开放标准——通用商务协议（UCP），为AI智能体购物场景建立全流程标准化框架。协议支持智能体参与从商品发现到售后支持的全部环节，通过标准化实现不同系统间的协同运作，并可兼容谷歌此前发布的智能体支付、互联等协议。来源：IT之家

1月9·周五

MiniMax 港股挂牌，历史上IPO规模最大的AI大模型公司诞生

全球化AI大模型公司MiniMax（股票代码：0100.HK）在香港联交所主板正式挂牌上市。开盘后股价一度大涨超50%，截至发稿涨幅达63%，报269港元，市值约831亿港元。此次IPO以每股165港元定价上限发行，募集资金总额约55.4亿港元，其公开发售部分获得1837倍超额认购，市场反响热烈。来源：财联社

ChatDev 2.0：零代码构建多智能体，快速开发一切

清华大学、上海交通大学、OpenBMB与面壁智能联合团队正式开源多智能体框架ChatDev 2.0。新版实现了从“代码驱动”到“零代码可视化交互”的飞跃，用户通过简单“拖拽+配置”即可在无限画布上构建复杂多智能体系统。来源：面壁智能

多模态检索新标杆，Qwen3-VL-Embedding&Reranker开源！

通义千问团队正式开源多模态检索模型Qwen3-VL-Embedding与Qwen3-VL-Reranker。该系列模型基于Qwen3-VL构建，专为图文、视频等混合内容的理解与检索设计，能在统一框架内处理文本、图像、视觉文档及视频等多种模态输入。来源：通义大模型

1月8·周四

智谱上市了，全球大模型第一股，股票代码“02513”

北京智谱华章技术股份有限公司（简称“智谱”）正式在香港交易所挂牌上市，股票代码为“02513”，成为全球“大模型第一股”。公司以“智能是且仅是我们唯一的产品”为核心，致力于通用人工智能（AGI）的研发与探索。此次上市标志着其在发展历程中迈出关键一步。来源：智谱

ChatExcel一年完成3轮融资，构建全模态数据链路平台

北大系AI公司元空智能（ChatExcel）连续完成Pre-A轮与A轮数千万融资，由考拉基金与合鼎共资本投资，全年共完成三轮融资。2026年，公司正重点推进全球化布局，海外版本已上线，致力于成为国际领先的数据智能服务商。来源：元空AIExcel

OpenAI 推出 ChatGPT Health 模式，为健康设立专属空间

OpenAI正式推出专注于健康领域的“ChatGPT Health”模式。是ChatGPT为用户提供了一个独立的对话空间，更系统、安全地讨论健康问题。核心特性包括将健康对话与普通聊天记录隔离以保护隐私，允许AI在获得许可后参考用户其他场景的信息以提供连贯建议。来源：IT之家

1月7·周三

xAI完成200亿美元E轮融资，英伟达再次出手

马斯克旗下xAI公司完成200亿美元E轮融资，超额完成原定目标。投资方包括英伟达、思科等知名机构及中东资本。数据显示，Grok月活跃用户已达6亿，Grok 5正在训练中。公司拥有超100万个H100 GPU等效算力，Grok 4在强化学习方面取得突破。来源：智东西

LMArena完成1.5亿美元Series A融资

AI初创公司LMArena完成1.5亿美元A轮融资，投后估值达17亿美元。核心产品为“模型竞技场”平台，通过众包方式让用户比较不同AI模型的性能，月活用户超500万，每月产生6000万次对话。本轮融资由Felicis和UC Investments领投。来源：Z Potentials

智元发布首个大语言模型驱动的开源仿真平台：Genie Sim 3.0

智元机器人在CES上发布全球首个大语言模型驱动的开源仿真平台Genie Sim 3.0。平台基于NVIDIA Isaac Sim构建，融合三维重建与视觉生成技术，可实现数字孪生级高保真仿真环境。首创的自然语言驱动场景生成技术，可将万级场景的生成时间缩短至分钟级。来源：AI智库

1月6·周二

英伟达发布重磅AI计算平台Vera Rubin

英伟达CEO黄仁勋发布了重磅AI计算平台Vera Rubin，打破五年未发消费级显卡的惯例。平台包含6款全新芯片，其中Rubin GPU推理算力达50 PFLOPS，是Blackwell的5倍。Vera Rubin NVL72系统性能全面提升，训练10万亿参数模型所需系统数量仅为前代1/4，成本降至1/10。来源：APPSO

亚马逊上线 Alexa网页版，加速补齐网页端能力

亚马逊正式推出Alexa+网页版，重新启用Alexa.com域名，允许用户通过浏览器直接与AI助手对话。标志着Alexa从智能音箱设备扩展到网页端，与ChatGPT、Google Gemini等AI聊天机器人展开正面竞争。来源：AI智库

开源异构算力调度平台「密瓜智能」获数千万元投资

异构算力调度平台「密瓜智能」近日完成数千万元天使轮融资，由复星创富领投。核心产品为CNCF开源项目HAMi，专注于解决GPU等异构算力资源利用率低下的行业痛点。HAMi支持NVIDIA、华为昇腾等9种以上芯片的细粒度切分与统一调度，可实现显存超卖和动态资源分配。来源：36氪

智能眼镜企业雷鸟创新宣布完成超10亿元新一轮融资

国内AR智能眼镜企业雷鸟创新宣布完成超10亿元新一轮融资，由中国移动链长基金与中信金石共同领投，中国联通旗下基金参与。是国内运营商首次以战略投资者身份进入智能眼镜赛道，交割后中国移动持股7.92%。来源：智东西

1月5·周一

智元机器人与MiniMax达成合作，全模态AI加速落地机器人应用

智元机器人与MiniMax（上海稀宇科技）正式达成合作，MiniMax将为智元机器人提供文本到语音全流程AI技术支持。此次合作将基于智元机器人的产品特性，量身打造专属人设体系以优化语音交互体验，并通过定制化提示词策略实现千人千面的个性化音色合成。来源：36氪

腾讯「AI应用及线上工具小程序成长计划」发布：混元大模型token免费用

微信小程序正式推出「AI应用及线上工具小程序成长计划」，为开发者提供为期一年的免费资源支持。计划核心福利包括免费使用腾讯混元大模型的Token，涵盖旗舰文生文及文生图等多模态模型能力，并配套云开发、数据分析、广告变现及流量激励。申请条件要求小程序类目为文娱、工具、社交等虚拟行业类目，个人或企业主体均可参与。来源：腾讯混元

Looki完成超2000万美元A轮融资

AI硬件公司Looki完成超2000万美元A轮融资，由蚂蚁集团领投，美团龙珠、华登国际等跟投。Looki的核心产品是一款名为Looki L1的多模态AI穿戴设备，重30克，可通过视觉和音频信号实现智能生活记录和个性化交互。来源：AI智库

AI助手ima支持PPT生成

AI助手ima正式推出PPT生成功能，用户现可通过任务模式一键制作演示文稿。功能支持上传附件或调用知识库资料，自动将文字内容转化为包含数据图表、图标配图和重点突出的专业PPT。用户可自定义风格主题，如简洁商务风、深色科技风等。来源：ima.copilot

1月4·周日

DeepSeek 发布新论文：提出全新 mHC 架构

DeepSeek发布新论文提出全新mHC（流形约束超连接）架构，解决传统超连接在大规模模型训练中的不稳定性问题，同时保持其性能增益。框架通过将残差连接空间投影到特定流形来恢复恒等映射属性，并结合基础设施优化提升效率。来源：AI智库

ListenHub完成200万美元融资，ARR 300万美元进军北美

AI内容生成平台ListenHub的母公司MarsWave已完成200万美元天使+轮融资，由天际资本领投，小米联合创始人王川跟投。公司年经常性收入（ARR）已突破300万美元并实现月度盈亏平衡。此次融资将主要用于进军北美市场，并已任命具有百度、MiniMax等背景的新COO负责全球增长。来源：36氪

TRAE 中国版 SOLO 已全量免费开放！

中国版TRAE SOLO模式现已向全部用户免费开放。AI编程助手支持项目迭代、问题修复与架构重构等复杂开发任务，具备智能任务规划和自主编排智能体能力。用户可免费使用内置的豆包、GLM、MiniMax、Kimi等多款模型，产品将自动基于模型效果和速度配置最佳上下文窗口。来源：TRAE.ai

12月31·周三

Kimi 完成 5 亿美元新融资

中国大模型公司月之暗面（Kimi）近期完成5亿美元C轮融资，由IDG资本领投1.5亿美元，阿里巴巴、腾讯及王慧文等老股东超额认购，投后估值达43亿美元。创始人杨植麟内部信透露，公司现金储备已超100亿元人民币，因此“可以不着急IPO”。本轮融资将用于加速K3大模型的研发和扩增算力。来源：晚点LatePost

Vidu Agent全球正式上线，商业广告一键成片

Vidu推出AI视频创作工具Vidu Agent，支持20多种语言和200多种音色，覆盖商业广告、产品TVC、剧情片等多种创作场景，能一键生成高质量视频。其分镜编辑功能让创作者可以轻松调整镜头顺序、时长和转场效果，实时预览修改后的视频。来源：Vidu AI

软银完成对OpenAI承诺的225亿美元额外投资

软银向OpenAI的400亿美元（约合人民币2799亿元）巨额