AI周刊丨本周不可错过的AI行业动态（6.2-6.8）

Posted in AI专栏, AI快讯.

本篇内容，带你快速了解本周AI热点资讯。

01. AI大事件

比人类算法快70%！谷歌DeepMind用AI改进数据排序，登上Nature

Google DeepMind发布三大AI工具AlphaZero、MuZero、AlphaDev，可提高数据中心资源利用率、提升视频压缩效率、发现更快算法。

AlphaDev发现的新算法将短元素序列的排序效率提高70%，其新排序算法已发布到C++库中。

智源发布“悟界”系列大模型，解码物理世界交互新范式

第七届北京智源大会在中关村开幕。

北京智源人工智能研究院发布“悟界”系列大模型，涵盖多模态世界模型Emu3、脑科学模型见微Brainμ、具身智能大脑RoboBrain 2. 0 以及微观生命模型OpenComplex2，构建全链条AI体系。

谷歌更新 Gemini 2.5 Pro 预览版模型至 06-05 版本，多项 AI 性能提升

谷歌更新了Gemini 2.5 Pro预览版模型至06-05版本，多项AI性能基准测试评分提升，放宽了Pro版用户的请求限制。

LMArena Elo评分上升24分，WebDevArena Elo评分上升35分至1443分，取得业界领先地位。

谷歌对模型进行了风格与结构优化，使其更具创意、回答格式更清晰，提升了交互体验。

上海AI实验室造出首个「通才」机器人大脑

上海人工智能实验室联合多家单位提出了一种全新的通用具身智能大脑框架VeBrain，通过同时集成视觉感知、空间推理和机器人控制能力，可实现多模态大模型（MLLM）对物理实体的直接操控，使机器人能像人类一样“看到-思考-行动”。

微软宣布 6000 人裁员计划，战略重心转向 AI 领域

微软公司今日宣布启动全球裁员计划，涉及约 6000 个岗位，主要集中在非技术类职能部门及部分子公司业务线。

微软与印度 Yotta Data Services 达成战略合作，协同印度AI使命计划参与者、政府机构、印度理工学院、初创企业及商业组织展开协作。

2025全球人工智能技术大会，近千名政产学研各界人士参会

中国人工智能学会主办的2025全球人工智能技术大会（GAITC2025）在杭州未来科技城开幕，本届大会以“交叉、融合、相生、共赢”为主题，全球200多位专家学者分享前沿报告，政产学研各界人士参会。

现场展示了区域在行业大模型落地应用的多项探索成果。

同时，杭州未来科技城启动了人工智能领域知识产权证券化融资专项支持行动，为AI创新企业开辟了全新的融资路径，预计在未来三年内围绕人工智能领域发行5支知识产权证券化产品，辐射企业超过60家，融资额超过5亿元。

Anthropic 宣布将在5天内切断 Windsurf 的所有API访问权限，联合创始人公布原因

Anthropic 宣布将内切断 Windsurf 的所有API访问权限，具体涉及的模型包括：Claude 3.5 Sonnet、Claude 3.7 Sonnet、Claude 3.7 Sonnet Thinking。

Anthropic 联合创始人兼首席科学官 Jared Kaplan 表示，公司之所以切断了 AI 编程助手 Windsurf 直接访问 Claude 模型的权限，主要原因在于市场传闻称 Windsurf 即将被 Anthropic 最大的竞争对手 OpenAI 收购。

02. 新产品发布

谷歌推出Veo3-Fast模型，价格比Veo 3便宜80%

谷歌推出Veo3-Fast模型，生成单个视频消耗20积分，是Veo3的五分之一。

Veo3-Fast生成的视频分辨率与Veo3一致，都是8秒720p，自动生成配音。

即梦图片3.0重磅更新，上线智能参考功能

即梦图片3.0模型更新智能参考功能，在原图一致性保持方面表现出色，精细到头发丝级。用户可通过简单提示语实现添加文字、修改文字、复杂设计等多种操作，生成高质量图片。目前功能灰度测试中，下周APP和Web端将全量上线。

图像编辑模型SeedEdit 3.0发布！更强保持力，更高可用率

字节跳动Seed团队发布图像编辑模型SeedEdit 3.0。模型基于文生图模型Seedream 3.0，采用多样化数据融合方法与特定奖励模型，显著提升图像主体、背景和细节保持能力，在人像编辑、背景更改等场景表现出色。

SeedEdit 3.0可处理4K图像，精准识别并移除无关人物及其影子，能将2D绘画转为真实模特，保持细节。

Cursor 1.0 发布：BugBot代码审查、Memories记忆、一键MCP安装等

Cursor 1.0 正式发布，新增 BugBot 自动代码审查工具，可自动审查 PRs 精准识别潜在问题，发现问题后能在 GitHub 的 PR 上评论提供修复提示。

推出测试版 Memories 功能，可按项目存储对话中的关键信息；支持一键安装 MCP 服务器并简化验证流程；聊天界面新增可视化支持，优化了设置和仪表盘界面；简化定价模式。

OpenAI 发布了两项 ChatGPT 新功能：「连接器」与「记录模式」

OpenAI为ChatGPT推出两项新功能：“连接器”与“记录模式”。

连接器可接入GitHub、Google Drive等平台，实现数据查询与整理，助力企业知识管理。

记录模式则能自动录音、记笔记、生成会议纪要，提升会议效率。

Manus推出文生视频功能，挑战OpenAI、Sora等竞争对手

Manus推出原生“文生视频”功能，目前仅对付费会员开放。

功能可将文本命令快速转换为有序视频故事。Manus 提供 Basic、Plus、Pro 三种会员服务，Pro 会员每月收费 199 美元。

Kimi推出全新AI学术研究助手：学术搜索

Kimi推出全新AI学术研究助手“学术搜索”，通过深度推理搜索、遵循用户指令、实时互动等，帮助用户在学术研究和论文写作中提高效率和质量。

用户可在官网注册登录后使用，适用于学术研究支持、技术问题解决等多种场景。

AI视频神器PixVerse国内版“拍我AI”正式上线

PixVerse国内版“拍我AI”正式上线，网页端和移动端同步推出，支持V4.5版本。

用户可通过访问拍我AI官网和各大应用商店下载体验。产品提供AI特效、首尾帧等创新功能，助力用户创作独特视频。

我国水利标准AI大模型正式发布

水利部国科司组织中国水科院自主研发的“水利标准AI大模型”正式发布并应用。

模型基于“SkyLIM”体系，采用“海量知识库+DeepSeek/Qwen双模型+标准服务”架构，集成1800余项水利水电标准、500余项法律法规等多源语料，具备水利标准查重比对、查询、编制、审查、评估等多维功能。

微软Bing推出AI视频生成工具Bing Video Creator，免费使用Sora模型

微软 Bing 团队推出 Bing Video Creator免费的 AI 视频生成工具，由 OpenAI 的 Sora 模型提供支持。

用户只需在 Bing 移动应用中输入详细的文字描述，可生成5秒长的竖屏视频（9:16格式）。

提供快速和标准两种生成速度，初始有10次免费快速生成机会，之后可使用积分兑换或转为标准速度。

ElevenLabs发布最新版TTS模型——Eleven v3

专攻AI语音合成的独角兽ElevenLabs发布旗下最新版TTS模型——Eleven v3，狠狠拿捏情感控制。

Eleven v3不仅支持70多种语言（含中文），还能进行多人对话聊天，过程中每个人的情绪、语气等表现都非常生动。

官方自信表示，这是“迄今为止最具表现力的文本转语音模型”。

其他动态

秘塔“今天学点啥”平台上线导出PPT功能。用户在视频讲解页面点击“导出PPT”按钮，可下载包含图文、语音讲解及逐字稿的完整PPT。

阶跃星辰To C产品“冒泡鸭”将停运，团队合并至对话产品“阶跃AI”。2025年以来，阶跃星辰将战略重心从C端转移到模型研发和ToB/G上，将ToB的Agent产品作为重点布局方向。

OpenAI宣布将ChatGPT的记忆功能向免费用户逐步开放。免费用户可体验轻量版记忆功能，支持短期对话连续性，付费用户可引用更久远的对话记录。

OpenAI为ChatGPT付费用户升级了语音功能，它的语音更加自然，语调更细腻，节奏更真实(包括停顿和强调)，并且对某些情绪的表达更加精准，包括同理心、讽刺等。在翻译方面也更高效，可以持续进行多轮翻译。

克而瑞推出中国首个房地产垂直领域AI Agent——CRIC深度智联。基于克而瑞20年行业经验与海量数据，结合多模态大模型技术，为房地产行业提供智能化解决方案。CRIC深度智联助力房地产从业者提升工作效率与决策质量，被誉为地产人的“第二大脑”。

银河通用发布全球首个产品级端到端具身FSD大模型TrackVLA。模型具备纯视觉环境感知、语言指令驱动、自主推理及零样本泛化能力，无需提前建图和遥操控制，可实现“听→看→懂→走”的闭环运动。有八大核心能力，包括自然语言理解与目标识别、复杂场景下准确跟随、目标丢失找回、陌生环境自主导航等。

03. 开源项目

阿里开源 Qwen3 新模型 Embedding 及 Reranker

Qwen3上新Embedding系列，专为文本表征、检索与排序任务设计，有0.6B/4B/8B三种尺寸，8B版本在MTEB多语言Leaderboard榜单中排名第一，性能超越一众商业API服务。还发布了排序模型Reranker系列。

快手开源“Auto Think”大模型，根据问题自动调节思考深度

快手 Kwaipilot 团队开源 KwaiCoder-AutoThink-preview 自动思考大模型。模型针对深度思考大模型“过度思考”问题，提出自动思考模型训练范式，融合“思考”和“非思考”能力，可根据问题难度自动切换思考形态。

开源 AI 设计 Agent —— Jaaz，Lovart 的免费平替项目

开源 AI 设计 Agent —— Jaaz，具备强大的 AI 设计能力，可智能生成设计提示，批量生成图像、海报、故事板等。

Jaaz 支持 Ollama、Stable Diffusion、Flux Dev 等本地图像和语言模型，实现免费的图像生成。

小米多模态大模型 MiMo-VL 开源，多方面领先 Qwen2.5-VL-7B

小米正式开源多模态大模型 MiMo-VL。在图片、视频、语言的通用问答和理解推理等多个任务上大幅领先同尺寸标杆多模态模型 Qwen2.5-VL-7B，在 GUI Grounding 任务上比肩专用模型。

Google开源 Deep Research 框架

Google 开源了一个Deep Research 系统模板，详细演示了如何基于 Google Gemini 2.5 模型和 LangGraph 框架构建研究增强型对话式AI，旨在通过动态生成搜索词、使用 Google 搜索查询网络、反思结果以识别知识空白，并迭代优化搜索，直到能够提供有充分支持的答案并附上引用。

谷歌 DeepMind 推出手语翻译模型：SignGemma，打破手语沟通壁垒

谷歌 DeepMind 推出 SignGemma，是强大的手语翻译模型，可将手语转化为口语文本，主要针对美国手语（ASL）和英语深度优化，为开源模型，将于今年晚些时候加入 Gemma 模型家族。DeepMind 希望借此打破手语使用者的沟通障碍，助力他们在工作、学习和社交中更顺畅地参与。

面壁小钢炮MiniCPM 4.0开源，端侧推理常规提速5倍

面壁智能重磅推出MiniCPM 4.0 ——一个极致高效的端侧大模型，通过其 CPM.cu 自研推理框架，可实现220倍极致的速度提升，5 倍常规提速。

本次在开源社区核心推出 8B 和 0.5B 两个参数规模的版本，均在同级别模型对比中实现了最佳性能。

04. 投资融资

图灵奖得主Bengio再创业：启动资金就筹集了3000万美元

图灵奖得主、深度学习三巨头之一Yoshua Bengio再次创业，成立非营利组织LawZero，已筹集3000万美元启动资金。

LawZero构建“设计即安全”的AI系统，不做Agent，而是监督Agent，以理解学习世界为核心目标，提供可验证的真实答案。

AMD 收购 AI 软件优化初创公司 Brium

AMD 宣布收购 Brium，Brium 专注于开发可适配多种硬件架构的机器学习推理技术，能让原本为英伟达等特定硬件设计的 AI 模型在其他品牌平台上有效运行。AMD 表示此举在推动“高性能、开放的 AI 软件生态建设”，支持开发者创新。

05. 观点洞察

Sam Altman建议企业领导者:直接开始，别等下一个版本

在本周旧金山举办的 Snowflake Summit 2025 上，OpenAI CEO Sam Altman 开门见山地指出，对于2025年仍在观望的企业领导者，他的建议只有一句：直接开始，别等下一个版本。

他表示，企业若总是等待更好的模型、更成熟的方案，反而会错过真正的先发优势。真正取得突破的，是那些愿意及早下注、小步快跑的团队。科技在飞速演进，胜负取决于谁拥有快速试错、快速学习的能力。

Snowflake CEO Sridhar Ramaswamy 对此高度认同。他认为，好奇心是今天企业中最被忽视的稀缺能力。很多过去理所当然的工作方式，如今都需要被质疑。

原文链接：AI周刊丨本周不可错过的AI行业动态（6.2-6.8）