Blog

  • uBrand – 一站式AI品牌创建和设计平台

    uBrand是一个一站式AI品牌创建和设计的平台,提供在线品牌设计、AI品牌策划,智能品牌营销等功能,帮助创业者轻松打造个性品牌。uBrand从Logo开始,只需4步即可快速打造专业品牌: 1. 树立专业品牌形象 2. AI助力您的品牌故事 3. 智能生成品牌设计 4. 在线管理品牌资源

    uBrand官网

    uBrand的主要功能

    • 智能LOGO生成:在线快速生成品牌logo,智能根据品牌名称和属性快速生成适用于各种行业的公司Logo
    • 品牌定位/策划:明确和传达品牌使命、愿景、价值观、品牌故事等,打动每一个顾客
    • 品牌VI设计生成:上传Logo就能生成透明背景、独立Logo图标、以及微信微博小红书等各类社交媒体头像及封面设计
    • 智能品牌设计:uBrand将为你自动生成全套品牌设计,从公司名片,宣传海报,到广告社交媒体设计
    • 品牌资源管理:在线收集管理你的品牌资产、Logo、字体、设计、矢量文件、宣传视频… 30+格式在线预览

    如何使用uBrand

    1. 访问uBrand的官网(ubrand.com),点击创建我的品牌,然后登录/注册你的账号
    2. 登录成功后会自动开始进入品牌设计界面,首先输入品牌名称,然后便可开始创建logo
    3. 可上传已有的logo文件或选择AI生成logo(选择字体、风格和颜色即可智能生成logo)

    uBrand的产品价格

    • 免费版:0元每月,支持免费在线体验,可创立20个品牌资源、1GB存储空间
    • Pro版:49元每月、399元每年、999元终身版,可创立无限个品牌资源、25GB存储空间
  • 笔墨公文 – AI驱动的公文写作平台

    笔墨公文是什么

    笔墨公文是北京笔墨跳动科技推出的AI公文写作平台,为用户提供了一站式的AI公文创作辅助功能,包括AI生成公文内容、各类主题的公文模版、公文范文示例和丰富的公文素材库,可帮助用户轻松掌握公文写作的秘诀和范式,打破创作限制。借助AI的强大支持,实现一次性创作出高质量高水平的公文佳作。

    笔墨公文官网

    笔墨公文的主要功能

    1. 多种文体主题的公文写作:支持述职报告、调查研究、工作总结、心得体会等文种的公文创作
    2. 文本内容纠错校对润色:智能检测错别字、语法、涉政等多种错误,公文风格文本润色,让你的表达更专业
    3. 丰富的优选范文与素材库:提供众多高质量的范文和素材,涵盖广泛的主题和风格,供用户参考和借鉴
    4. 多样化公文模板灵活选择:内置10余种法律性公文模板,如决议、决定、公告等,以及20多种事务性公文模板,包括总结、规定、制度等

    笔墨公文AI写作

    笔墨公文的使用方法

    1. 访问笔墨公文的官网(bimogongwen.com/agi/),点击免费试用按钮
    2. 选择要创作的文种,输入主要信息,点击生成大纲,登录/注册账号
    3. 待生成大纲完成后,可对提纲进行修改或重新生成,点击下一步生成文章
    4. 等待片刻,AI便会根据先前生成的大纲生成公文

    笔墨公文的产品价格

    1. 免费版:新用户可获得免费AI生成5000字,校对润色1000字,精品范文5篇,优质素材5篇,公文模板5次的权益
    2. 月度会员:79元,可拥有AI写作60000字,校对润色20000字,精品范文500篇,优质素材2500篇,公文模板500次的权益
    3. 季度会员:159元,可拥有AI写作180000字,校对润色60000字,精品范文2000篇,优质素材10000篇,公文模板2000次的权益
    4. 半年会员:259元,可拥有AI写作400000字,校对润色120000字,精品范文6000篇,优质素材30000篇,公文模板6000次的权益
    5. 年度会员:399元,可拥有AI写作800000字,校对润色240000字,精品范文15000篇,优质素材75000篇,公文模板15000次的权益
  • 海艺AI – 免费的AI绘画和图片生成平台

    海艺AI是什么

    海艺AI是一款高效且易用的AI绘画和图片生成工具,让你无需专业技能,输入提示词即可轻松生成高质量图片。得益于强大的渲染引擎、丰富的模型库和专业级功能,高质量创作触手可及。结合智能推荐系统和社区互动分享功能,海艺AI让用户在创意设计和艺术表达中如鱼得水,快速生成真实、高品质作品,满足个性化需求。

    海艺AI SeaArt官网

    海艺AI 的功能特色

    1. 自然语言理解与提示词润色:只需以自然语言输入创作描述,海艺的AI系统会自动理解需求,并提供智能润色功能。
    2. 各种风格和场景的图片生成:支持AI生成二次元、卡通、游戏、摄影、建筑、插画、写实等不同风格的图像。
    3. 多元化AI图像创作模式:不仅支持传统的文生图和图生图,还提供了12种控制网条件生图创作模式。
    4. 海量丰富的模型库:对接Civitai的模型库,支持直接使用Civitai内的几乎所有模型和lora。用户也可手动上传模型。
    5. 全新自研大模型升级至 V6版本:大幅提升出图质量,让细节更丰富,色彩层次更合理,立体感更强,文本理解能力更佳。
    6. 图像智能描述与局部重绘:支持导入图片自动提取关键词,也支持涂抹并进行局部重绘。
    7. 图片高清修复:支持将低分辨率的图片高清放大修复,并保留画面细节。
    8. 活跃的AI绘画社区:用户积极分享创作的天马行空的AI绘画作品,可自由探索并复用提示词。

    海艺AI SeaArt

    海艺AI 的使用方法

    1. 访问海艺AI的官网(haiyi.art),点击右上角的登录按钮进行登录/注册
    2. 点击顶部的创作按钮进入创作界面,在底部输入框中输入提示词或点击预置的示例提示词
    3. 右侧面板可进行参数设置,如切换模型、风格、模式、图片生成数量、图片尺寸等
    4. 设置完毕后,点击发送图标,等待片刻,海艺AI便能生成你想要的图片

    海艺AI 的产品价格

    海艺AI价格

    • 免费版:用户注册后每日可免费生成图片150张
    • SVIP权益卡:
      • 初级版:月付16元每月(年付折合18元每月),每天可获得300体力
      • 标准版:月付68元每月(年付折合54元每月),每天可获得700体力
      • 专业版:月付208元每月(年付折合166元每月),每天可获得2100体力
      • 大师版:月付348元每月(年付折合274元每月),每天可获得3500体力
    • 算力充值:算力可进行模型训练、AI绘画创作、付费解锁图集、付费使用模型,算力永不过期。价格为6元700算力、30元3800算力、68元7700算力、148元17000算力、328元45000算力、648元90000算力
    • VIP权益卡:享受专属快速队列创作通道和下列大量特权,以及每日赠送700体力,约能创作700张普通模式的图片,价格为1元VIP 1日卡限购1次、6元VIP 1日卡(首充赠700算力)、30元VIP 7日卡(首充赠3800算力)、68元VIP 30日卡(首充赠7700算力)、168元 VIP 90日卡(首充赠23000算力)、298元 VIP 180日卡(首充赠38000算力)、498元 VIP 360日卡(首充赠74000算力)

    海艺AI的常见问题

    海艺AI是免费的吗?
    海艺AI为用户提供免费的AI图片生成次数,每日可免费生成约150张图片。
    海艺AI生成的图片可以商用吗?
    海艺AI生成图片的知识产权属于用户,可用于个人作品或商业用途。
    海艺AI有移动端App吗?
    海艺AI目前仅支持通过浏览器网页端使用,暂未推出移动端App。
  • OpenAI CEO Sam Altman 离职事件时间线最全盘点

    近日 OpenAI CEO Sam Altman 被董事会罢免的事件在人工智能行业乃至全世界引起轩然大波,AI工具集整理了从事件起初到最新的报道,梳理了整个事件的时间脉络,按事件发生和英文报道的北京时间先后顺序整理排列,让你一文弄懂 Sam Altman 被罢免风波的来龙去脉。若你对该事件有任何看法和观点,欢迎在下方评论区留言分享。
    Sam Altman离职事件时间线

    点击切换为:按时间倒序排列
    fire emoji11月18日·罢免开端,人事动荡
    11月18日 04:28

    OpenAI 突然罢免 CEO Sam Altman,董事会称对其领导能力失去信心

    OpenAI 发布公告宣布,Sam Altman 将辞去首席执行官一职,并退出董事会,首席技术官 Mira Murati 被任命为临时首席执行官。此外,Greg Brockman 将辞去董事会主席职务,并继续担任公司职务。OpenAI表示:“在 Altman 离职之前,董事会进行了审慎的审查,得出的结论是,他在与董事会的沟通中并不坦诚,阻碍了他履行职责的能力,董事会也不再相信他继续领导 OpenAI 的能力。”
    OpenAI Leadership Transition

    公告全文:OpenAI announces leadership transition

    11月18日 05:21

    谷歌前 CEO 发文谈 OpenAI 首席执行官离职

    谷歌前 CEO 施密特发文,感谢Altman为人工智能做出的贡献。施密特表示,“Sam Altman是我心目中的英雄。他将一家公司从一无所有发展到价值 900 亿美元,并永远改变了我们的集体世界。我迫不及待地想看看他接下来会做什么。我和数十亿人将从他未来的工作中受益——这将是令人难以置信的。谢谢你为我们所有人所做的一切。”
    Eric Schimidt感谢Sam Altman

    11月18日 05:46

    Sam Altman 回应:稍后会说明更多情况

    Sam Altman 在 X 平台发推:“我很喜欢在 OpenAI 的时光。这对我个人来说是变革性的,希望对世界也有一点变革。最重要的是,我喜欢与这些才华横溢的人一起工作。稍后会说明更多情况。”
    Sam Altman response

    11月18日 05:48

    OpenAI 将在 CEO 离职后召开全体员工大会

    据知情人士透露,在 OpenAI 决定解雇首席执行官Sam Altman之后,该公司刚被任命的临时首席执行官Mira Murati及其团队将于当地时间周五下午向公司员工发表讲话。公司希望能够消除员工对公司未来融资前景等问题的忧虑。

    相关报道:财联社 – OpenAI将在CEO离职后召开全体员工大会

    11月18日 07:25

    微软 CEO 回应:将继续致力于与 OpenAI 的长期合作

    微软 CEO Satya Nadella 发文称:“正如您本周在 Microsoft Ignite 上看到的那样,我们将继续为这个 AI 时代快速创新,在整个技术堆栈中发布了 100 多项公告 – 从 Azure 中的 AI 系统、模型和工具到 Copilot。最重要的是,我们致力于为我们的客户提供所有这些,同时构建未来。我们与 OpenAI 签订了长期协议,可以完全访问我们实现创新议程和令人兴奋的产品路线图所需的一切,并继续致力于维持Mira 及其团队的合作伙伴关系。我们将共同努力,继续为世界带来这项技术的有意义的好处。”
    微软CEO的回复

    11月18日 08:09

    OpenAI 联合创始人兼董事长 Greg Brockman 宣布将辞职

    Greg Brockman 在 X 平台发推:“根据今天的消息,我辞职了。” 回应的全文内容:“自从 8 年前在我的公寓开始工作以来,我对我们大家一起建造的东西感到非常自豪。我们一起经历了艰难而又美好的时光,尽管有种种原因,但我们还是取得了如此多的成就。但根据今天的新闻,我辞职了。真诚地祝愿你们一切顺利。我仍然坚信创造造福全人类的安全通用人工智能的使命。”
    Greg Brockman宣布辞职

    11月18日 12:42

    Greg Brockman 发文谈 Altman 被罢免风波的细节

    Greg Brockman 发文透露,昨晚,Altman 收到公司首席科学家 Ilya Sutskever 发来的短信,要求周五中午谈话。Sutskever 告诉 Altman 他将被解雇,并且消息很快传出。周五中午12点23分,Sutskever 发送了一条 Google Meet 会议链接,Brockman 被告知,他将被从董事会中除名,而 Altman 已被解雇。Brcokman 也被解除了董事会主席职务(但没有被公司开除),随后,他宣布自己将从公司离职。据 Brockman 了解,公司 CTO Mira Murati 是在周四晚上就知道了公司的决定,除此之外他们都是被临时通知的。
    Greg Brockman 谈细节

    11月18日 13:32

    Sam Altman 发声:若自己“开火”,董事会将索赔

    在早些时候被 OpenAI 罢免的原 CEO Sam Altman 再度在 X 平台发文宣称,如果自己“开火”,OpenAI 的董事会将向他追讨自己所持股票的全部价值。(if i start going off, the openai board should go after me for the full value of my shares)
    Sam Altman 二次发声

    11月18日 14:41

    消息称:三名 OpenAI 高级研究人员宣布辞职

    据 The Information 报道,三名 OpenAI 高级研究人员宣布辞职,称受到了 OpenAI 原 CEO Sam Altman 被解雇、总裁Greg・Brockman 突然辞职的影响。这三位高级研究人员包括公司研究主管雅库布・帕乔基(Jakub Pachocki)、评估 AI 潜在风险的团队负责人亚历山大・马德里(Aleksander Madry)和已经供职 7 年时间的研究员西蒙・西多尔(Szymon Sidor)。

    英文报道:The Information – Three Senior OpenAI Researchers Resign as Crisis Deepens

    中文报道:IT之家 – 继 CEO、总裁之后,消息称又有三名 OpenAI 高级研究人员宣布辞职

    helicopter emoji11月19日·外部施压,回归有望
    11月19日 01:57

    OpenAI 内部备忘录称 Sam Altman 被解雇背后不存在“渎职”

    据 Axios 报道,根据 OpenAI 首席运营官 Brad Lightcap 的一份内部备忘录,OpenAI 首席执行官 Sam Altman 被解雇并不是因为“渎职或与我们的财务、业务、安全或安全/隐私实践相关的任何事情”,而是因为“Sam Altman 与董事会之间的沟通中断”。

    英文报道:Axios – No “malfeasance” behind Sam Altman’s firing, OpenAI memo says

    中文报道:财联社 – OpenAI备忘录称Sam Altman被解雇背后不存在“渎职”

    11月19日 02:53

    Sam Altman 被解雇后,OpenAI 的 860 亿美元股票出售陷入困境

    据一位知情人士透露,此前由 Thrive Capital 牵头的以 860 亿美元估值对 OpenAI 进行的要约收购尚未结束,但已进入最后阶段,预计最快下个月完成。截至周六,三名计划参与招标的前 OpenAI 员工表示,他们不再预计此次出售会发生,或者即使发生,由于最近发生的事态发展,其估值也会较低。

    英文报道:The Information – OpenAI’s $86 Billion Share Sale in Jeopardy Following Altman Firing

    11月19日 03:46

    Sam Altman 计划创办一个新的 AI 企业

    据一位知情人士透露,最近被赶下台的 OpenAI 首席执行官 Sam Altman 一直告诉投资者,他计划推出一家新的人工智能企业。该人士表示,OpenAI 前总裁 Greg Brockman 预计也将加入该公司,该项目仍在开发中。目前尚不清楚该合资企业的确切性质,可能是一家人工智能芯片公司。

    英文报道:The Information – OpenAI Co-Founder Altman Plans New AI Venture

    中文报道:腾讯科技 – 传奥特曼早已在筹划创办新初创公司,孙正义或是背后投资人

    11月19日 06:44

    OpenAI 的投资者正在向董事会施压,要求 Sam Altman 重返公司

    彭博援引知情人士报道称,OpenAI 的投资者正在向 OpenAI 董事会施压,要求撤销罢免这一决定。上述知情人士还称,微软CEO Satya Nadella一直与阿尔特曼保持联系,并承诺无论阿尔特曼下一步采取什么措施,都会支持他。

    英文报道1:Bloomberg – OpenAI Board Urged by Microsoft, Investors to Restore Altman

    英文报道2:The Verge – OpenAI board in discussions with Sam Altman to return as CEO

    中文报道:科创板日报 – 投资人施压、董事会松口,阿尔特曼或重返OpenAI?

    11月19日 14:25

    OpenAI 内部备忘录:对召回 Altman 和 Brockman 持乐观态度

    知情人士透露,OpenAI首席战略官 Jason Kwon 美国东部时间周六晚上在备忘录中告诉员工,OpenAI 对能够 Sam Altman、Greg Brockman 和其他关键员工重返岗位持“乐观态度”。

    英文报道:The Information – OpenAI ‘Optimistic’ It Can Bring Back Sam Altman, Greg Brockman

    中文报道:腾讯科技 – OpenAI:对召回奥特曼和布罗克曼持乐观态度,周一凌晨揭晓答案

    bomb emoji11月20日·谈判破裂,回归失败
    11月20日 01:34

    马斯克:研发先进AI风险非常高,OpneAI 应公布解雇 Altman 的原因

    特斯拉首席执行官埃隆·马斯克(Elon Musk)表示,由于研发先进人工智能(AI)技术的潜在危险非常高,作为目前世界上最强大的人工智能公司,OpenAI应该解释其解雇其首席执行官 Sam Altman 的原因。
    Elon Musk谈OpenAI

    英文报道:Business Insider – Musk Says Risk of AI so High OpenAI Should Say Why It Fired Sam Altman

    中文报道:网易科技 – 马斯克:研发先进AI风险非常高,OpneAI应公布解雇奥特曼的原因

    11月20日 04:06

    Altman 和 Brockman 抵达 OpenAI 总部,高管们力促恢复两人职位

    一位知情人士称,在 OpenAI 董事会解雇 Sam Altman 两天后,当地时间周日,Sam Altman 在该公司旧金山总部与高管们会合,推动董事会恢复他和其他最近离职的高管的职位。据知情人士透露,临时首席执行官 Mira Murati 早些时候告诉员工,她和领导团队邀请了 Altman。其中一位知情人士称,OpenAI 前董事长兼总裁 Greg Brockman 也在周日抵达办公室。

    英文报道:The Information – Altman, Brockman Arrive at OpenAI Headquarters as Execs Push to Reinstate Them

    中文报道:IT之家 – OpenAI 前 CEO Sam 与前总裁 Greg 在旧金山总部与高管会面

    11月20日 05:03

    Altman 发贴胸前佩戴 OpenAI 的“访客”牌的自拍照

    Altman 在社交媒体X平台上传了一张自己位于 OpenAI 位于旧金山总部的照片,不过,他脖子上佩戴的是OpenAI的“访客”牌,证明其CEO和董事的职位尚未完全恢复。
    Sam Altman自拍身戴访客卡

    11月20日 06:21

    OpenAI 董事会谈判就 Altman 重返公司后董事会的组成和角色问题上陷入僵局

    据知情人士透露,一群OpenAI高管和投资者试图恢复 Sam Altman 首席执行官一职,但在董事会的组成和角色问题上陷入了僵局。尽管谈判仍在进行中,但解决方案可能很快就会出现。OpenAI 领导团队希望解散董事会,但董事们拒绝。董事会指定当地时间下午 5 点为满足 Altman 要求的最后期限。

    英文报道:Bloomberg – OpenAI Leaders’ Efforts to Bring Back Altman Reach Impasse Over Board Role

    中文报道:新浪财经 – OpenAI高管及投资者力主恢复Altman的CEO职务,谈判卡在董事会问题上

    11月20日 08:01

    若 Altman 重返 OpenAI,微软将考虑进入董事会

    据两位知情人士透露,OpenAI 最大的支持者微软正在考虑,如果被罢免的首席执行官 Sam Altman 重返公司,微软将计划在董事会中担任一职。其中一位知情人士表示,微软考虑加入OpenAI的董事会的一员或作为没有投票权的董事会观察员。

    英文报道:The Information – Microsoft Eyes Seat on OpenAI’s Revamped Board

    中文报道:新浪财经 – 消息称如果Altman回归OpenAI,微软考虑在OpenAI获得董事会席位

    11月20日 12:58

    Sam Altman 回归 OpenAI 失败,董事会已任命 Emmett Shear 为临时 CEO

    OpenAI 联合创始人兼董事会董事 Ilya Sutskever 表示,尽管公司高管努力挽回 Sam Altman,但他不会再担任 OpenAI 首席执行官。Sutskever 告诉员工,在与周五解雇他的董事会以及剩余的领导人和顶级投资者进行了一个周末的谈判后,Altman 将不会回到他于 2015 年共同创立的初创公司。Sutskever 表示,亚马逊旗下视频流媒体网站 Twitch 的联合创始人 Emmett Shear 将接任临时首席执行官。

    英文报道:The Information – Emmett Shear Becomes Interim OpenAI CEO as Altman Talks Break Down

    中文报道:IT之家 – 消息称阿尔特曼回归 OpenAI 失败,董事会已任命 Emmett Shear 为临时 CEO

    11月20日 15:53

    微软 CEO:Altman 和 Brockman 将加入微软领导一个新的高级 AI 研究团队

    OpenAI最大股东兼合作伙伴微软的首席执行官纳德拉宣布,OpenAI创始人兼前CEO山姆·奥特曼(Sam Altman)和前总裁格雷格·布洛克曼Greg Brockman)将加入微软。纳德拉表示,奥特曼和布洛克曼及其同事将加入微软,领导一个新的高级AI研究团队。纳德拉还在推文中证实了,埃米特·谢尔(Emmett Shear)将担任OpenAI CEO,“我们期待了解埃米特·谢尔和OAI的新领导团队并与他们合作。”
    微软CEO:Altman和Brockman将加入微软

    英文报道:The Verge – Microsoft hires former OpenAI CEO Sam Altman

    中文报道:澎湃新闻 – 微软CEO:OpenAI创始人奥特曼和布罗克曼将加入微软

    11月20日 17:01

    OpenAI 临时 CEO 承诺将调查 Altman 被罢免一事,并改革管理层

    OpenAI 临时首席执行官 Emmett Shear 周一誓言将聘请一名独立调查员来调查联合创始人萨姆・阿尔特曼(Sam Altman)突然被罢黜一事,并在未来 30 天内改革管理团队,以期在经历了一个戏剧性的周末后恢复人们对这家美国初创公司的信任。
    Emmett Shear发文

    英文报道:Business Insider – OpenAI’s New CEO Reveals Plans for His First 30 Days in 1 a.m. X Post

    中文报道:IT之家 – OpenAI 临时 CEO 承诺将调查阿尔特曼被罢免一事,并改革管理层

    11月20日 18:00

    OpenAI 高管员工集体发文:没有员工,OpenAI 什么也不是

    OpenAI 高管(包括CTO、COO)员工们,在社交平台X上集体刷屏!他们都说了同一句话:OpenAI is nothing without its people。翻译过来:没有员工,OpenAI什么都不是。Sam Altman 转发很多这类帖子,并回复“爱心”。
    OpenAI is nothing without its people

    11月20日 21:15

    Ilya Sutskever 发文:对参与董事会的行动深感后悔

    OpenAI 联合创始人兼首席科学家 Ilya Sutskever 在社交平台X上表示,对参与董事会的行动深感后悔,从未想过要伤害 OpenAI。“我热爱我们共同建立的一切,我会尽我所能让公司重新团聚起来。”
    Ilya Sutskever发文称后悔

    11月20日 21:30

    OpenAI 超 700 名员工签署集体辞职联名信要求恢复 Altman 和 Brockman 的职务

    据外媒 Wired报道,当地时间周一,500 多名(最新已超过700名) OpenAI 员工签署了一封公开信,以集体辞职威胁OpenAI董事会退出,并恢复Sam Altman的首席执行官职务,以及联合创始人Greg Brockman的总裁职务。有趣的是,联名信的签署人中,也包括了 Ilya Sutskever 的名字。

    英文报道:Wired – OpenAI Staff Threaten to Quit Unless Board Resigns

    中文报道:虎嗅 – OpenAI 近 500 名员工签署集体辞职联名信要求恢复 Sam Altman 和 Greg Brockman 的职务

    watch emoji11月21日·余波未了,地震持续
    11月21日 01:57

    OpenAI 超过100名客户联系竞争对手 Anthropic

    据知情人士透露,周末有超过 100 名 OpenAI 客户联系了其竞争对手 Anthropic,这家初创公司近几个月从亚马逊和谷歌筹集了数十亿美元资金。知情人士称,还有其他客户联系了 Google Cloud 和 OpenAI 初创公司竞争对手 Cohere,许多 OpenAI 客户也在考虑转向微软的 Azure 服务,该服务提供 OpenAI 模型和其他模型的副本。

    英文报道:The Information – OpenAI’s Customers Consider Defecting to Anthropic, Microsoft, Google

    中文报道:新浪网 – OpenAI超过100名客户联系竞争对手Anthropic

    11月21日 02:59

    消息称 Altman 仍愿意重回 OpenAI 当 CEO,前提是董事会下台

    Altman 转投微软的交易尚未敲定,Ilya Sutskever 转而支持 Altman 意味着两名董事会成员需要改变主意。多位消息人士告诉 The Verge,如果解雇他的其余董事会成员下台,他和联合创始人 Greg Brockman 仍然愿意重返 OpenAI。

    英文报道:The Verge – Sam Altman is still trying to return as OpenAI CEO

    中文报道:IT之家 – 消息称阿尔特曼仍愿意重回 OpenAI 当 CEO,前提是董事会下台

    11月21日 03:39

    Altman 称与微软 CEO 的首要任务是确保 OpenAI 茁壮成长

    Sam Altman 在社交媒体表示,「Satya和我的顶级优先任务仍然是确保OpenAI继续“茁壮成长”。我们将恪守“向合作伙伴和客户们全面提供运营延续性”的承诺。OpenAI与微软之间的合作伙伴关系让这具有非常高的可行性。」
    Sam Altman发文称优先事项

    11月21日 04:15

    OpenAI 曾试图邀请前 GitHub CEO 和 Scale AI 创始人担任临时 CEO 的职位

    据知情人士透露,在前 Twitch 首席执行官 Emmett Shear 接受 OpenAI 临时首席执行官职位之前,董事会曾邀请 Nat Friedman(微软旗下 GitHub 的前首席执行官、人工智能初创公司的多产投资者)以及 Scale AI 联合创始人兼首席执行官 Alex Wang 担任该职位。知情人士称,两人都拒绝了这一提议。

    英文报道:The Information – Former GitHub CEO Friedman, Scale AI Founder Wang Declined OpenAI Top Job

    11月21日 04:16

    Salesforce CEO 发文邀请从OpenAI辞职的研究人员加入

    Salesforce首席执行官 Marc Benioff 抛出橄榄枝,邀请从OpenAI辞职的研究人员加入。Benioff在X平台发帖称,Salesforce将对从OpenAI辞职的研究人员提供与之前相匹配的薪酬待遇。Benioff邀请这些员工加入Silvio Savarese领导的Salesforce Einstein Trusted AI研究团队。
    Marc Benioff发文

    11月21日 06:38

    消息称 OpenAI 投资者正考虑起诉公司董事会

    路透社援引知情人士的话透露,OpenAI 部分投资者正考虑对公司董事会采取法律行动,目前正在与法律顾问进行探讨。投资者担心他们投资 OpenAI 的数亿美元可能会遭受“灾难性损失”,因为这家热门企业似乎正面临崩溃的风险。

    英文报道:Reuters – OpenAI investors considering suing the board after CEO’s abrupt firing

    中文报道:IT之家 – 消息称 OpenAI 投资者正考虑起诉公司董事会

    11月21日 06:54

    Altman 仍可能重返OpenAI,微软CEO表态:对此持开放态度

    微软首席执行官萨蒂亚·纳德拉日前表示,他对Sam Altman重返OpenAI持开放态度;纳德拉表示,无论Altman是加入微软还是回到OpenAI,这位企业家都将与微软合作;他还表示,无论怎样,OpenAI都需要改革治理方式。

    英文报道:CNBC – Microsoft CEO Nadella says OpenAI governance needs to change no matter where Altman ends up

    中文报道:财联社 – 奥特曼仍可能重返OpenAI 微软CEO表态:对此持开放态度

    11月21日 09:25

    OpenAI 董事会曾联系竞争对手 Anthropic 讨论合并

    据媒体援引知情人士说法称,在开除掉Sam Altman之后,OpenAI董事会曾与其主要竞争对手、明星AI初创公司Anthropic联合创始人兼CEO Dario Amodei探讨两家公司合并事宜。知情人士表示,OpenAI董事会试图说服Dario Amodei接任OpenAI CEO的位置,所以谈到了合并的事情。但Amodei拒绝了该提议。

    英文报道:The Information – OpenAI’s Board Approached Anthropic About Merger

    中文报道:华尔街见闻 – OpenAI董事会曾联系竞争对手Anthropic讨论合并

    11月21日 13:11

    OpenAI 正在积极讨论“重新团聚”公司事宜

    据 OpenAI 全球事务副总裁 Anna Makanju 周一在给员工的备忘录中显示,OpenAI 正在进行积极讨论,以 “重新团聚” 公司。OpenAI 员工正与创始人Sam Altman“保持联系”,与CEO、董事会“进行接触”。OpenAI 表示,我们的头号目标是 OpenAI 重新团结。

    英文报道:Bloomberg – OpenAI in ‘Intense Discussions’ to Quell Potential Mutiny

    中文报道:新浪财经 – 备忘录:OpenAI正在积极讨论“重新团聚”事宜

    rolercoaster emoji11月22日·再度反转,确认回归
    11月22日 01:40

    OpenAI 董事会据称正与 Sam Altman 就回归进行谈判

    据媒体报道,OpenAI联合创始人、前CEO山姆·奥特曼和该公司董事会成员已开始谈判,双方在探讨奥特曼重返OpenAI的可能性。一位知情人士表示,目前正在讨论的一种情况是,奥特曼将以过渡董事会的董事身份回归OpenAI。

    英文报道:Bloomberg – Sam Altman, OpenAI Board Open Talks to Negotiate His Possible Return

    中文报道:财联社 – 奥特曼“王者归来”?OpenAI董事会据称正与其就回归进行谈判

    11月22日 04:06

    微软为 OpenAI 员工涌入做好公司办公方面的准备

    据海外科技媒体Axios最新报道,微软正在为迎接Sam Altman和OpenAI员工们做准备,包括腾出办公空间、配备计算资源等。据知情人士透露,微软正在旗下领英(LinkedIn)的旧金山办公室设立出一块办公场所,值得一提的是,此地距离OpenAI在旧金山的主楼只有10分钟的车程。

    英文报道:Axios – Microsoft prepares for influx of OpenAI employees

    中文报道:财联社 – 微软为OpenAI员工敞开怀抱!据称已腾出办公地、配备计算机

    11月22日 05:49

    OpenAI 鼓励员工在董事会混乱的情况下专注于工作

    OpenAI产品副总裁Peter Deng周二在致员工的信中称,是时候“重新启航”了。此举是为了让公司专注于软件开发和建立合作伙伴关系,而不是围绕上周五被董事会解雇的奥特曼是否会重返首席执行官一职而上演的“他会不会回来”的大剧。Deng在信中表示,“引导我们精力的最佳方式”是开发人工智能产品。

    英文报道:Bloomberg – OpenAI Encourages Staff to Focus on Work Despite Boardroom Chaos

    中文报道:财联社 – OpenAI 产品副总裁呼吁员工回公司上班

    11月22日 07:23

    在 Altman 下台之前,OpenAI 董事会已经开始分裂且争斗不断

    据纽约时报报道,在 Sam Altman 上周被 OpenAI 驱逐之前,他和公司董事会已经争吵了一年多。随着 OpenAI 因其流行的 ChatGPT 聊天机器人而成为主流名称,董事会紧张局势变得更加严重。Sam Altman 在被免去首席执行官职务几周前称 OpenAI 董事会成员 Helen Toner 与他人共同撰写的一篇研究论文批评了公司,驱逐了该董事会成员。

    英文报道1:The New York Times – Before Altman’s Ouster, OpenAI’s Board Was Divided and Feuding

    英文报道2:The Information – Altman Argued With OpenAI Board Member Toner Before Ouster

    11月22日 07:57

    微软正在讨论一份计划要求 OpenAI 董事会进行的治理改革清单

    据知情人士称,微软正在讨论一份计划要求OpenAI董事会进行的治理改革清单,以改善董事会的运作,并防止微软在OpenAI未来的重大战略举措中再次被搞得措手不及。已经提出聘请奥特曼的微软表示,只要满足某些条件,愿意让奥特曼重返OpenAI。而无论结局如何,微软都希望解决导致现有OpenAI董事会解雇奥特曼的治理问题。

    英文报道:Bloomberg – Microsoft Is Discussing Governance Changes It Wants From OpenAI

    中文报道:财联社 – 被“先斩后奏”惹恼了!微软欲插手改造OpenAI董事会

    11月22日 14:03

    OpenAI:Altman 将重返公司任CEO,美国前财长加入新董事会

    OpenAI在社交平台X上宣布,已经原则上达成协议,Altman 将重返公司担任CEO。新的董事会名单显示,只保留了Quora的首席执行官 Adam D’Angelo,Salesforce前联合首席执行官布 Bret Taylor 和前美国财政部长 Larry Summers 加入新成立的董事会。
    OpenAI Sam Altman回归

    相关报道:科创板日报 – OpenAI官宣奥特曼重回公司担任CEO,董事会启动“重置”

    rolercoaster emoji11月22日·再度反转,确认回归
    11月22日 14:03

    OpenAI:Altman 将重返公司任CEO,美国前财长加入新董事会

    OpenAI在社交平台X上宣布,已经原则上达成协议,Altman 将重返公司担任CEO。新的董事会名单显示,只保留了Quora的首席执行官 Adam D’Angelo,Salesforce前联合首席执行官布 Bret Taylor 和前美国财政部长 Larry Summers 加入新成立的董事会。
    OpenAI Sam Altman回归

    相关报道:科创板日报 – OpenAI官宣奥特曼重回公司担任CEO,董事会启动“重置”

    11月22日 07:57

    微软正在讨论一份计划要求 OpenAI 董事会进行的治理改革清单

    据知情人士称,微软正在讨论一份计划要求OpenAI董事会进行的治理改革清单,以改善董事会的运作,并防止微软在OpenAI未来的重大战略举措中再次被搞得措手不及。已经提出聘请奥特曼的微软表示,只要满足某些条件,愿意让奥特曼重返OpenAI。而无论结局如何,微软都希望解决导致现有OpenAI董事会解雇奥特曼的治理问题。

    英文报道:Bloomberg – Microsoft Is Discussing Governance Changes It Wants From OpenAI

    中文报道:财联社 – 被“先斩后奏”惹恼了!微软欲插手改造OpenAI董事会

    11月22日 07:23

    在 Altman 下台之前,OpenAI 董事会已经开始分裂且争斗不断

    据纽约时报报道,在 Sam Altman 上周被 OpenAI 驱逐之前,他和公司董事会已经争吵了一年多。随着 OpenAI 因其流行的 ChatGPT 聊天机器人而成为主流名称,董事会紧张局势变得更加严重。Sam Altman 在被免去首席执行官职务几周前称 OpenAI 董事会成员 Helen Toner 与他人共同撰写的一篇研究论文批评了公司,驱逐了该董事会成员。

    英文报道1:The New York Times – Before Altman’s Ouster, OpenAI’s Board Was Divided and Feuding

    英文报道2:The Information – Altman Argued With OpenAI Board Member Toner Before Ouster

    11月22日 05:49

    OpenAI 鼓励员工在董事会混乱的情况下专注于工作

    OpenAI产品副总裁Peter Deng周二在致员工的信中称,是时候“重新启航”了。此举是为了让公司专注于软件开发和建立合作伙伴关系,而不是围绕上周五被董事会解雇的奥特曼是否会重返首席执行官一职而上演的“他会不会回来”的大剧。Deng在信中表示,“引导我们精力的最佳方式”是开发人工智能产品。

    英文报道:Bloomberg – OpenAI Encourages Staff to Focus on Work Despite Boardroom Chaos

    中文报道:财联社 – OpenAI 产品副总裁呼吁员工回公司上班

    11月22日 04:06

    微软为 OpenAI 员工涌入做好公司办公方面的准备

    据海外科技媒体Axios最新报道,微软正在为迎接Sam Altman和OpenAI员工们做准备,包括腾出办公空间、配备计算资源等。据知情人士透露,微软正在旗下领英(LinkedIn)的旧金山办公室设立出一块办公场所,值得一提的是,此地距离OpenAI在旧金山的主楼只有10分钟的车程。

    英文报道:Axios – Microsoft prepares for influx of OpenAI employees

    中文报道:财联社 – 微软为OpenAI员工敞开怀抱!据称已腾出办公地、配备计算机

    11月22日 01:40

    OpenAI 董事会据称正与 Sam Altman 就回归进行谈判

    据媒体报道,OpenAI联合创始人、前CEO山姆·奥特曼和该公司董事会成员已开始谈判,双方在探讨奥特曼重返OpenAI的可能性。一位知情人士表示,目前正在讨论的一种情况是,奥特曼将以过渡董事会的董事身份回归OpenAI。

    英文报道:Bloomberg – Sam Altman, OpenAI Board Open Talks to Negotiate His Possible Return

    中文报道:财联社 – 奥特曼“王者归来”?OpenAI董事会据称正与其就回归进行谈判

    watch emoji11月21日·余波未了,地震持续
    11月21日 13:11

    OpenAI 正在积极讨论“重新团聚”公司事宜

    据 OpenAI 全球事务副总裁 Anna Makanju 周一在给员工的备忘录中显示,OpenAI 正在进行积极讨论,以 “重新团聚” 公司。OpenAI 员工正与创始人Sam Altman“保持联系”,与CEO、董事会“进行接触”。OpenAI 表示,我们的头号目标是 OpenAI 重新团结。

    英文报道:Bloomberg – OpenAI in ‘Intense Discussions’ to Quell Potential Mutiny

    中文报道:新浪财经 – 备忘录:OpenAI正在积极讨论“重新团聚”事宜

    11月21日 09:25

    OpenAI 董事会曾联系竞争对手 Anthropic 讨论合并

    据媒体援引知情人士说法称,在开除掉Sam Altman之后,OpenAI董事会曾与其主要竞争对手、明星AI初创公司Anthropic联合创始人兼CEO Dario Amodei探讨两家公司合并事宜。知情人士表示,OpenAI董事会试图说服Dario Amodei接任OpenAI CEO的位置,所以谈到了合并的事情。但Amodei拒绝了该提议。

    英文报道:The Information – OpenAI’s Board Approached Anthropic About Merger

    中文报道:华尔街见闻 – OpenAI董事会曾联系竞争对手Anthropic讨论合并

    11月21日 06:54

    Altman 仍可能重返OpenAI,微软CEO表态:对此持开放态度

    微软首席执行官萨蒂亚·纳德拉日前表示,他对Sam Altman重返OpenAI持开放态度;纳德拉表示,无论Altman是加入微软还是回到OpenAI,这位企业家都将与微软合作;他还表示,无论怎样,OpenAI都需要改革治理方式。

    英文报道:CNBC – Microsoft CEO Nadella says OpenAI governance needs to change no matter where Altman ends up

    中文报道:财联社 – 奥特曼仍可能重返OpenAI 微软CEO表态:对此持开放态度

    11月21日 06:38

    消息称 OpenAI 投资者正考虑起诉公司董事会

    路透社援引知情人士的话透露,OpenAI 部分投资者正考虑对公司董事会采取法律行动,目前正在与法律顾问进行探讨。投资者担心他们投资 OpenAI 的数亿美元可能会遭受“灾难性损失”,因为这家热门企业似乎正面临崩溃的风险。

    英文报道:Reuters – OpenAI investors considering suing the board after CEO’s abrupt firing

    中文报道:IT之家 – 消息称 OpenAI 投资者正考虑起诉公司董事会

    11月21日 04:16

    Salesforce CEO 发文邀请从OpenAI辞职的研究人员加入

    Salesforce首席执行官 Marc Benioff 抛出橄榄枝,邀请从OpenAI辞职的研究人员加入。Benioff在X平台发帖称,Salesforce将对从OpenAI辞职的研究人员提供与之前相匹配的薪酬待遇。Benioff邀请这些员工加入Silvio Savarese领导的Salesforce Einstein Trusted AI研究团队。
    Marc Benioff发文

    11月21日 04:15

    OpenAI 曾试图邀请前 GitHub CEO 和 Scale AI 创始人担任临时 CEO 的职位

    据知情人士透露,在前 Twitch 首席执行官 Emmett Shear 接受 OpenAI 临时首席执行官职位之前,董事会曾邀请 Nat Friedman(微软旗下 GitHub 的前首席执行官、人工智能初创公司的多产投资者)以及 Scale AI 联合创始人兼首席执行官 Alex Wang 担任该职位。知情人士称,两人都拒绝了这一提议。

    英文报道:The Information – Former GitHub CEO Friedman, Scale AI Founder Wang Declined OpenAI Top Job

    11月21日 03:39

    Altman 称与微软 CEO 的首要任务是确保 OpenAI 茁壮成长

    Sam Altman 在社交媒体表示,「Satya和我的顶级优先任务仍然是确保OpenAI继续“茁壮成长”。我们将恪守“向合作伙伴和客户们全面提供运营延续性”的承诺。OpenAI与微软之间的合作伙伴关系让这具有非常高的可行性。」
    Sam Altman发文称优先事项

    11月21日 02:59

    消息称 Altman 仍愿意重回 OpenAI 当 CEO,前提是董事会下台

    Altman 转投微软的交易尚未敲定,Ilya Sutskever 转而支持 Altman 意味着两名董事会成员需要改变主意。多位消息人士告诉 The Verge,如果解雇他的其余董事会成员下台,他和联合创始人 Greg Brockman 仍然愿意重返 OpenAI。

    英文报道:The Verge – Sam Altman is still trying to return as OpenAI CEO

    中文报道:IT之家 – 消息称阿尔特曼仍愿意重回 OpenAI 当 CEO,前提是董事会下台

    11月21日 01:57

    OpenAI 超过100名客户联系竞争对手 Anthropic

    据知情人士透露,周末有超过 100 名 OpenAI 客户联系了其竞争对手 Anthropic,这家初创公司近几个月从亚马逊和谷歌筹集了数十亿美元资金。知情人士称,还有其他客户联系了 Google Cloud 和 OpenAI 初创公司竞争对手 Cohere,许多 OpenAI 客户也在考虑转向微软的 Azure 服务,该服务提供 OpenAI 模型和其他模型的副本。

    英文报道:The Information – OpenAI’s Customers Consider Defecting to Anthropic, Microsoft, Google

    中文报道:新浪网 – OpenAI超过100名客户联系竞争对手Anthropic

    bomb emoji11月20日·谈判破裂,回归失败
    11月20日 21:30

    OpenAI 超 700 名员工签署集体辞职联名信要求恢复 Altman 和 Brockman 的职务

    据外媒 Wired报道,当地时间周一,500 多名(最新已超过700名) OpenAI 员工签署了一封公开信,以集体辞职威胁OpenAI董事会退出,并恢复Sam Altman的首席执行官职务,以及联合创始人Greg Brockman的总裁职务。有趣的是,联名信的签署人中,也包括了 Ilya Sutskever 的名字。

    英文报道:Wired – OpenAI Staff Threaten to Quit Unless Board Resigns

    中文报道:虎嗅 – OpenAI 近 500 名员工签署集体辞职联名信要求恢复 Sam Altman 和 Greg Brockman 的职务

    11月20日 21:15

    Ilya Sutskever 发文:对参与董事会的行动深感后悔

    OpenAI 联合创始人兼首席科学家 Ilya Sutskever 在社交平台X上表示,对参与董事会的行动深感后悔,从未想过要伤害 OpenAI。“我热爱我们共同建立的一切,我会尽我所能让公司重新团聚起来。”
    Ilya Sutskever发文称后悔

    11月20日 18:00

    OpenAI 高管员工集体发文:没有员工,OpenAI 什么也不是

    OpenAI 高管(包括CTO、COO)员工们,在社交平台X上集体刷屏!他们都说了同一句话:OpenAI is nothing without its people。翻译过来:没有员工,OpenAI什么都不是。Sam Altman 转发很多这类帖子,并回复“爱心”。
    OpenAI is nothing without its people

    11月20日 17:01

    OpenAI 临时 CEO 承诺将调查 Altman 被罢免一事,并改革管理层

    OpenAI 临时首席执行官 Emmett Shear 周一誓言将聘请一名独立调查员来调查联合创始人萨姆・阿尔特曼(Sam Altman)突然被罢黜一事,并在未来 30 天内改革管理团队,以期在经历了一个戏剧性的周末后恢复人们对这家美国初创公司的信任。
    Emmett Shear发文

    英文报道:Business Insider – OpenAI’s New CEO Reveals Plans for His First 30 Days in 1 a.m. X Post

    中文报道:IT之家 – OpenAI 临时 CEO 承诺将调查阿尔特曼被罢免一事,并改革管理层

    11月20日 15:53

    微软 CEO:Altman 和 Brockman 将加入微软领导一个新的高级 AI 研究团队

    OpenAI最大股东兼合作伙伴微软的首席执行官纳德拉宣布,OpenAI创始人兼前CEO山姆·奥特曼(Sam Altman)和前总裁格雷格·布洛克曼Greg Brockman)将加入微软。纳德拉表示,奥特曼和布洛克曼及其同事将加入微软,领导一个新的高级AI研究团队。纳德拉还在推文中证实了,埃米特·谢尔(Emmett Shear)将担任OpenAI CEO,“我们期待了解埃米特·谢尔和OAI的新领导团队并与他们合作。”
    微软CEO:Altman和Brockman将加入微软

    英文报道:The Verge – Microsoft hires former OpenAI CEO Sam Altman

    中文报道:澎湃新闻 – 微软CEO:OpenAI创始人奥特曼和布罗克曼将加入微软

    11月20日 12:58

    Sam Altman 回归 OpenAI 失败,董事会已任命 Emmett Shear 为临时 CEO

    OpenAI 联合创始人兼董事会董事 Ilya Sutskever 表示,尽管公司高管努力挽回 Sam Altman,但他不会再担任 OpenAI 首席执行官。Sutskever 告诉员工,在与周五解雇他的董事会以及剩余的领导人和顶级投资者进行了一个周末的谈判后,Altman 将不会回到他于 2015 年共同创立的初创公司。Sutskever 表示,亚马逊旗下视频流媒体网站 Twitch 的联合创始人 Emmett Shear 将接任临时首席执行官。

    英文报道:The Information – Emmett Shear Becomes Interim OpenAI CEO as Altman Talks Break Down

    中文报道:IT之家 – 消息称阿尔特曼回归 OpenAI 失败,董事会已任命 Emmett Shear 为临时 CEO

    11月20日 08:01

    若 Altman 重返 OpenAI,微软将考虑进入董事会

    据两位知情人士透露,OpenAI 最大的支持者微软正在考虑,如果被罢免的首席执行官 Sam Altman 重返公司,微软将计划在董事会中担任一职。其中一位知情人士表示,微软考虑加入OpenAI的董事会的一员或作为没有投票权的董事会观察员。

    英文报道:The Information – Microsoft Eyes Seat on OpenAI’s Revamped Board

    中文报道:新浪财经 – 消息称如果Altman回归OpenAI,微软考虑在OpenAI获得董事会席位

    11月20日 06:21

    OpenAI 董事会谈判就 Altman 重返公司后董事会的组成和角色问题上陷入僵局

    据知情人士透露,一群OpenAI高管和投资者试图恢复 Sam Altman 首席执行官一职,但在董事会的组成和角色问题上陷入了僵局。尽管谈判仍在进行中,但解决方案可能很快就会出现。OpenAI 领导团队希望解散董事会,但董事们拒绝。董事会指定当地时间下午 5 点为满足 Altman 要求的最后期限。

    英文报道:Bloomberg – OpenAI Leaders’ Efforts to Bring Back Altman Reach Impasse Over Board Role

    中文报道:新浪财经 – OpenAI高管及投资者力主恢复Altman的CEO职务,谈判卡在董事会问题上

    11月20日 05:03

    Altman 发贴胸前佩戴 OpenAI 的“访客”牌的自拍照

    Altman 在社交媒体X平台上传了一张自己位于 OpenAI 位于旧金山总部的照片,不过,他脖子上佩戴的是OpenAI的“访客”牌,证明其CEO和董事的职位尚未完全恢复。
    Sam Altman自拍身戴访客卡

    11月20日 04:06

    Altman 和 Brockman 抵达 OpenAI 总部,高管们力促恢复两人职位

    一位知情人士称,在 OpenAI 董事会解雇 Sam Altman 两天后,当地时间周日,Sam Altman 在该公司旧金山总部与高管们会合,推动董事会恢复他和其他最近离职的高管的职位。据知情人士透露,临时首席执行官 Mira Murati 早些时候告诉员工,她和领导团队邀请了 Altman。其中一位知情人士称,OpenAI 前董事长兼总裁 Greg Brockman 也在周日抵达办公室。

    英文报道:The Information – Altman, Brockman Arrive at OpenAI Headquarters as Execs Push to Reinstate Them

    中文报道:IT之家 – OpenAI 前 CEO Sam 与前总裁 Greg 在旧金山总部与高管会面

    11月20日 01:34

    马斯克:研发先进AI风险非常高,OpneAI 应公布解雇 Altman 的原因

    特斯拉首席执行官埃隆·马斯克(Elon Musk)表示,由于研发先进人工智能(AI)技术的潜在危险非常高,作为目前世界上最强大的人工智能公司,OpenAI应该解释其解雇其首席执行官 Sam Altman 的原因。
    Elon Musk谈OpenAI

    英文报道:Business Insider – Musk Says Risk of AI so High OpenAI Should Say Why It Fired Sam Altman

    中文报道:网易科技 – 马斯克:研发先进AI风险非常高,OpneAI应公布解雇奥特曼的原因

    helicopter emoji11月19日·外部施压,回归有望
    11月19日 14:25

    OpenAI 内部备忘录:对召回 Altman 和 Brockman 持乐观态度

    知情人士透露,OpenAI首席战略官 Jason Kwon 美国东部时间周六晚上在备忘录中告诉员工,OpenAI 对能够 Sam Altman、Greg Brockman 和其他关键员工重返岗位持“乐观态度”。

    英文报道:The Information – OpenAI ‘Optimistic’ It Can Bring Back Sam Altman, Greg Brockman

    中文报道:腾讯科技 – OpenAI:对召回奥特曼和布罗克曼持乐观态度,周一凌晨揭晓答案

    11月19日 06:44

    OpenAI 的投资者正在向董事会施压,要求 Sam Altman 重返公司

    彭博援引知情人士报道称,OpenAI 的投资者正在向 OpenAI 董事会施压,要求撤销罢免这一决定。上述知情人士还称,微软CEO Satya Nadella一直与阿尔特曼保持联系,并承诺无论阿尔特曼下一步采取什么措施,都会支持他。

    英文报道1:Bloomberg – OpenAI Board Urged by Microsoft, Investors to Restore Altman

    英文报道2:The Verge – OpenAI board in discussions with Sam Altman to return as CEO

    中文报道:科创板日报 – 投资人施压、董事会松口,阿尔特曼或重返OpenAI?

    11月19日 03:46

    Sam Altman 计划创办一个新的 AI 企业

    据一位知情人士透露,最近被赶下台的 OpenAI 首席执行官 Sam Altman 一直告诉投资者,他计划推出一家新的人工智能企业。该人士表示,OpenAI 前总裁 Greg Brockman 预计也将加入该公司,该项目仍在开发中。目前尚不清楚该合资企业的确切性质,可能是一家人工智能芯片公司。

    英文报道:The Information – OpenAI Co-Founder Altman Plans New AI Venture

    中文报道:腾讯科技 – 传奥特曼早已在筹划创办新初创公司,孙正义或是背后投资人

    11月19日 02:53

    Sam Altman 被解雇后,OpenAI 的 860 亿美元股票出售陷入困境

    据一位知情人士透露,此前由 Thrive Capital 牵头的以 860 亿美元估值对 OpenAI 进行的要约收购尚未结束,但已进入最后阶段,预计最快下个月完成。截至周六,三名计划参与招标的前 OpenAI 员工表示,他们不再预计此次出售会发生,或者即使发生,由于最近发生的事态发展,其估值也会较低。

    英文报道:The Information – OpenAI’s $86 Billion Share Sale in Jeopardy Following Altman Firing

    11月19日 01:57

    OpenAI 内部备忘录称 Sam Altman 被解雇背后不存在“渎职”

    据 Axios 报道,根据 OpenAI 首席运营官 Brad Lightcap 的一份内部备忘录,OpenAI 首席执行官 Sam Altman 被解雇并不是因为“渎职或与我们的财务、业务、安全或安全/隐私实践相关的任何事情”,而是因为“Sam Altman 与董事会之间的沟通中断”。

    英文报道:Axios – No “malfeasance” behind Sam Altman’s firing, OpenAI memo says

    中文报道:财联社 – OpenAI备忘录称Sam Altman被解雇背后不存在“渎职”

    fire emoji11月18日·罢免开端,人事动荡
    11月18日 14:41

    消息称:三名 OpenAI 高级研究人员宣布辞职

    据 The Information 报道,三名 OpenAI 高级研究人员宣布辞职,称受到了 OpenAI 原 CEO Sam Altman 被解雇、总裁Greg・Brockman 突然辞职的影响。这三位高级研究人员包括公司研究主管雅库布・帕乔基(Jakub Pachocki)、评估 AI 潜在风险的团队负责人亚历山大・马德里(Aleksander Madry)和已经供职 7 年时间的研究员西蒙・西多尔(Szymon Sidor)。

    英文报道:The Information – Three Senior OpenAI Researchers Resign as Crisis Deepens

    中文报道:IT之家 – 继 CEO、总裁之后,消息称又有三名 OpenAI 高级研究人员宣布辞职

    11月18日 13:32

    Sam Altman 发声:若自己“开火”,董事会将索赔

    在早些时候被 OpenAI 罢免的原 CEO Sam Altman 再度在 X 平台发文宣称,如果自己“开火”,OpenAI 的董事会将向他追讨自己所持股票的全部价值。(if i start going off, the openai board should go after me for the full value of my shares)
    Sam Altman 二次发声

    11月18日 12:42

    Greg Brockman 发文谈 Altman 被罢免风波的细节

    Greg Brockman 发文透露,昨晚,Altman 收到公司首席科学家 Ilya Sutskever 发来的短信,要求周五中午谈话。Sutskever 告诉 Altman 他将被解雇,并且消息很快传出。周五中午12点23分,Sutskever 发送了一条 Google Meet 会议链接,Brockman 被告知,他将被从董事会中除名,而 Altman 已被解雇。Brcokman 也被解除了董事会主席职务(但没有被公司开除),随后,他宣布自己将从公司离职。据 Brockman 了解,公司 CTO Mira Murati 是在周四晚上就知道了公司的决定,除此之外他们都是被临时通知的。
    Greg Brockman 谈细节

    11月18日 08:09

    OpenAI 联合创始人兼董事长 Greg Brockman 宣布将辞职

    Greg Brockman 在 X 平台发推:“根据今天的消息,我辞职了。” 回应的全文内容:“自从 8 年前在我的公寓开始工作以来,我对我们大家一起建造的东西感到非常自豪。我们一起经历了艰难而又美好的时光,尽管有种种原因,但我们还是取得了如此多的成就。但根据今天的新闻,我辞职了。真诚地祝愿你们一切顺利。我仍然坚信创造造福全人类的安全通用人工智能的使命。”
    Greg Brockman宣布辞职

    11月18日 07:25

    微软 CEO 回应:将继续致力于与 OpenAI 的长期合作

    微软 CEO Satya Nadella 发文称:“正如您本周在 Microsoft Ignite 上看到的那样,我们将继续为这个 AI 时代快速创新,在整个技术堆栈中发布了 100 多项公告 – 从 Azure 中的 AI 系统、模型和工具到 Copilot。最重要的是,我们致力于为我们的客户提供所有这些,同时构建未来。我们与 OpenAI 签订了长期协议,可以完全访问我们实现创新议程和令人兴奋的产品路线图所需的一切,并继续致力于维持Mira 及其团队的合作伙伴关系。我们将共同努力,继续为世界带来这项技术的有意义的好处。”
    微软CEO的回复

    11月18日 05:48

    OpenAI 将在 CEO 离职后召开全体员工大会

    据知情人士透露,在 OpenAI 决定解雇首席执行官Sam Altman之后,该公司刚被任命的临时首席执行官Mira Murati及其团队将于当地时间周五下午向公司员工发表讲话。公司希望能够消除员工对公司未来融资前景等问题的忧虑。

    相关报道:财联社 – OpenAI将在CEO离职后召开全体员工大会

    11月18日 05:46

    Sam Altman 回应:稍后会说明更多情况

    Sam Altman 在 X 平台发推:“我很喜欢在 OpenAI 的时光。这对我个人来说是变革性的,希望对世界也有一点变革。最重要的是,我喜欢与这些才华横溢的人一起工作。稍后会说明更多情况。”
    Sam Altman response

    11月18日 05:21

    谷歌前 CEO 发文谈 OpenAI 首席执行官离职

    谷歌前 CEO 施密特发文,感谢Altman为人工智能做出的贡献。施密特表示,“Sam Altman是我心目中的英雄。他将一家公司从一无所有发展到价值 900 亿美元,并永远改变了我们的集体世界。我迫不及待地想看看他接下来会做什么。我和数十亿人将从他未来的工作中受益——这将是令人难以置信的。谢谢你为我们所有人所做的一切。”
    Eric Schimidt感谢Sam Altman

    11月18日 04:28

    OpenAI 突然罢免 CEO Sam Altman,董事会称对其领导能力失去信心

    OpenAI 发布公告宣布,Sam Altman 将辞去首席执行官一职,并退出董事会,首席技术官 Mira Murati 被任命为临时首席执行官。此外,Greg Brockman 将辞去董事会主席职务,并继续担任公司职务。OpenAI表示:“在 Altman 离职之前,董事会进行了审慎的审查,得出的结论是,他在与董事会的沟通中并不坦诚,阻碍了他履行职责的能力,董事会也不再相信他继续领导 OpenAI 的能力。”
    OpenAI Leadership Transition

    公告全文:OpenAI announces leadership transition

  • 10款免费好用的AI文本转语音的工具和网站,智能合成配音

    近年来,由于人工智能和机器学习的发展,文本到语音(TTS)技术得到了快速发展,AI合成的声音现在听起来比以往任何时候都更逼真、更自然。在本篇文章中,我们将介绍10个好用的的免费AI文本转语音工具,AI配音工具可提供高质量的语音、可定制的功能以及文本到语音的轻松转换。

    魔音工坊

    魔音工坊是由出门问问推出的一款专业的配音工具和高效多人音频协同创作工具,可以智能将文字转换成语音,支持多种语言和语音风格,包括中文、英文、日语、韩语等。该工具集成了先进的深度学习技术,可以根据不同的文本内容和语境,生成自然流畅的语音。用户可以在魔音工坊官网上输入需要转换的文字内容,选择喜欢的语音风格和声音类型,点击“朗读”按钮,即可快速将文字转换成语音。

    魔音工坊

    产品功能:

    • 海量声音。提供1300+声音风格、800+覆盖音色、16国语言、15种方言;
    • 软件配音。支持逐句试听、多音字、停顿、重读、局部变速、多发音人、等近20个调音功能;
    • 云剪辑。集文案生成、配音生成、视频剪辑于一身。还具备实视频实时录制、文案提取等功能;
    • 自动打轴。真人配音和软件配音,一键完美对齐文案。自动化处理,精准识别声音与文案的对齐;
    • 捏声音。通过简单的文本描述,可以为用户提供个性化的声音服务,例如克隆用户自己的声音。

    ElevenLabs

    ElevenLabs是国外一个火爆的AI文字转语音平台,目前已完成测试阶段并推出了正式版。借助先进的多语言人工智能技术,ElevenLabs 可以自动识别包括中文在内的28种语言,并将其转换为逼真的语音。免费版提供每月10000个字符的转换和创建3个自定义声音。

    ElevenLabs语音合成

    产品功能:

    • AI语音合成,提供文本转语音工具,支持多种类型的声音、风格和语言生成高质量的口语音频。
    • AI语音克隆,提供声音克隆工具,无需输入文本便可以快速克隆自己的声音
    • 高质量语音库,ElevenLabs提供了一个高品质人工智能语音库社区,用户可选择加入Discord交流和分享
    • 音频编辑工具,提供调整节奏、分割声音的工作台以完全控制创作过程

    讯飞智作

    讯飞智作是由科大讯飞推出的一款AI文本转语音的工具,集成了多项高级技术,包括语音合成、语音识别、语音翻译、语音转写和声纹识别等。它可以将文字转换成可供播放的自然语音,并提供多种语音合成方案和发音人选择。用户可以在打开讯飞智作官网后,点击“讯飞配音”菜单进入语音合成页面,输入需要转换的文字内容,选择喜欢的发音人和性别,调整语速和音调等参数,然后点击“生成音频”,等待几秒钟,即可将文字转换成语音。

    讯飞智作

    产品功能:

    • 双端支持。讯飞配音支持Android、web双端使用,用户可根据实际需求自由选择制作路径;
    • 多样发音人。多个中外语种,更有有声阅读、新闻播报、纪录片、视频解说等多种风格;
    • 效果编辑。支持音量、语速、语调调节,并可通过插入换气、连续、停顿等标记,调整合成韵律。

    MiniMax Audio

    MiniMax Audio是MiniMax推出的AI语音合成工具,支持创建逼真的多语言、多声音和多情感的语音。能将文本快速转换为自然流畅的语音。只需提供30秒的音频素材,可克隆特定人的声音,支持12种语言,包括中文、粤语、英语等。提供六种情绪的语音合成,如开心、生气、悲伤等。

    MiniMax Audio

    产品功能:

    • 文本转语音(TTS):将文本转换为自然流畅的语音,支持多种语言和方言,包括普通话、粤语、英语、日语、韩语等。
    • 声音克隆:提供30秒音频样本,可快速克隆特定人的声音,捕捉细微的情感和语调。
    • 情感支持:提供六种情绪的语音合成,如开心、生气、悲伤等,使语音更具真实感。
    • 多语言支持:支持12种语言的声音克隆,满足不同语言用户的需求。
    • 降噪选项:帮助用户剔除背景噪音,提升语音质量。
    • 超长文本合成:支持单次合成最高1000万字符输入,适用于超长文本场景。
    • 定制化音色:能复刻数千种音色特征,生成无限声音变体、情感与风格。
    • 实时语音生成:支持流式语音输出,减少等待时间,适用于直播、对话等实时场景。

    腾讯智影

    腾讯智影是由腾讯推出的一款AI智能创作工具,融合了AI数字人、文本配音TTS、文章转视频等多项AIGC能力。其文字转语音工具提供了丰富的配音,还可以定制你的专属音色。

    腾讯智影文字配音

    产品功能:

    • 支持复制粘贴文字内容,或可以本地上传.doc、.pdf、.txt等多种类型文件导入转换;
    • 海量音色可选,目前文本配音支持一百多种音色,更有东北话、天津话等多地方言供用户选择,还可以调整朗读速度和音量和情绪;
    • 提供细节的调整功能,包含插入停顿、局部变速、词组连读、识别多音字、批量替换等;
    • 字幕下载,可以在合成音频前下载配套字幕文件,字幕文件为.srt格式,方便和生成的配音音频搭配后进入剪辑器进行后续制作;
    • 每天提供免费20次的使用额度,签到也能获得可用于抵扣的金币。

    悦音配音

    悦音配音是制片帮旗下推出的一款AI智能在线配音语音合成工具,可以帮助用户在线将文字输入快速轻松转换成语音。该AI配音工具提供男声、女声、童声、普通话、方言、英文等多种真人声音,在你输入文字后便可以直接智能生成音频。

    悦音配音官网

    产品功能:

    • 媲美真人的AI智能配音,海量音色库提供不同风格的男声、女声和童音;
    • 支持多种语种和方言的配音,包括普通话、英文、方言和其他多语言;
    • AI智能违禁词检测,提供行业内最新广告法,各平台敏感词,通用、新闻等违禁词在线查询检测;
    • 适用于短视频、政企宣传、教育培训、动漫、有声读物、影视广告、产品介绍、情感电台等数百个行业场景。

    Speechify

    Speechify是一个知名度很高的文字转语音的工具,累计已超过2000万人使用,该工具使用用智能的文本转语音技术,可以轻松朗读任何文档、文章、书籍、PDF和电子邮件。只需输入你想听到的文字,选择语音和收听速度,点击生成,即可快速将文字转换成语音。

    Speechify

    产品功能:

    • 支持多个终端和系统使用。Speechify 提供在线网页版、Android、iPhone、iPad和Chrome扩展,用户可以在任何设备上使用;
    • 声音自然。阅读的声音听起来很流畅,更像人类,方便他人理解并记住更多的内容;
    • 可嵌入网站上。提供小部件以嵌入在网站上,访客可直接将网页文字内容转换为语音;

    Uberduck

    Uberduck是一个开源的AI语音生成和合成的社区,使用先进的人工智能技术将书面文本转换为高质量的合成语音。该平台提供了超过5000多种声音帮助用户制作AI配音和语音,致力于提供逼真、自然的语音,为你的文本增添真实感,甚至你还可以使用自己的自定义语音克隆进行合成。

    Uberduck Text to Voice

    产品功能:

    • 多种风格可选,用户可自由选择年龄、性别、口音、角色、情绪等不同选项的语音;
    • 声音克隆/转换,可上传添加自定义音频,将其转换为其他的声音;
    • 与Discord平台集成,支持在 Discord 上使用 Uberduck 生成语音并下载音频文件。

    PlayHT

    PlayHT是一个人工智能驱动的语音生成网站,提供逼真的AI文本转语音工具,可以快速将文本转换为自然的、类似人类的音频,跨越任何语言和口音。你可以将其用于视频编辑、在线学习和培训、AI语音应答、创建音频文章朗读、自媒体视频旁白等各种应用场景。

    PlayHT AI Voice Generator

    产品功能:

    • 超真实的AI声音,基于下一代AI语音技术,从文本中捕捉情绪,生成逼真的语音;
    • 多语种多风格的AI语音,提供130多种语言的800多种AI语音,并具备灵活的定制性;
    • 语音克隆,可创建与真人声音100%精确的高保真语言克隆;
    • 可创建AI语言播客,将音频内容发布到iTunes、Spotify和Google Podcast。

    Murf

    Murf是一个多功能的AI语音生成器,可以帮助用户在几分钟内制作录音室级别品质的配音。利用其提供的在线AI文本转语音,可以生成逼真的AI声音,用于播客、视频和任何专业的音频演示需求。

    Murf AI

    产品功能:

    • 20 种语言的文字转语音,大多数语言在免费计划中都有可用于测试质量的语音。有些语言还支持多种口音,例如英语、西班牙语和葡萄牙语;
    • 灵活高质量的AI配音,提供音调、停顿、强调等自定义调整功能;
    • 与Canva集成,只需点击几下即可添加AI配音到Canva平台上的视频、演示文稿中。
  • 15款免费AI抠图软件和网站,智能自动去除图片背景

    传统的利用PS修图工具去除图片背景是一项精细耗时的任务,但随着人工智能技术的进步,现在有了强大的在线AI抠图工具,可以智能地自动化这一过程。在本篇文章中,我们将介绍15款AI图像背景去除软件和网站,只需点击几下即可获得专业的抠图效果,挑选和排序依据为:是否免费、产品性价比、抠图效果和速度、配套图片编辑功能等方面。

    文章目录:

    顽兔抠图

    顽兔抠图是阿里巴巴推出的免费在线智能抠图工具,专为电商卖家、设计师及普通用户设计。可快速识别并去除图片背景,生成无背景商品图或创意图。用户只需上传图片,顽兔抠图能一键完成抠图,支持.png、.jpg等多种格式,每张图片大小限5M以内,最长边小于6000px,能一次性处理1-20张图片。

    顽兔抠图

    💰 产品价格:

    • 个人会员:年卡:¥299;连续包月:¥39;半年卡:¥179;季卡:¥109。每月赠送240堆币(可兑换2400堆豆),共12次,赠送堆币每月重置,最多可生成约11630张图。
      • 年卡权益:低至0.1元/堆币;个性化专属模型训练;在线工作流即开即用。
      • 基础权益:畅享AI视频及专属会员功能;专属优质会员模型商用无忧;全站图片/作品下载无水印;免堆豆流量一键抠图;畅享自由扩图/细节修复;海量商拍/营销海报爆款模版。
    • 团队会员:团队人数2人起,¥399。
      • 团队专属权益:畅享个人版年卡会员权益,灵活调整成员校色和权限;共享团队算力值,按需使用;设计资产统一管理,实时在线调用;可视化数据分析,追踪成员创作成果。
    • 个人加油包:堆币可用于堆友平台内生成图片、生成视频、模型训练、VIP功能等使用时进行抵扣。堆豆不足时,可使用堆币进行兑换,1堆币可兑换10堆豆。
      • 300堆币:¥39.9;有效期为60天
      • 850堆币:¥99.9;有效期为90天
      • 2600堆币:¥299.9;有效期为365天
      • 6000堆币:¥599.9;有效期为365天
    • 堆豆任务:新用户首次登录/注册后堆友会免费赠送50堆豆,有效期一年;每日登录会赠送80堆豆;关注公众号【堆友创意】赠送20堆豆;收藏网址赠送50堆豆;完成反应堆/AI工具箱生图发布各赠送25堆豆;完善个人信息赠送20堆豆。

    ✅ 产品优点:

    • 操作便捷:在线操作,无需安装软件,简单易上手。
    • 智能高效:自动抠图功能强大,节省时间。
    • 支持批量:可一次性处理多张图片,提高效率。
    • 格式兼容:支持多种常见图片格式,适用性广。

    ⛔ 产品不足:

    • 处理限制:图片大小和数量有上限,大文件或大量图片处理受限。

    绘蛙抠图

    绘蛙AI抠图是绘蛙推出的智能抠图功能,是AI修图工具的核心亮点之一。能快速精准地识别图片主体,无论是人物、产品还是其他关键元素,能一键将其从复杂背景中分离出来,连发丝等细节也能处理得相当精细。用户只需上传符合要求的图片(文件大小20KB到15MB,分辨率400×400到8192×8192),即可实现高效抠图。

    绘蛙AI抠图

    💰 产品价格:

    • 限时免费:注册登录获得50算力点,连续7天签到可获得300算力点,最长有效期30天,智能抠图限时消耗1算力点。
    • 入门版-连续包月:¥9.9,试用7天,到期后259元/月自动续费,可随时取消;试用期间500算力点,有效期7天;约生成166张图片或25个视频;AI生图同时发起6个任务。

    ✅ 产品优点:

    • 操作简单易上手:界面简洁,引导清晰,没有专业设计经验的用户也能快速入门,降低了使用门槛。
    • 功能集成度高:提供了从图片、文案到视频的“一站式”AI创作解决方案,用户无需在多个工具间切换,极大提升了工作效率。
    • 电商场景深度适配:功能设计紧密围绕淘宝、天猫、京东、小红书等平台需求,生成的内容更符合电商规范与用户偏好。
    • 成本效益显著:虚拟模特功能能节省大量拍摄成本和寄样时间,对于服装等类目的中小卖家来说尤其具有吸引力。
    • 用户体验好:AI技术应用广泛,可以自动生成高质量的图片和文案,用户体验良好。

    ⛔ 产品不足:

    • 部分高级功能依赖算力/会员:免费算力有限,高频用户或需要使用更多高级功能时,可能需要购买付费算力包或订阅会员,会产生额外费用。

    光子抠图

    光子AI抠图是光子AI推出的背景移除功能,是AI修图工具箱中的重要功能之一。用户在使用光子AI进行商业拍摄时,可以用背景扣除功能,轻松地将商品从原始背景中分离出来,实现背景的快速更换。功能适用于电商平台的商品展示,能帮助商家快速生成符合不同展示需求的商品图片,提升商品的视觉效果和吸引力。

    光子AI抠图

    💰 产品价格:

    • 限时免费:全部权益限时免费体验。
    • 邀请好友获积分:邀请好友注册登录,可获得200积分,有效期31天。
    • 新用户登录:获得200积分。约生成40张。

    ✅ 产品优点:

    • 操作简便:用户无需专业技能,只需上传图片,工具可自动识别并去除背景,操作简单易懂。
    • 处理速度快:能快速完成背景抠除任务,大大提高了工作效率。
    • 支持多种图片格式:可处理多种常见的图片格式,如png、jpeg、jpg等。
    • 高分辨率处理能力:支持高分辨率图片的处理,能满足不同用户对图片质量的要求。
    • 精准识别:能精准识别图片中的主体与背景,包括复杂轮廓如人物发丝等,保留主体细节。
    • 批量处理:支持批量任务处理,可一次性上传多张图片进行背景抠除,进一步提高处理效率。

    ⛔ 产品不足:

    • 免费使用有限制:部分功能可能需要付费才能解锁更多使用次数或更高分辨率的图片下载。

    稿定抠图

    稿定抠图是稿定设计推出的在线AI抠图平台,利用人工智能技术,可以快速消除图片背景。无需下载,就可以实现在线一键自动智能ps抠图。用户上传图片之后,便能一键进行人物头像和电商商品的高效抠图。

    稿定抠图

    💰 产品价格:仅稿定抠图的版本

    • 200张/1个月,69元
    • 400张/1个月,119元
    • 1000张/1个月,229元

    付费的话建议购买稿定设计,基础版39元/月,智能抠图100张/月,还提供海量素材、AI点数和设计功能。

    ✅ 产品优点:

    • 功能强大,提供不同的模式、修补、擦除、换背景等功能,效果不错
    • 支持批量上传图片进行抠图
    • 支持抠图后的二次编辑、设计处理,稿定设计提供大量优质的模板素材

    ⛔ 产品不足:

    • 免费版仅支持3张图片下载

    美间AI抠图

    美间AI抠图是美间推出的免费智能抠图工具,基于AI技术帮助用户快速且精准地去除图片背景。美间AI抠图特别适合频繁处理图片背景的电商卖家、平面设计师和营销人员,能自动识别图片中的主体和背景,实现一键抠图,无需手动编辑。用户只需上传尺寸小于4000×4000像素、格式为JPG/JPEG/PNG的图片,AI系统即可在几秒钟内完成抠图过程。

    meijianAI-pic-matting

    💰 产品价格:

    • 免费

    ✅ 产品优点:

    • 完全免费,不花钱
    • 自动识别图片中的主体和背景,实现一键抠图,无需手动编辑
    • 精准处理图片细节,如头发丝、透明物体等,确保抠图边缘的自然和清晰。
    • 支持的图片文件大小不超过30MB,适合大部分网络传输和在线处理。

    鲜艺AI抠图

    鲜艺AI抠图是一款功能强大的免费AI抠图工具,能快速去除图片背景,支持本地和在线图片处理。鲜艺AI抠图具备毫秒级处理速度、无需联网确保隐私安全、支持批量操作、多格式兼容,以及Photoshop二次编辑功能。用户界面简洁直观,支持皮肤和语言切换,支持Windows和macOS系统,广受创意工作者好评。

    鲜艺AI抠图

    💰 产品价格:

    • 免费

    ✅ 产品优点:

    • 完全免费,不花钱
    • 支持离线安装使用
    • 支持导出PSD文件,方便二次编辑
    • 不将图片保存到服务器,保护隐私
    • 抠图速度快,具备毫秒级处理速度

    吐司AI抠图

    吐司AI抠图是吐司TusiArt推出的智能抠图工具,帮助用户快速去除图像背景,同时保持主体的完整性。用户只需上传图片,吐司AI抠图会自动识别并分离主体与背景,生成清晰的去背景图像。可多次尝试以优化效果。适用于设计师、电商从业者或需要快速处理图像的用户。

    吐司AI抠图

    💰 产品价格

    • 每天可获得一定数量的免费信用额度,用于生成或处理图像。

    ✅ 产品优点

    • 自动识别与精准抠图,自动识别图片中的主体,一键生成透明背景。对复杂背景或细节丰富的图像也能精准处理
    • 无需掌握Photoshop等专业图像处理软件,简单的操作可完成高质量的抠图。
    • 支持高清无损导出抠图后的图像,无水印,确保图像质量。
    • 可以去除背景,可以根据需要替换背景,支持从素材库中选择或上传自定义背景。

    ⛔ 产品不足

    • 免费版的智能抠图在功能上使用有限

    BgSub

    BgSub是一个完全免费的在线AI抠图工具,使用先进的人工智能技术,自动替换图像的背景。不仅可以自动去除图像背景,而且无需上传你的图像数据,从根本上保护用户隐私。BgSub拥有着丰富的抠图功能,支持去除图像背景、替换图像背景、AI调色、自由调整、艺术滤镜等。最高支持4096*4096分辨率,处理后的图片一样可以免费商用。

    BgSub AI 抠图

    💰 产品价格:

    • 免费

    ✅ 产品优点:

    • 完全免费,不花钱
    • 无需登录注册
    • 不将图片保存到服务器,保护隐私
    • 抠图速度快,效果较好

    ⛔ 产品不足:

    • 目前主要提供Web端网站
    • 不支持批量上传图片抠图

    360智图

    360智图是360推出的一站式图片服务平台,在AI技术的驱动下,可以帮助用户轻松搞定作图,提供图片智能抠图、图片智能消除笔、图片无损放大、文章智能配图等功能。图查查的图片智能抠图功能目前是免费开放的,可智能识别主体,自动删除背景,一键快速抠图。

    图查查图片智能抠图

    💰 产品价格:

    • 图片智能抠图功能是免费开放的,若想使用全套的图查查功能,可考虑购买会员
    • 个人版年VIP,99元
    • 个人版连续包月,9.9元
    • 个人版连续包季,36元

    ✅ 产品优点:

    • 最高分辨率支持达到10000*10000
    • 智能抠图功能可免费使用
    • 提供自动抠图和点选抠图两种模式

    ⛔ 产品不足:

    • 不支持批量上传图片抠图

    Clipdrop Remove Background

    Clipdrop是我们网站上经常提及的AI图片处理工具了,由Stability AI推出,支持AI图片背景去除、AI图片放大、AI图片物体抹除、AI图片填充等多个人工智能图片编辑。而Clipdrop Remove Background便是其提供的AI抠图功能,可以帮助用户智能去除人像、产品图、汽车、衣服、家居等各种类型的图片背景。

    Clipdrop Remove Background

    💰 产品价格:

    • Pro版本39元/月(包年的话33元/月)

    ✅ 产品优点:

    • 免费版可一直使用
    • 免费版即可支持达10张的批量抠图
    • 支持网页端、iOS、Android、PS 和 Figma 插件
    • 付费版价格相当划算,除开无限量抠图外,还可以使用Clipdrop提供的其他AI图片处理功能

    ⛔ 产品不足:

    • 免费版最高只支持1024*1024像素的图片背景去除

    Erase.bg

    Erase.bg是一款优质的在线AI抠图工具,利用人工智能的技术自动消除图像背景,让从图像中删除分散注意力或杂乱的背景变得更加容易。Erase.bg 只需几秒钟就可以识别前景对象并擦除周围的背景,省去了使用复杂图片编辑软件的麻烦,最高支持5000*5000分辨率。

    Erase.bg

    💰 产品价格:

    • 免费版支持45张图片抠图
    • Starter版本29美元/月,提供300张图片抠图
    • Basic版本89美元/月,提供1200张图片抠图
    • Premium版本299美元/月,提供5000张图片抠图

    ✅ 产品优点:

    • 免费版提供较多的使用次数
    • 提供网页版、Android和iOS应用程序
    • 无需登录注册便可以使用

    ⛔ 产品不足:

    • 免费版不支持批量抠图
    • 由于付款定价是美元,付费版性价比不高

    Remove.bg

    Remove.bg 是最早和最火的图片背景消除工具之一,无论是人像、产品、动物,还是汽车、图形、Logo,轻点一下上传图片,便可在几秒钟内自动去除背景。Remove.bg还新增了魔法笔刷功能,鼠标一涂抹便可以帮助用户精准地移除或还原图片中的物体。虽然 Remove.bg 产品强大并且生态很好,但是由于产品的定价,所以我们将其放在该文章靠后的位置。

    Remove.bg

    💰 产品价格:

    按订阅计价:

    • 59元一个月,每月40张抠图
    • 259元一个月,每月200张抠图
    • 599元一个月,每月500张抠图
    • 1290一个月,每月1200张抠图
    • 若年付的话,以上价格还有10%的优惠

    按张数计价:

    • 10张抠图,59元
    • 75张抠图,329元
    • 200张抠图,669元
    • 500张抠图,1350元

    ✅ 产品优点:

    • 图片背景移除速度快,效果最好
    • 除开在线网站外,还提供Windows、Mac、Linux、Android等应用程序
    • 生态完善强大,提供API、PS插件、Figma插件、Sketch插件、CLI命令等

    ⛔ 产品不足:

    • 免费版每月只能下载一张高分辨率图片,超出额度后只支持 0.25M像素的低分辨率图像免费去除背景
    • 付费版的产品定价相较国内的抠图软件没有优势

    美图抠图

    美图抠图是由美图秀秀推出的 AI 智能抠图工具,用户只需上传图片,便能一键快速去除图片背景。该工具支持全品类 AI 智能抠图,如人像、宠物、商品、图标等。除开抠图外,该工具还支持换背景、滤镜、改尺寸、边缘优化、投影、描边、画质修复等图片编辑功能。

    美图抠图

    💰 产品价格:

    按会员权益时间购买:

    • 20元,连续包月,每月50张抠图
    • 168元,连续包年,每年1200张抠图,提供7天免费试用
    • 50元,连续包季,每季250张抠图

    按抠图张数购买:

    • 30张,30元,永久有效
    • 100张,39元,永久有效
    • 1000张,159元,永久有效

    ✅ 产品优点:

    • 支持App、网页、Windows、Mac、Linux等
    • 会员可与美图秀秀权益联通
    • 付费版本相较其他竞品有性价比

    ⛔ 产品不足:

    • 不提供免费版本

    佐糖Picwish

    佐糖Picwish是国内公司推出的在线图片编辑工具箱,提供AI智能抠图功能,3秒即可出图。用户只需一键上传图片,便能实现快速抠图。其智能 AI 通过了数百万张图像资料的训练,利用深度学习技术自动识别需要保留的主体并移除多余背景,让抠图不再困难复杂。

    佐糖Picwish抠图

    💰 产品价格:

    • 49元每月,300点数
    • 99元每月,1000点数
    • 699元每月,15000点数

    ✅ 产品优点:

    • 提供免费版本的抠图,可一直使用,虽然只能下载标清的图片
    • 付费版本的价格具有性价比

    ⛔ 产品不足:

    • 某些带有精细毛发和细节的图片,抠图效果还有待提高

    腾讯ARC

    腾讯ARC是腾讯旗下的团队推出的一个实验项目,网站上提供三个免费可用的AI图片处理功能:人像修复、人像抠图、动漫增强。其中人像抠图便支持用户上传含有人像的图片,然后智能识别人物主体,自动去除杂乱的背景,无需手动进行精细抠图。

    腾讯ARC

    💰 产品价格:

    • 免费

    ✅ 产品优点:

    • 由腾讯出品,抠图效果较好
    • 完全免费,速度快

    ⛔ 产品不足:

    • 该工具主要是用于人像抠图,不太适合其他类型的图片
  • 12个免费的AI图片放大工具和网站,智能高清无损放大图像

    想要将模糊的旧照片/网络下载的图片变高清?或者是将AI生成的低分变率图片放大?人工智能图片放大工具可以帮助你实现高清无损放大和锐化数字照片,同时保留关键细节。在本篇文章中,我们详细介绍了12款免费的AI图片放大工具和网站,帮助你提高图片清晰度,将图像放大2-8倍于原始尺寸,仅带有较小的噪点或失真。

    🔢 测试工具数量 15+
    💻 支持设备/系统 网页、桌面端、手机端和微信小程序
    🔍 最高放大倍数 最高免费放大8倍
    🏅 前3名推荐 堆友AI高清、绘蛙AI高清、光子AI高清

    堆友AI高清

    堆友AI高清堆友AI推出的AI图片放大工具,支持将用户上传的模糊图片进行高清放大处理。用户通过拖拽或点击上传的方式添加图片,支持的图片格式包括.png、.jpg、.jpeg等多种格式,用户能选择不同的放大倍数,如4倍、9倍、16倍,获得更清晰的图片。

    堆友AI

    ✅ 产品优点

    • 高倍放大清晰度高:能将图片进行高倍数放大,最大程度地保持图片的细节和清晰度,无失真问题,让低分辨率或模糊的图片也能变得清晰细腻。
    • 操作简单便捷:使用过程非常简便,用户只需上传图片,一键即可实现高清放大,没有专业图像处理知识的小白用户也能轻松上手。
    • 无广告干扰:提供纯净的使用环境,用户在使用过程中可以专注于享受高清细节的乐趣,不会受到广告的干扰。
    • 适用范围广泛:适用于多种场景,如摄影作品修复、电商主图优化、插画设计辅助、影视与游戏素材制作等,能够满足不同用户在不同场景下的图片高清放大需求。

    ⛔ 产品不足

    • 对图片格式支持有限:可能对一些特殊的图片格式支持不全面,用户在使用时需要注意图片格式的兼容性

    绘蛙AI高清

    绘蛙AI高清是绘蛙推出的AI图像高清修复工具,用于提升图片清晰度和画质。用户只需上传图片,绘蛙可自动识别并修复图片中的模糊、低分辨率、噪点等问题,提升图像的整体质感和细节表现。绘蛙支持图片尺寸在400×400至8192×8192之间,文件大小不超过15MB,适用于电商商品图、社交媒体内容等多种场景。绘蛙AI采用先进的图像增强算法,能智能还原细节,图片更具视觉吸引力。

    ✅ 产品优点

    • 智能提升分辨率:基于深度学习算法,对低分辨率图片进行智能放大和细节重建,有效提升图片的清晰度和质感,使模糊图片变得更加锐利、真实。
    • 自动降噪与细节增强:在高清修复过程中,会自动识别图片中的噪点、模糊区域,进行降噪处理和细节增强,恢复图片中丢失的纹理、边缘和结构信息。
    • 一键操作,简单易用:用户只需上传图片,可自动完成修复过程,无需复杂参数设置或专业技能,适合电商卖家、内容创作者等非专业用户快速优化图片。
    • 适配多种电商与社交场景:修复后的图片可直接用于淘宝、天猫、京东、小红书、跨境电商等平台的商品展示、主图优化、种草内容等,提升视觉吸引力和转化率。

    ⛔ 产品不足

    • 更擅长人像修复:针对人像场景专门做过优化,其他场景适配不足。

    光子AI高清

    光子AI高清是光子AI推出的图像放大功能,基于先进的AI算法,能显著提升图片的分辨率,使模糊的照片或低清图像变得清晰,细节更加丰富。特别适合于老照片翻新、电商商品图修复以及低分辨率网络图片的增强等场景。用户只需上传图片,选择清晰度模式,可快速完成操作。

    光子AI高清

    ✅ 产品优点

    • 高效提升分辨率:光子AI的高清放大工具能显著提高图片的分辨率,使模糊或低分辨率的图像变得更加清晰,细节更加丰富。
    • 操作简便:用户只需上传图片并选择相关参数,可快速完成高清放大处理,无需复杂的设置,适合各种技术水平的用户。
    • 多种清晰度选项:提供不同的清晰度模式,用户可以根据需求选择合适的清晰度级别,平衡图片质量和处理速度。
    • 细节增强:通过AI算法,对图片中的细节进行增强处理,让模糊的图像变得更加清晰,细节更加明显。
    • 适应多种场景:适用于老照片翻新、电商商品图优化、网络图片增强、社交媒体内容优化等多种场景,满足不同用户的需求。

    ⛔ 产品不足

    • 对图片质量有限制:虽然AI技术可以显著提升图片质量,但对于极度模糊或损坏严重的图片,效果可能有限。

    稿定AI变清晰

    稿定AI变清晰

    稿定AI变清晰是稿定设计推出的AI图像修复工具,能有效提升模糊图片的清晰度。通过智能分析图像内容,精准补充画面信息,显著增强图像的细节和分辨率,让模糊照片焕然一新。适合用于老照片翻新、低分辨率图片优化以及轻微模糊的修复。用户可以选择“高清”或“超清”模式,“超清”模式能进一步优化图像细节,让画面更加栩栩如生。稿定AI变清晰在增强清晰度时会通过色彩校正技术避免过度饱和和色相偏移,让图像色彩保持自然。

    ✅ 产品优点

    • 由稿定设计推出,在线使用能输出高保真图像
    • 支持多种格式,如JPG/JPEG/PNG的图片
    • AI智能放大变清晰,无需手动设置

    ⛔ 产品不足

    • 不支持批量上传图片放大

    Upscayl

    Upscayl图片放大器

    Upscayl是一个精美的免费开源的AI图片无损放大工具,同时支持Windows、Mac、Linux等桌面系统,累计下载已超过240万。该工具在本地运行AI图片放大模型,无需将你的图片上传到云端,不用担心泄露自己的隐私照片。

    ✅ 产品优点

    • 免费且开源,不用花钱
    • 同时支持Windows、Mac和Linux系统
    • 支持批量进行图片放大
    • 支持加载自定义AI模型

    ⛔ 产品不足

    • 不支持在线处理,需要下载到桌面端
    • 最高只能放大4倍

    BigJPG

    BigJPG图片智能放大

    BigJPG使用最新的人工智能深度学习技术——深度卷积神经网络,将噪点和锯齿的部分进行补充,以实现图片的无损放大。BigJPG 通过神经网络,针对放大图片的线条、颜色、网点等特点,做特殊的算法调整,所以放大效果非常出色,色彩保留较好,图片边缘也不会有毛刺和重影。

    ✅ 产品优点

    • 免费版可以不限次数放大2倍和4倍
    • 同时支持网页版、Windows、Mac、iOS、Android和小程序等多个平台
    • 支持上传多张图片批量放大
    • 提供放大时图片降噪程度的选项

    ⛔ 产品不足

    • 免费版图片放大处理速度较慢,有一定的等待时间
    • 动漫、插画图片的放大效果较好,普通照片的放大质量一般
    • 网站的界面简约直观,但比较朴素,如果能够改版优化一下更好

    Upscale.media

    Upscale.media

    Upscale.media是由 Pixel Bin 推出的一个人工智能图片放大平台,可以将低分辨率图像其转换为清晰、高清的版本。该AI图片放大工具使用先进的深度学习算法,可以为像素化图像添加逼真的细节和纹理,在保持自然外观的同时有效提高分辨率。无论你是想改善旧照片,提高打印或网络图像的分辨率,还是减少图像噪声和压缩伪影,Upscale.media都提供了一种简单而强大的方式。

    ✅ 产品优点

    • 免费版支持免费放大45张图片
    • 支持多个平台使用,包括网站、Android、iOS等设备

    ⛔ 产品不足

    • 最高只支持图片放大到4倍

    ClipDrop Image Upscaler

    ClipDrop图片放大

    ClipDrop Image Upscaler是知名开源AI图像生成模型 Stable Diffusion 背后的公司 Stability AI 推出的一项AI图片无损放大服务,最高支持将图片放大到6000×6000像素。用户可以使用ClipDrop Image Upscaler用提高压缩图像的质量、去除图像噪点、锐化图片等以提高图片清晰度。

    ✅ 产品优点

    • 免费版支持无限次进行2倍放大
    • 支持上传多张图片进行批量放大
    • 可配合ClipDrop提供的其他AI图像工具进行二次编辑

    ⛔ 产品不足

    • 放大4倍、8倍、16倍需要升级到Pro版本

    Img.Upscaler

    Img.Upscaler

    Img.Upscaler是一个在线的智能 JPG/PNG 图片放大器,利用最新的人工智能和超分辨率技术,只需要几秒钟,便可以将低分辨率图像变得高清。该工具还集成了图像编辑器工具,用于在图像放大之前或之后进行裁剪、滤镜、微调、注释等。

    ✅ 产品优点

    • 免费版支持2倍和4倍放大
    • 支持批量上传图片放大
    • 集成图像编辑器工具

    ⛔ 产品不足

    • 只支持JPG和PNG格式的图片

    Let’s Enhance

    Let's Enhance

    Let’s Enhance是一个由人工智能驱动的在线AI图片放大工具,可以在不降低质量的情况下改善图像和缩放图像。该工具使用了机器学习的超分辨率技术,在大量真实照片基础上训练的神经网络,依靠其对现实世界中存在的典型物体和纹理的了解,学习恢复细节并保持清晰的线条和轮廓。

    ✅ 产品优点

    • 网站设计精美,用户体验较好
    • 支持批量上传图片放大

    ⛔ 产品不足

    • 免费版只支持免费放大 10 张图片
    • 免费版带有Let’s Enhance的水印

    Icons8 Smart Upscaler

    Icons8 Smart Upscaler

    Icons8 Smart Upscaler是图标和设计资源平台 Icons8 推出的 AI 图片放大网站,该工具利用先进的人工智能技术,可以增加任何的数字图像的大小和分辨率,同时保留和增强自然纹理和细节。无论是小尺寸的社交媒体图像,还是手机相册里的模糊老照片,Icons 8 Smart Upscaler基于人工智能的算法可以研究你的图像,并以高达原始分辨率 8 倍的分辨率智能地重新创建它们。

    ✅ 产品优点

    • 支持Figma插件
    • 支持批量图片上传放大

    ⛔ 产品不足

    • 免费版仅支持3张图片放大
    • 免费版放大后有水印
    • 免费版仅支持放大2倍

    GoProd

    Icons8 GoProd

    GoProd是 Icons8 推出的一款集图像无损放大和背景移除于一体的Mac应用程序,在人工智能的支持下,用户只需简单的操作,把想要编辑的图像拖放到应用窗口,片刻后就能得到所需的图像,最高支持放大到6400MP像素。

    ✅ 产品优点

    • 软件操作简单直接
    • 支持批量进行图片放大
    • 除开图片放大外,还提供背景移除功能

    ⛔ 产品不足

    • 免费版放大有水印
    • 没有图片放大倍数可选
    • 仅支持Mac系统使用

    以上便是AI工具集为大家整理的免费的AI图片放大工具和网站,其中Top 3推荐为:美图设计室、Upscayl 和 BigJPG,希望可以帮助你高清无损放大想要编辑的图片。

  • 每日AI快讯热闻

    每日AI快讯

    AI工具集每日实时更新 AI 行业的最新资讯、新闻、热点、融资、产品动态、爆料等,让你随时了解人工智能领域最新趋势、更新突破和热门大事件。加入AI工具集官方社群,获取最新一手信息!

    9月30·周二

    智谱旗舰模型GLM-4.6上线,代码能力全面进阶

    智谱清言发布新一代大模型GLM-4.6,代码能力全面升级,对齐Claude Sonnet 4,成为国内最强Coding模型。模型在真实编程任务中表现优异,平均token消耗较上一代降低30%。上下文长度提升至200K,推理、搜索、写作能力显著增强。来源:智谱

    Claude 4.5 发布,史上最强AI编程模型诞生

    Anthropic发布Claude Sonnet 4.5,AI模型在编程能力上取得重大突破。在SWE-bench Verified测试中,Claude Sonnet 4.5登顶业界第一,能连续工作超30小时,可一次性写出约1.1万行代码。其在OSWorld测试中拿下61.4%的成绩,同样位居第一。Claude Sonnet 4.5还增加了“检查点”功能,可随时保存进度,终端界面翻新,并发布了原生VS Code插件。来源:APPSO

    蚂蚁百灵发布Ring-1T-preview,深思不必久等

    Ling Team发布万亿规模语言基座模型Ring-1T-preview。模型在AIME 2025等竞赛中表现优异,接近GPT-5水平。在IMO 2025测试中,Ring-1T展现出强大的推理能力。为探索其上限,团队提前开源Ring-1T-preview,模型在20T语料上预训练,结合强化学习训练。来源:百灵大模型

    OpenAI 推出“即时结账”功能,ChatGPT 变身购物支付一体机

    OpenAI宣布推出“即时结账”功能,用户可在ChatGPT内直接购物。目前,美国地区的ChatGPT用户可在对话界面内完成Etsy平台购物及Shopify平台下单。该功能已面向ChatGPT Pro、Plus付费用户及登录状态下的免费用户开放,现阶段支持从美国本土Etsy卖家处购物,超100万家Shopify商户将“很快”支持该功能。来源:IT之家

    9月29·周一

    DeepSeek-V3.2-Exp 发布,训练推理提效,API 同步降价

    DeepSeek团队发布实验性模型DeepSeek-V3.2-Exp。模型在V3.1-Terminus基础上引入DeepSeek Sparse Attention(DSA)机制,大幅提升长文本训练和推理效率,性能与V3.1-Terminus持平。目前,DeepSeek-V3.2-Exp已更新至官方App、网页端和小程序,API价格大幅下降,调用成本降低50%以上。来源:DeepSeek

    乐享科技完成2亿元“天使++”轮融资,天使轮融资总额近5亿元

    苏州乐享智能科技有限公司宣布完成2亿元“天使++”轮融资,是其9个月内第三轮融资,天使轮总金额近5亿元。本轮融资由钟鼎资本领投,IDG资本加注,资金将用于核心零部件自研、机器人本体与运动控制技术研发等。来源:乐享科技JoyIn

    苹果自研多模态 AI 模型 Manzano:兼具理解与生成能力

    苹果正在研发名为Manzano的多模态AI模型,兼具图像理解和生成能力,目标是解决现有模型在处理图像任务时的取舍问题。Manzano采用混合图像分词器,通过共享编码器输出连续标记和离散标记,减少任务冲突。其架构包括混合分词器、统一语言模型和独立图像解码器,参数规模从9亿到35.2亿不等,支持多种分辨率。来源:IT之家

    9月28·周日

    混元图像3.0正式发布:开源,免费使用

    腾讯混元图像3.0正式发布并开源。模型是首个工业级原生多模态生图模型,参数规模达800亿,是目前测评效果最好、参数量最大的开源生图模型。混元图像3.0具备强大的语义理解能力、极致美学质感,可生成高质感图片,并能解析复杂语义,生成长文本和小文字。来源:腾讯混元

    Qoder CLI 开启邀测:把 Qoder 的智能带到每一个终端

    Qoder团队宣布推出Qoder CLI,开启邀测。Qoder CLI是一款轻量级、AI原生的命令行工具,为开发者提供更高效、更智能的编码体验。支持自然语言交互,可生成代码、调试、重构、自动化任务等,与Qoder IDE深度集成,同时支持无头模式,便于CI/CD流程调用。来源:Qoder

    腾讯混元3D开源+2:瞄准游戏建模、3D 打印痛点

    腾讯混元发布并开源3D生成模型混元3D-Omni混元3D-Part。混元3D-Omni是业界首个统一支持多条件控制的3D生成框架,突破图像输入局限,支持多种模态输入,可精细控制物体几何结构等。混元3D-Part实现灵活可控的部件拆分和生成,让3D模型像乐高一样可拆卸,便于游戏制作、3D打印等。来源:腾讯混元

    9月26·周五

    全球首个动漫制作神器“萌动AI”国内登场,免费不限次

    全球首款二次元/动漫专用AI创作工具“萌动AI”在国内上线。用户可通过官网免费不限次数使用文字/图片、首尾帧及视频续写功能创作优质动漫图片和视频。其生图板块支持文生图和图生图,有多种风格可选,人物一致性编辑效果好。视频生成功能可将图片转为视频,并进行续写和首尾帧生成。来源:AI工具集

    AI陪伴硬件公司珞博智能(Robopoet)宣布完成数千万元天使+轮融资

    AI陪伴硬件公司珞博智能(Robopoet)完成数千万元天使+轮融资,由红杉中国领投,金沙江创投、零一创投跟投。首款产品“Fuzozo芙崽”定位AI电子宠物,凭借可爱外观与好玩的AI体验,深受20-30岁一线女性喜爱,本轮融资后,公司将强化AI能力,拓展销售渠道,构建品牌认知及IP世界观,并计划推出联名款新品。来源:Robopoet珞博智能

    OpenAI推出ChatGPT Pulse,奥特曼:这是我最喜欢的功能

    OpenAI推出ChatGPT Pulse预览版,目前仅限Pro用户使用,未来将逐步扩展。该功能会在用户睡觉时根据其聊天记录、反馈及连接应用进行研究,第二天以主题卡片形式推送个性化内容,如旅游攻略、育儿贴士等。它旨在成为AI版私人助理和个性化资讯流,且不会让用户沉迷刷屏。来源:APPSO

    Kimi 全新 Agent 模式 OK Computer 启动测试

    月之暗面的Kimi发布全新Agent模式OK Computer并开启灰度测试。模式延续“模型即Agent”理念,通过端到端训练Kimi K2模型,提升智能体及工具调用能力。用户下达需求后,Kimi可操作虚拟电脑,完成多功能网站开发、海量数据分析、图片视频生成及高品质PPT制作等复杂任务。来源:IT之家

    9月25·周四

    生数科技全球发布Vidu Q2,推动“视频生成”走向“演技生成”时代

    生数科技发布新一代图生视频大模型Vidu Q2。模型以“Vidu Q2 看AI演戏”为主题,核心在于“细微表情生成”,在表情变化、运镜、生成速度及语义理解等方面取得突破,实现了从“生成视频”到“生成演技”的跨越。Vidu Q2能够生成复杂表情变化的文戏、多人打斗的武戏及炫酷特效场景,推动AI视频生成从“形似”到“神似”。来源:生数ShengShu

    智能编程助手 Neovate Code 正式开源

    蚂蚁集团支付宝体验技术部开源智能编程助手Neovate Code。工具可深度理解代码库,遵循编码习惯,实现功能开发、Bug修复和代码重构等功能。支持对话式开发、自定义规则文件、会话继续与恢复等,兼容OpenAI、Anthropic、Google等模型和提供商。来源:蚂蚁开源

    Meta FAIR推出了代码世界模型:CWM(Code World Model)

    Meta FAIR推出全球首个代码世界模型CWM。是一个参数量为32B、上下文大小达131k token的密集语言模型,专为代码生成和推理打造。CWM不仅能生成代码、理解语义,还能模拟代码运行过程中的变量状态变化与环境反馈,具备接近人类程序员的思考能力。来源:量子位

    英伟达开源 Audio2Face 模型:AI 实时生成面部动画

    英伟达开源生成式AI面部动画模型Audio2Face,涵盖模型、SDK及完整训练框架,加速游戏和3D应用中AI智能虚拟角色开发。通过分析音频特征,实时驱动虚拟角色面部动作,生成精准口型同步和自然情感表情,广泛应用于游戏、影视制作等领域。来源:IT之家

    阿里云推出创业者的AI数字员工“万小智”

    阿里云在云栖大会上推出面向中小微企业及个人创业者的AI数字员工“万小智”。集成AI开发、设计、客服与内容创作能力,帮助企业解决从品牌官网搭建到持续运营的问题。万小智依托通义大模型,具备四大核心功能:通过对话搭建官网、生成设计师级视觉效果、提供7×24小时智能客服以及生成SEO优化的内容。来源:阿里云万网

    9月24·周三

    6款模型和1个全新品牌,云栖大会一口气全发了!

    云栖大会上通义大模型团队一口气发布了6款模型和1个全新品牌。Qwen MAX是万亿参数旗舰模型,Coding能力和工具调用能力登顶国际榜单。Qwen3-VL是视觉理解模型,支持2小时视频精确定位和多种语言OCR。Wan2.5-Preview是音画同步创意引擎,支持音画同步和多种图像生成编辑功能。通义百聆是企业级语音基座大模型,解决语音识别和合成中的痛点。来源:通义大模型

    夸克全新AI图像与视频创作平台「造点AI」正式上线!

    夸克全新AI图像与视频创作平台「造点AI」正式上线。平台拥有AI生图、AI生视频、P图、编辑一体化等功能,搭载通义万相Wan2.5等多个模型,更懂中国元素,更具实用性。「AI生图」可生成真实亚洲人像、准确中文内容,驾驭多种艺术风格;「AI生视频」支持原生音画同步生成等,助力普通人实现导演梦。来源:夸克

    阶跃AI的新朋友:桌面伙伴「小跃」开启邀测

    阶跃AI推出桌面伙伴“小跃”并开启邀测。小跃常驻桌面右上角,可同时执行多任务,连接本地操作系统,支持查看管理本地文件、访问互联网、执行复杂任务等。其“妙计”功能可复用操作步骤,“定时任务”可到点自动执行。小跃能自主完成任务规划与执行,可与本地文件交互,一键处理文件。来源:阶跃星辰

    ProcessOn发布:Calicat AI ,人人都是产品专家!

    ProcessOn团队推出一站式产设研协作平台Calicat,整合原型设计、需求管理和任务管理功能,并融合AI能力。Calicat的AI设计助理可实现零门槛画高保真原型图,支持多种设计需求,如整套页面设计、组件模块设计、草图转原型、从网页提取设计等。来源:ProcessOn

    9月23·周二

    智元机器人GO-1通用具身基座大模型全面开源!

    智元机器人宣布其通用具身基座大模型GO-1正式在GitHub开源。是全球首个采用Vision-Language-Latent-Action(ViLLA)架构的具身智能模型,可降低技术门槛,推动行业发展。GO-1通过引入隐式动作标记,弥合了图像-文本输入与机器人执行动作之间的语义鸿沟,能更好地理解人类意图并转化为精确动作执行。来源:智元机器人

    ChatExcel生成PPT功能上线,10秒,100M表格秒变数据报告PPT

    ChatExcel一键生成PPT功能正式上线,仅需10秒,即可将100M表格转化为数据报告PPT。可自动分析表格和聊天上下文,生成逻辑严谨、结论清晰的专业数据报告PPT,支持单元格级溯源,准确率高达100%。用户只需上传表格、对话并点击“生成PPT”按钮,即可获得排版精美、逻辑完整、可直接汇报的PPT。来源:元空AIExcel

    英伟达1000亿美元投资OpenAI!一切从算力开始

    英伟达与OpenAI宣布签署战略合作意向书,计划未来数年建设至少10GW的AI数据中心,部署数百万颗英伟达GPU。英伟达将按每1GW交付进度,逐步向OpenAI投资最高1000亿美元,换取非投票股权。这是AI行业迄今最大规模的资金与硬件捆绑交易,被视为全球算力格局的重塑。来源:有新Newin

    DeepSeek-V3.1 现已更新至 DeepSeek-V3.1-Terminus 版本

    DeepSeek-V3.1版本已更新为DeepSeek-V3.1-Terminus。此次更新优化了语言一致性,缓解中英文混杂等问题,同时提升了Code Agent与Search Agent的表现,输出效果更稳定。新版本已在官方App、网页端、小程序及DeepSeek API同步更新。来源:DeepSeek

    Qwen3-Omni 和 Qwen3-TTS 同时发布!

    Qwen团队发布Qwen3-TTS和Qwen3-Omni两款模型。Qwen3-TTS-Flash支持17种音色和10种语言,包括多国语言和中国方言,延迟低至97毫秒,性能卓越。Qwen3-Omni发布三个版本,包括全模态描述模型、标准版和思考版,支持119种文本语言交互、19种语音理解语言和10种语音生成语言。来源:AI工具集

    9月22·周一

    LongCat-Flash-Thinking 正式发布,更强、更专业,保持极速!

    美团LongCat团队发布全新高效推理模型LongCat-Flash-Thinking。模型在保持极速的同时,推理能力显著提升,达到全球开源模型领先水平。具备深度思考与工具调用结合、非形式化与形式化推理融合等创新功能,在逻辑、数学、代码、智能体等多领域推理任务中表现出色。来源:龙猫LongCat

    全球首个「推理视频模型」Ray3发布!

    Luma AI发布了全球首个推理视频模型Ray3,模型具备强大的推理能力,能理解复杂指令并实时评估改进生成效果。Ray3支持10位、12位和16位HDR视频生成,提供电影级质感,可将SDR视频转换为HDR,支持16位EXR帧导出,方便后期制作。Ray3推出草稿模式,生成速度提升5倍,成本降低5倍,方便用户快速迭代创意。来源:AI工具集

    华为、浙大发布 DeepSeek-R1-Safe 基础大模型

    华为与浙江大学在华为全联接大会2025上联合发布了DeepSeek-R1-Safe基础大模型。模型基于昇腾千卡算力平台,构建了全流程安全后训练框架,首次实现千亿级参数满血版大模型安全训练。来源:IT之家

    高德TrafficVLM模型重磅升级:AI赋予天空视角,可预知超视距路况

    高德导航宣布TrafficVLM模型升级,赋予用户“天眼”视角,助力全局交通掌控。升级后的TrafficVLM依托空间智能架构,可实时感知交通态势,为用户提供超视距路况预知。例如,能提前识别前方3公里的拥堵点并推送最优通行建议,能通过导航界面切换实时呈现前方车流动态与高清实景图像。来源:高德

    Teable 宣布完成数百万美元天使轮融资,让数据库「长出耳朵和手」

    Teable宣布完成数百万美元天使轮融资,投资方包括真格基金、BV百度风投与祥峰投资。此前,Teable于9月16日在X平台发布全球首款多维表格智能体AI Database Agent(Teable 2.0)。Teable 2.0具备对话式建库、生成应用、自动化流程、数据分析与批量内容生成的一体化能力,用户可用自然语言完成复杂数据工作。来源:极客公园

    9月19·周五

    一个模型支持两种场景!Wan2.2-Animate开源发布

    阿里开源全新动作生成模型通义万相Wan2.2-Animate。可同时支持动作模仿和角色扮演两种模式,输入角色图片和参考视频,能将视频角色动作迁移到图片角色中,也可在保留原视频动作、表情及环境基础上替换角色。构建大规模人物视频数据集,实现单一模型兼容两种推理模式,精准复刻动作和表情,设计光照融合LoRA保证光照融合效果。来源:通义万相Wan

    小米开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio

    小米开源首个原生端到端语音大模型Xiaomi-MiMo-Audio。模型基于创新预训练架构和上亿小时训练数据,首次在语音领域实现基于ICL的少样本泛化,展现出跨模态对齐能力。Xiaomi-MiMo-Audio在多项标准评测中超越同参数量开源模型及Google、OpenAI的闭源模型。来源:Xiaomi MiMo

    2025H1大模型公有云服务,火山引擎占比49.2%中国第一

    IDC发布《中国大模型公有云服务市场分析,2025H1》报告。报告显示,2025年上半年,中国公有云上大模型调用量达536.7万亿Tokens,火山引擎以49.2%的份额位居中国第一。相比2024年全年114万亿Tokens的市场规模,2025年上半年调用量增长近400%。火山引擎推出多个多模态大模型,助力AI应用落地。来源:火山引擎

    Notion重磅发布AI智能体!自动生成会议笔记、竞品分析

    Notion 发布了首个 AI Agent。能以用户的页面与数据库为上下文,自动生成会议纪要、竞品分析、反馈汇总等内容,能新建或更新页面、整合 Slack/邮箱/Google Drive 等外部信息。相比已有的 Notion AI,新 Agent 具备多步骤执行能力,可完成跨数百页、耗时 20 分钟的复杂任务。用户可为 Agent 设置 profile 来定义引用规则、风格与记忆信息。来源:AI工具集

    生数科技完成新一轮数亿元人民币规模的A轮融资

    生数科技于2025年9月完成数亿元人民币A轮融资,由博华资本领投,百度战投等跟投。公司成立于2023年,核心团队由顶尖高校技术人才和产业界人才组成,专注于多模态大模型及应用的自主研发。新一轮融资将用于模型研发、技术创新和全球商业布局。来源:生数ShengShu

    Chrome 迎来大更新,刚刚登顶 App Store 的 AI 可以直接用了

    谷歌浏览器Chrome迎来自2008年发布以来最大更新,引入Gemini模型,新增多项AI功能。用户可通过点击右上角Gemini图标,实现跨标签页对话,解决找不到标签页等问题。Gemini还能整合多标签页信息,如对比产品优缺点、生成旅行计划等,提升信息处理效率。此外,Chrome新增智能体能力,可自动完成网页操作,如预订餐厅、购物等。来源:APPSO

    9月18·周四

    面壁小钢炮迎新:VoxCPM 语音生成媲美真人、声音复刻超像!

    面壁智能推出0.5B参数语音生成基座模型VoxCPM。模型由面壁智能与清华大学深圳国际研究生院联合研发,具备高自然度、高音色相似度和强韵律表现力。VoxCPM在权威语音合成评测中达SOTA水平,支持零样本声音克隆,可生成独特个人声音。来源:面壁智能

    具身操作大模型InternVLA·A1上线,助力实现高动态场景下的多机器人协作

    上海人工智能实验室推出首个理解、想象、执行一体化具身操作大模型InternVLA·A1。模型基于自研虚实混合操作数据集InternData·A1、国地中心实训场数据及互联网多源数据联合训练而成。在真机评测中,InternVLA·A1显著优于π0及GR00T N1.5,尤其在高动态场景下表现出强适应能力。来源:书生Intern

    AI芯片黑马Groq融资狂吸7.5亿美元 估值直冲69亿

    美国人工智能芯片初创公司Groq在最新一轮融资中筹集了7.5亿美元,估值达到69亿美元。本轮融资由Disruptive领投,贝莱德、路博迈、DTCP等参与,三星、思科等现有投资者也继续参与。Groq计划利用这笔资金扩大数据中心容量,包括今年和明年的新地点,并计划在年内宣布首个亚太地区的选址。来源:财联社

    AI代码审查初创公司CodeRabbit获6000万美元B轮融资

    AI代码审查初创公司CodeRabbit获6000万美元B轮融资,估值达5.5亿美元。本轮融资由Scale Venture Partners领投,英伟达企业风投等跟投。CodeRabbit通过云端与本地工具为开发团队提供自动化代码审查、安全检测和修复建议,帮助开发者提升代码质量与上线效率。来源:智东西

    可调节思考时长,ChatGPT 网页端新增 GPT-5 Thinking 调整功能

    OpenAI宣布为ChatGPT网页版的Plus、Pro和Business用户推出“Thinking”调整功能,用户可自由选择GPT-5模型的思考时长。功能包括标准模式(默认)、扩展模式、轻量模式和重度模式,分别对应不同的思考深度和回复速度。用户设置将保持不变,直至手动更改。来源:IT之家

    天工超级智能体海外版上线Vibe Coding Agent:AI Developer

    昆仑万维集团宣布天工超级智能体(Skywork Super Agents)海外版上线全新Vibe Coding Agent——AI Developer。功能帮助非专业开发人员,如白领、营销人员、教师、学生等,通过自然语言与Agent交互,快速构建、部署和管理全栈Web应用程序。用户通过几轮交互即可得到专属网站,支持自动收发邮件、对接支付系统等后端能力,能自动部署上线。来源:昆仑万维集团

    9月17·周三

    李飞飞发布世界模型新成果:Marble!一张图生成 3D 世界

    斯坦福大学教授李飞飞的创业公司World Labs上线空间智能新成果Marble。Marble是限量访问的Beta测试版平台,用户可在官网浏览和创建3D世界。技术通过给AI一张照片,让其生成场景的几何结构等,创建可探索的3D世界。来源:APPSO

    不止SOTA!通义 DeepResearch模型、框架、方案全开源

    阿里巴巴通义实验室发布通义DeepResearch模型、框架及方案,全部开源。研究针对AI“做研究”能力,进行系统性创新。自研全流程合成数据方案,无需人类干预,构造高质量数据集。提出智能体增量预训练阶段,提供大规模数据合成方案。在后训练数据合成、形式化建模、自动化生成高难度学科数据等方面均有创新。模型支持多种推理形式,革新Agent模型训练流程。来源:通义大模型

    首个数字界面生产级Agent:MasterGo Agent 正式发布

    莫高设计(MasterGo)宣布正式发布MasterGo Agent,是全球首个数字界面生产级AI Agent。自MasterGo AI整页生成上线以来,团队不断听取设计师的需求,包括调用设计规范、在画布中直接生成和灵活修改设计,以及AI融入生产协作流程。来源:MasterGo莫高设计

    全球估值最高的机器人公司,刚刚融了71亿,黄仁勋又投了

    美国人形机器人公司Figure宣布完成超10亿美元(约合人民币71亿元)C轮融资,投后估值达390亿美元(约合人民币2774亿元)。本轮融资由Parkway Venture Capital等多家知名机构领投,英伟达、英特尔资本等参投。Figure计划将资金用于人形机器人在家庭和商业的扩展、构建下一代GPU基础架构以及先进数据收集。来源:智东西

    通用奖励模型VLAC上线,机器人在真实世界强化学习的“好搭子”

    上海人工智能实验室上线具身奖励大模型VLAC。VLAC基于InternVL多模态大模型,融合多种数据,为机器人在真实世界强化学习提供过程奖励和完成情况估计,同时输出动作指令。能有效区分正常与异常行为,支持小样本快速泛化。来源:书生Intern

    9月16·周二

    OpenAI 发布 GPT‑5-Codex 新模型,专为编程而生

    OpenAI 发布了 GPT-5-Codex,是一个专为编程优化的全新模型,全面应用于 Codex CLI、IDE 扩展、网页端、移动端及 GitHub 代码审查。该模型沿用了 GPT-5 的动态调整思考时间特性,根据任务复杂度自动分配计算资源,简单任务秒回,复杂任务深度思考。来源:AI工具集

    真人手办建模自由!腾讯混元3D 3.0来了

    腾讯发布混元3D 3.0模型,建模精度提升3倍,几何分辨率高达1536³,支持36亿体素超高清建模,细节表现力显著增强。该模型面向用户免费开放,上线腾讯云API,助力游戏、影视、电商等行业实现专业级3D内容创作。混元3D 3.0专项优化人物生成,提升建模精度,使五官轮廓更清晰立体,体态更自然流畅。来源:腾讯混元

    宇树开源 UnifoLM-WMA-0 世界模型动作架构

    宇树科技宣布开源UnifoLM-WMA-0世界模型架构,专为通用机器人学习设计的跨多类机器人本体的开源架构。核心是能理解机器人与环境交互物理规律的世界模型,具备两大功能:一是作为交互式仿真器运行,为机器人学习提供合成数据;二是与动作头对接,通过预测未来与物理世界的交互过程来优化决策性能。来源:Unitree宇树

    9月15·周一

    FunAudio-ASR:解决语音大模型企业落地的“最后一公里”

    阿里巴巴推出FunAudio-ASR语音识别大模型,专为解决企业落地难题。模型通过创新的Context增强模块,有效优化了“幻觉”“串语种”等关键问题。在高噪声等复杂场景下,其识别准确率显著提升,幻觉率从78.5%降至10.7%。来源:通义大模型

    Mureka上线「Agent Studio」新功能,让每个人都拥有私人音乐工作室!

    昆仑万维旗下AI音乐创作平台Mureka上线新功能“Agent Studio”,让音乐创作变得轻松。用户只需说出想法,如一句话、情绪或梗,Agent可自动生成歌词、匹配风格并输出完整歌曲。目前有六个场景,如创作专辑、热点写歌、以歌致礼等,覆盖多种生活场景。来源:昆仑万维集团

    火山引擎veCLI发布,开启智能开发新模式

    火山引擎发布命令行AI Agent:veCLI,无缝集成豆包大模型1.6,助力开发者在终端直接访问火山方舟大模型及火山云产品。veCLI采用“思考-行动”循环机制,集成多种模型,降低技术门槛,提升开发效率。来源:火山引擎

    金山办公与华为联合发布 WPS 365 一体化 AI 办公解决方案

    金山办公与华为在珠海联合发布WPS 365一体化AI办公解决方案。方案整合WPS 365的协同办公优势与华为的全栈技术能力,通过AI、软件与云计算、硬件的协同创新,解决组织在知识资产管理、协同办公、安全合规等方面的核心需求。来源:IT之家

    小米AI团队发布ZipVoice:高效零样本语音合成模型

    小米集团AI实验室发布ZipVoice系列语音合成模型,包括零样本单说话人语音合成模型ZipVoice和零样本对话语音合成模型ZipVoice-Dialog。ZipVoice通过技术创新,解决了现有模型参数大、速度慢的问题,实现轻量化建模和推理加速。ZipVoice-Dialog则突破对话语音合成的稳定性和速度瓶颈,提供又快又稳又自然的语音对话合成。来源:小米技术

    腾讯开源Youtu-GraphRAG:让图检索增强生成更准确、更省钱!

    腾讯优图实验室开源图检索增强生成框架Youtu-GraphRAG。框架主打大语言模型+RAG模式,将知识组织成图谱,帮助大模型在处理复杂问答任务时更精准、可追溯,适用于知识密集型场景。其创新点包括四层知识树、社区检测升级和智能迭代检索,可减少“胡言乱语”。来源:腾讯云

    9月12·周五

    阿里通义正式发布:Qwen3-Next-80B-A3B 双模型!

    Qwen3-Next-80B-A3B双模型正式发布,包含擅长指令理解和执行的Instruct版本以及擅长多步推理和深度思考的Thinking版本。模型采用混合动力引擎,75%高效处理长文本,25%精准召回关键信息,实现长文处理的稳与快。来源:通义大模型

    美团正式发布首个生活类AI Agent——小美

    美团上线了首个生活类Agent——小美。小美可快速完成外卖点单、支付等操作,能记住用户过往订单和收货地址,支持跨地区点单。小美能设置定时任务,如定时点咖啡等。来源:AI工具集

    MiniMax音乐模型新突破:MiniMax Music 1.5上线

    MiniMax发布新一代音乐生成模型Music 1.5,开启“一人即乐队”新时代。模型生成时长升至4分钟,具备四大突破:强控制力,可对歌曲风格、情绪、场景等进行自定义;人声自然饱满,转音顺畅;编曲层次丰富,支持中国小众及民族乐器;歌曲结构清晰,带来“叙事级”听觉体验。来源:MiniMax稀宇科技

    微软 Copilot 新增音频表达式功能

    微软为Copilot工具新增“Copilot音频表达式”功能,基于自研MAI-Voice-1模型。用户可从三种语音模式中选择:有感染力模式,适合传递情感;故事模式,适合多角色故事讲述;脚本模式,适合精准传递信息。每种模式还提供多种语音类型与风格,如莎士比亚朗读风、体育解说风等。来源:IT之家

    9月11·周四

    蚂蚁百宝箱正式发布“Tbox”, 智能体告别 “单打独斗”,直接把成果送到手!

    蚂蚁百宝箱在2025 Inclusion·外滩大会上正式发布新产品Tbox超级智能体。Tbox采用多智能体协同架构,可自动形成工作小组完成用户任务,如生成PPT、报告、网页等,将AI应用从“卖工具”推进到“卖成果”阶段。动态编排引擎能根据任务复杂度调整智能体协作,用户无需技术知识,只需描述需求即可获得成果。来源:蚂蚁百宝箱Tbox

    快手AI超级员工Kwali上线!一句话剪出完整短视频

    快手推出AIGC超级员工Kwali,正在内测阶段。用户只需在对话框中说出需求,Kwali能在几分钟内生成完整的短视频,包括脚本、字幕和背景音乐。背后是强大的云端多Agent框架,可将需求拆解并分配给不同Agent完成,如意图解析、脚本生成、镜头匹配和剪辑合成等。来源:量子位

    阿联酋开源“最快推理模型”K2-Think,撞名Kimi

    阿布扎比穆罕默德·本·扎耶德人工智能大学与AI创企G42推出低成本推理模型K2-Think,基于阿里巴巴开源模型Qwen 2.5构建,参数量320亿,性能超过参数规模20倍的OpenAI和DeepSeek旗舰推理模型。模型在复杂数学任务基准测试中表现优异,部署在Cerebras晶圆级芯片上,性能提升10倍。来源:36氪

    北京智源研究院孵化的具身大脑公司星源智获2亿元天使轮融资

    北京星源智机器人科技有限公司完成2亿元人民币天使轮融资,投资方包括中科创星、高瓴、元禾原点等知名机构。公司成立于2025年8月1日,由北京智源研究院孵化,致力于构建物理世界的通用具身大脑。来源:星源智机器人

    9月10·周三

    即梦上线图片4.0模型,首次支持多模态生图

    即梦AI图片模型4.0正式上线。模型基于字节跳动自研的seedream4.0,融合常识和推理能力,是业界领先的多模态创意引擎。支持多参考图输入、生成系列组图、指令编辑、交互框选编辑等功能,可高度还原原图特征,实现无损编辑。来源:即梦AI

    爱诗科技完成6000万美元B轮融资,阿里巴巴领投

    AI视频生成领军企业爱诗科技宣布完成6000万美元B轮融资,阿里巴巴领投,达晨财智、深创投、北京市人工智能产业投资基金等跟投。自研PixVerse V5模型位居Artificial Analysis图生视频榜首,产品PixVerse(拍我AI)入选a16z“全球Top 50生成式AI消费移动应用”榜单第25位。此轮融资将助力公司技术研发和市场拓展,推动AI视频生成技术的普惠。来源:爱诗科技AIsphere

    混元生图模型开源升级2.1版本:支持写字、2k分辨率

    腾讯混元发布开源文生图模型“混元图像2.1(HunyuanImage 2.1)”。模型支持原生2K生图,在复杂语义理解、跨领域泛化、美学表现和适用场景多样性等方面显著提升。支持中英文输入,可生成高保真插画、海报、漫画等,能对图像文字进行精细控制。来源:腾讯混元

    具身智能关节厂商「灵足时代」连续完成Pre-A&Pre-A+千万元融资

    具身智能关节厂商灵足时代已完成Pre-A&Pre-A+两轮数千万元融资,Pre-A轮由红杉种子领投,弘晖基金和兴牛资本等跟投;Pre-A+轮由弘晖独家投资。灵足时代成立于2023年11月,主营业务为一体化关节模组产业应用。来源:36氪

    9月9·周二

    腾讯发布自研AI CLI:CodeBuddy Code,国内首家支持全形态AI编程工具

    腾讯发布全新AI CLI工具CodeBuddy Code,腾讯云成为业内首家同时支持插件、IDE和CLI三种形态的AI编程工具厂商。CodeBuddy Code支持在命令行中用自然语言驱动开发全流程,实现极致自动化。无缝融入现有流程,开箱即用,扩展性强,可自动化复杂任务。来源:腾讯云

    星火电脑版全新升级!年轻人的AI“硬核装备”

    讯飞星火电脑版全新上线。升级聚焦垂直场景,涵盖AI写作、解题答疑、AI阅读、深度研究等实用功能。新版本界面简洁流畅,操作便捷,成为用户的“有颜有才”AI伙伴。解题答疑功能可逐步引导思考或展示完整解题步骤;AI写作覆盖60+场景;AI阅读能一键总结网页或文档内容;深度研究可自动搭建研究框架,输出专业报告。来源:讯飞开放平台

    生数科技全球上线Vidu Q1参考生图,打造真正可用生产力工具

    生数科技正式向大众用户开放其视频大模型Vidu的Q1参考生图功能。功能以“参考够多,还原够真”为核心,支持最多7张参考图输入,可实现多主体一致性、高还原度、自由创作等五大亮点。Vidu Q1参考生图覆盖合成、替换、变换三大生成模式,适配多主体复杂场景,大幅降低AI内容生产门槛。来源:生数ShengShu

    听得清,识得准,语音识别模型Qwen3-ASR-Flash来了

    通义千问团队发布了Qwen3-ASR-Flash语音识别模型。模型基于Qwen3基座模型,经海量数据训练而成,支持11种语言及多种口音,支持歌声识别。核心特性包括领先的识别准确率、惊艳的歌声识别能力、定制化识别、语种识别与非人声拒识以及高鲁棒性。来源:通义千问Qwen

    Seedream 4.0 全量上线,扣子空间100+官方模版打包送!

    Seedream 4.0全量上线扣子空间,带来多种玩法。用户可实现多图无缝融合,创作手办、周边、装潢装置设计等,还能穿越多种场景、融入指定图片、出演漫画主角、制作系列表情包。在文字能力提升方面,可精准修改海报,生成不同风格作品。来源:扣子Coze

    百度最强深度思考模型文心大模型X1.1来了!性能追平GPT-5

    在百度Wave Summit深度学习开发者大会上,百度发布文心大模型X1.1、飞桨框架V3.2、文心快码3.5S等。文心大模型X1.1事实性能力提升34.8%,指令遵循能力提升12.5%,智能体能力提升9.6%,在多项基准测试中超越DeepSeek-R1-0528,效果与GPT-5和Gemini 2.5 Pro基本持平。来源:智东西

    告别服务中断焦虑!LongCat API 开放平台为开发者保驾护航

    美团LongCat团队推出「LongCat API开放平台」,为受美国大模型公司Anthropic停止服务影响的在华企业和开发者提供平滑迁移方案。平台每日提供10万免费tokens,支持OpenAI API和Anthropic API两种格式,开发者可轻松从Claude切换至LongCat-Flash-Chat模型。来源:LongCat

    专为“超大模型而生”,新一代训练引擎 XTuner V1 开源

    上海人工智能实验室开源了书生大模型新一代训练引擎XTuner V1。XTuner V1基于PyTorch FSDP开发,针对超大规模稀疏混合专家(MoE)模型训练进行了优化,可支持1T参数量级MoE模型训练,在200B以上量级混合专家模型上实现训练吞吐超越传统3D并行训练方案。来源:书生Intern

    9月8·周一

    跨赴科技完成数千万元Pre-A轮融资

    AI Coding初创公司跨赴科技完成数千万元Pre-A轮融资,由复星锐正领投,奇绩创坛跟投。跨赴科技成立于2023年,专注于端到端全流程智能开发,其平台“码上飞”可让用户通过自然语言生成应用程序,已生成超160亿行代码。本轮融资将用于技术研发、人才引进和海外市场拓展,推动普惠数字化和全球市场布局。来源:KuaFuAI

    首款能交付真实法律任务的AI律师智能体——吾律AI律师

    幂律智能推出首款能交付真实法律任务的AI律师智能体吾律AI律师。吾律能模拟专业律师的沟通逻辑与思维模式,实现多轮深度对话,为用户提供定制化法律服务。可直接交付可执行成果,如合同审查、函件发送、律师函盖章、案情分析报告等,让法律事务像点外卖一样简单。来源:AI工具集

    基座上新:MiniCPM 4.1 将「高效深思考」引入端侧

    面壁智能发布MiniCPM 4.1基座模型。模型在MiniCPM 4.0基础上新增8B参数的原生稀疏架构深思考模型,推理速度比同尺寸开源模型快3倍以上,综合能力达同级SOTA水平。MiniCPM 4.1支持高效双频换挡,长文本用稀疏,短文本用稠密,推理效能高,长文本缓存锐减,端侧友好。来源:面壁智能

    自变量机器人宣布完成近10亿元A+轮融资,阿里云首次出手具身创企

    自变量机器人宣布完成近10亿元A+轮融资,由阿里云、国科投资领投,国开金融、红杉中国等跟投。是阿里云首次投资具身智能公司。资金将用于其全自研通用具身智能基础模型的持续训练及硬件产品研发迭代。来源:智东西

    「Ropet萌友智能」完成数千万A1轮融资

    AI机器萌宠公司萌友智能(Ropet)完成数千万人民币A1轮融资,由北京市人工智能产业投资基金领投,峰瑞资本跟投。公司成立于2022年,致力于打造AI情感化陪伴机器萌宠产品。其首代桌面机器萌宠“kamomo”在Kickstarter众筹40万美元,入选年度最佳AI消费硬件之一。来源:36氪

    阿里云通义发布Qwen3-Max-Preview 强得不止一点

    阿里云发布Qwen3-Max-Preview,参数量达1T,性能显著提升。新版本在中英文理解、复杂指令遵循和工具调用等方面大幅增强,知识幻觉大幅减少。在Arena-Hard v2基准测试中领跑,在AIME25测试中获80.6分,展现强大逻辑思维。来源:通义大模型

    字节跳动发布即梦图片 4.0 首次支持多模态生图

    字节跳动即梦AI发布即梦图片4.0。是首次支持多模态生图的版本,同一模型可实现文生图、图像编辑和组图生成。文生图功能有更强指令遵循、更高分辨率和更快生成速度;图像编辑可通过自然语言指令对单/多张图片进行修改;组图生成可一次性生成多张关联图像。来源:AI工具集

    9月5·周五

    Kimi K2-0905正式发布,带来更强的代码能力、更快的 API

    月之暗面科技有限公司正式发布Kimi K2-0905。新版本在真实编程任务中表现提升,具体包括:Agentic Coding能力增强,在基准测试和实际任务中性能更好;前端编程体验升级,代码更美观实用;上下文长度从128K扩展到256K,支持复杂长线任务;新增高速版API,输出速度达60-100 Token/s。来源:月之暗面 Kimi

    智谱推出「Claude API 用户特别搬家计划」

    美国大模型公司Anthropic宣布停止向多数股权由中国资本持有的集团出售Claude服务。智谱推出“Claude API用户特别搬家计划”,帮助开发者无缝切换至智谱GLM模型API。智谱已全面兼容Claude协议,用户只需替换API URL即可完成迁移。智谱为新用户提供2000万Tokens免费体验,开发者可享受更低价格、更高性能的GLM-4.5编码专属套餐。来源:智谱

    Atlassian以 6.1 亿美元全现金收购The Browser Company

    全球首家AI浏览器公司The Browser Company被软件公司Atlassian以6.1亿美元全现金收购。公司曾开发Arc浏览器,后转向打造AI原生浏览器Dia。Dia主打将浏览与对话结合,能跨标签搬运数据、总结文档等。收购后,Dia将继续独立运营,Atlassian计划将其打造成“AI时代知识型工作浏览器”。来源:极客公园

    Anthropic加强服务限制:禁止受中国等地区控制的实体使用其技术

    Anthropic更新了其服务条款,加强对不受支持地区的销售限制。此前,尽管条款禁止某些地区(如中国)使用其服务,但仍有公司通过在其他国家设立子公司等方式获取Anthropic的服务。Anthropic指出,这些公司可能面临法律要求,迫使其共享数据或与情报机构合作,从而带来国家安全风险。来源:Anthropic

    9月4·周四

    杨植麟又发大模型!Kimi K2-0905登场,更强编程、创意写作

    北京大模型独角兽月之暗面发布新版本Kimi K2-0905模型。模型在编程能力上进行了升级,上下文长度提升至256K,创意写作能力也有所增强,同时兼容Claude Code,支持前端功能解锁,让网页和图表更美观。来源:智东西

    MetaGPT发布新型AI开发能力评估基准RealDevWorld

    MetaGPT推出用户智能体,开启端到端自主软件测试新范式。智能体具备双重身份,既是产品经理严格验收,又是不知疲倦的AI测试工程师,实现全链路自主化。研究团队发布RealDevWorld框架,包含194个软件开发任务数据集RealDevBench和评估智能体AppEvalPilot。来源:AI工具集

    瑞士发布国家级开源大语言模型Apertus

    瑞士发布国家级开源大语言模型Apertus。模型由瑞士洛桑联邦理工学院等机构联合打造,完全开源,训练数据涵盖超1000种语言,总token量达15万亿,非英语数据占比40%。目前推出80亿参数和700亿参数两个版本。来源:AI工具集

    9月3·周三

    Anthropic宣布完成130亿美元(约928亿元)F轮融资

    AI独角兽Anthropic完成130亿美元F轮融资,估值达1830亿美元,成为全球第三大AI独角兽,仅次于字节跳动和OpenAI。AI编程工具Claude Code是增长主力,3个月使用量增长超10倍,创造超5亿美元年收入。本轮融资由多家知名风投和主权基金领投,将用于扩大企业采用规模、深化安全研究及支持国际扩张。来源:智东西

    谷歌垄断案获“阶段性胜利”,Alphabet盘后涨近7%

    美国地区法官作出关键裁定,在谷歌母公司Alphabet的反垄断审判中,谷歌无需剥离Chrome浏览器与安卓系统,也可继续向苹果等合作伙伴支付默认搜索引擎费用。消息发布后,Alphabet股价在盘后交易中大涨近6.7%。法院仅要求谷歌向竞争对手共享部分搜索数据,以改善市场竞争环境。来源:第一财经

    9月2·周二

    混元世界模型上新:混元Voyager,综合能力问鼎WorldScore排行榜

    腾讯发布混元3D世界模型系列新成员——HunyuanWorld-Voyager。模型是业界首个支持原生3D重建的超长漫游世界模型,可生成长距离、世界一致的漫游场景,突破传统视频生成局限。支持3D输入输出,与混元世界模型1.0高度适配,可扩展漫游范围、提升生成质量,支持多种3D应用。来源:腾讯混元

    开发更可控,部署更便捷:AgentScope 迈入1.0时代

    通义实验室推出新一代智能体开发框架AgentScope 1.0。解决智能体构建、运行和管理中的难题,提供覆盖“开发、部署、监控”全生命周期的生产级解决方案。采用三层技术架构:AgentScope核心框架负责智能体构建与应用编排;AgentScope Runtime提供安全可靠的运行和部署环境;AgentScope Studio提供可视化开发与监控工具。来源:通义大模型

    拿下30个第1名的腾讯混元翻译模型Hunyuan-MT-7B,开源

    腾讯混元Hunyuan-MT-7B翻译模型开源。模型参数量仅7B,支持33个语种及5种民汉语言/方言互译。在国际机器翻译比赛WMT2025中拿下30个第1名,推出业界首个翻译集成模型Hunyuan-MT-Chimera-7B,可生成更优翻译结果。Hunyuan-MT-7B计算效率高、部署友好,已接入腾讯多个业务,助力产品体验提升。来源:腾讯混元

    9月1·周一

    美团正式发布并开源 LongCat-Flash-Chat,动态计算开启高效 AI 时代

    美团发布并开源 LongCat-Flash-Chat,采用混合专家模型架构的 AI 模型,总参数量达 560B,平均激活参数 27B。在性能上比肩主流模型,尤其在智能体任务中表现突出,推理速度更快,适合复杂智能体应用。可以访问官方平台 Longcat AI,与 LongCat-Flash-Chat 开启对话。来源:Longcat

    GLM-4.5编码套餐:20元包月,人人畅享全球顶级Claude Code编码体验

    智谱推出限时「GLM Coding Plan」套餐,月费低至20元,降低AI编码工具使用门槛。GLM-4.5在前端开发、跨文件修改、全栈项目构建等场景表现出色,性能接近Claude Sonnet 4,成本仅为其1.5%。在CC-Bench评测中,GLM-4.5在开源模型中表现优异,性价比高。来源:智谱

    开源SOTA:阶跃发布端到端语音大模型Step-Audio 2 mini!

    阶跃星辰发布开源端到端语音大模型 Step-Audio 2 mini,模型在多个国际基准测试集上取得 SOTA 成绩。将语音理解、音频推理与生成统一建模,在音频理解、语音识别、跨语种翻译、情感与副语言解析、语音对话等任务中表现突出,率先支持语音原生的 Tool Calling 能力,可实现联网搜索等操作。来源:阶跃星辰

    微软推出自研 AI 模型:MAI-Voice-1 秒级生成音频

    微软推出首批两款自研 AI 模型 MAI-Voice-1MAI-1-preview。MAI-Voice-1 仅需单块 GPU,1 秒内可生成 1 分钟音频,已应用于“Copilot Daily”等,用户可在 Copilot Labs 平台体验并自定义音色与风格。MAI-1-preview 专为特定需求用户设计,训练使用约 1.5 万块英伟达 H100 GPU,具备遵循指令的能力。来源:AI工具集

    智平方完成新一轮A系列融资,由深创投领投

    智平方完成新一轮A系列融资,由深创投领投,金额超亿元。老股东敦鸿资产、国投创盈等持续加码,华熙生物等产业资本参与。本轮融资将用于GOVLA大模型及AlphaBot系列机器人的迭代、产线扩容与市场拓展。来源:智东西

    8月29·周五

    OpenAI发布语音AI Agent专用模型GPT-realtime

    OpenAI发布语音模型GPT-realtime。模型是专用于语音AI Agent的多模态模型,可生成自然流畅语音,完美模仿人类语调、情感和语速,支持图像理解并与语音或文本对话结合。新增Marin与Cedar两种语音,升级原有8种语音,具备智力、推理和理解能力,能捕捉非语言信号、切换语言和调整语气。来源:AI工具集

    真·深度长文写作,上扣子空间!

    扣子空间推出深度长文写作加速器,助力高效创作。用户可一键生成从选题到排版的全链路内容,涵盖研究论文、行业报告等多类型。平台提供高质信息源,支持深度思考与真实数据引用。其生成内容抛弃模板化,搭配专属洞察,风格多样,如专业分析、散文游记等。用户还可二次修改,管理文档版本。来源:扣子Coze

    海螺首尾帧正式上线,「AI海龟汤·帧间宇宙」挑战赛来袭!

    海螺AI全球上线首尾帧功能,接入Hailuo 02模型,支持复杂指令遵循、极限物理动态、大幅度运镜、超预期想象力及仅尾帧玩法。来源:海螺AI

    美团 M17 团队开源 Meeseeks 评测集:揭秘大模型的 “听话”能力

    美团M17团队推出全新评测基准Meeseeks,专注于大模型指令遵循能力的系统化研究与精准评估。该评测基准基于真实业务数据构建,采用精细化的三级评测框架,从任务核心意图、具体约束类型到细粒度规则,全面衡量模型的指令遵循能力。Meeseeks还引入“多轮纠错”模式,首次将模型的自我纠错能力纳入评测范畴。来源:美团技术团队

    xAI 推出智能代码生成模型 Grok Code Fast 1

    埃隆·马斯克旗下xAI发布智能代码生成模型Grok Code Fast 1。模型采用全新架构,擅长TypeScript、Python等语言,可处理从新项目构建到漏洞修复的多种任务。定价为每百万输入token 0.20美元,输出token 1.50美元,缓存输入token 0.02美元,限时免费开放给主流智能编程平台用户。来源:AI工具集

    8月28·周四

    问小白5 重磅发布:国产大模型实力对标 GPT-5

    问小白团队发布最新旗舰模型——问小白5。模型在智能水平上取得重大突破,成为国产大模型中智能水平最接近GPT-5的标杆之作。在AA-Index综合性能评测中,问小白5以64.7分超过Gemini2.5 Pro,接近GPT-5。其在STEM能力、前沿知识能力、代码编程能力以及指令遵循能力等多个维度均展现出卓越表现,分别获得86分、17.7分、79.2分和58.1分的高分。来源:问小白

    混元开源又+1:HunyuanVideo-Foley,视频音效可以自动生成了

    腾讯混元宣布开源端到端视频音效生成模型HunyuanVideo-Foley。只需输入视频和文字,能为视频匹配电影级音效,解决了AI生成视频只能“看”不能“听”的问题。HunyuanVideo-Foley具有三大核心亮点:强大的泛化能力,可适配多种视频类型;多模态语义均衡响应,结合视频画面和文字描述生成复合音效;专业级音频保真度,提升音效质量。来源:腾讯混元

    阿里巴巴发布首个数据分析Agent:Quick BI,人人拥有AI分析师

    阿里巴巴旗下瓴羊发布首个数据分析Agent,Quick BI里的“智能小Q”升级为由问数、解读和报告三大核心Agent组成的“超级数据分析师”。Agent可快速获取、解读数据并输出洞察报告,将数据获取时间从一天缩短至10秒,报告生成时间从数天缩短至20分钟。来源:瓴羊DaaS

    PixVerse V5 全新模型上线:把创作门槛再拍下去几厘米

    PixVerse V5全球同步上线,此次更新聚焦于提升用户高频生成场景的视频效果,如复杂运动中主体不再违背重力、动漫同人创作细节更到位、广告制作文案不再“横飞”等。根据权威独立测评平台Artificial Analysis的最新测试结果,PixVerse V5在图生视频项目中排名全球Top2,在文生视频项目中位列Top3,保持在全球第一梯队。来源:爱诗科技 AIsphere

    全球首款!浙大一院、阿里发布“平扫CT+AI”主动脉急诊模型iAorta

    浙江大学医学院附属第一医院与阿里巴巴达摩院发布全球首款“平扫CT+AI”主动脉急诊模型iAorta。模型可在几秒内识别急性主动脉综合征,将确诊时间缩短至2小时内,显著降低漏诊率。研究团队通过回顾性分析发现,传统方法初诊漏诊率达48.8%,iAorta可将漏诊率降至4.8%。来源:阿里巴巴

    8月27·周三

    Claude for Chrome来了!可作为浏览器扩展程序直接使用

    Anthropic发布Claude for Chrome,一款作为浏览器扩展程序的AI工具。可在Chrome侧边窗口与用户对话,执行任务如设置日历、回复邮件等。目前仅向1000名Max套餐用户开放,月费100至200美元。安全是其重点,用户可限制其访问特定网站,且高风险操作需用户许可。来源:量子位

    字节跳动推出新一代AI视频生成模型Waver 1.0

    字节跳动推出了新一代AI视频生成模型Waver 1.0,基于修正流Transformer架构,支持文本到视频、图像到视频和文本到图像的生成,无需切换模型。支持最高1080p分辨率和2-10秒的灵活视频长度,擅长捕捉复杂运动,生成的视频在运动幅度和时间一致性上表现出色。来源:AI工具集

    多模态新旗舰MiniCPM-V 4.5:高刷视频理解又准又快

    面壁科技开源了8B参数多模态旗舰模型MiniCPM-V 4.5,是首个具备高刷视频理解能力的端侧多模态模型。模型在高刷视频理解、长视频理解、图片理解、OCR、文档解析等多个领域表现优异,甚至在一些榜单上超越了72B参数的Qwen2.5-VL。来源:面壁小钢炮MiniCPM

    谷歌推出图像生成与编辑模型Gemini 2.5 Flash Image(代号nano banana)

    谷歌正式推出最新的图像生成与编辑模型Gemini 2.5 Flash Image(代号nano banana),模型在多个榜单上名列前茅,表现出色。主要特点包括保持角色一致性、基于提示的图片编辑、利用Gemini的现实世界知识进行推理以及多幅图像融合。已通过Gemini APP、API、Google AI Studio和Vertex AI开放访问,每张图片生成成本约0.039美元。来源:APPSO

    Wan2.2-S2V开源!图片+音频丝滑生成电影级视频

    通义万相开源了全新多模态视频生成模型「Wan2.2-S2V」。模型仅需一张静态图片和一段音频,能生成电影级数字人视频,视频时长可达分钟级,大幅提升数字人直播、影视制作等行业的视频创作效率。模型支持真人、卡通、动物等多种图片类型,可通过文本控制视频画面。来源:通义万相Wan

    文心快码多项升级更新,新增Zulu-CLI终端编码能力

    文心快码进行了多项升级更新,新增了Zulu-CLI,允许开发者在终端中使用Zulu的智能编码能力,无需离开命令行界面。企业版支持自定义模型,可根据不同场景灵活切换模型。来源:文心快码Baidu Comate

    微软开源TTS模型:VibeVoice,可生成 90 分钟语音

    微软开源了文本转语音(TTS)模型VibeVoice-1.5B,可生成最长90分钟、最多4位说话者的自然语音,支持跨语言及歌声合成。模型基于1.5B参数的Qwen2.5语言模型,结合声学与语义双分词器,以7.5Hz低帧率处理。来源:AI工具集

    8月26·周二

    “杭州六小龙”又开源了!SpatialGen一句话爆改空间设计

    “杭州六小龙”之一的群核科技宣布开源3D场景生成模型SpatialGen,并即将开源空间语言模型SpatialLM 1.5。模型能通过文字描述或户型图生成可交互的3D室内空间设计,支持动态漫游和细节编辑,甚至可用于具身智能机器人的虚拟训练。来源:智东西

    英伟达全新的机器人计算平台Jetson Thor正式发售

    英伟达推出全新机器人计算平台Jetson Thor,基于Blackwell GPU架构,AI算力达2070 TFLOPS,比上一代提升7.5倍,能效提高3.5倍,配备128GB超大内存。该平台支持多种生成式AI框架,助力开发者构建与物理世界交互的机器人系统。来源:量子位

    哈工大深圳具身智能黑马,拿下亿元级融资,东方精工领投

    若愚科技宣布完成新一轮亿元级天使 + 轮融资,由东方精工领投,深圳汉清达投资发展有限公司跟投。本轮融资将用于具身智能机器人大脑在垂直场景的产业化落地。若愚科技孵化自哈尔滨工业大学(深圳),专注于具身智能机器人大脑研发,通过多模态大模型整合感知、规划与执行模块,构建高效智能交互体系。来源:若愚科技

    钉钉CEO无招:为AI时代打造一个全新的钉钉

    钉钉在十周年发布会上推出8.0版本,代号“蕨”,标志着其正式走向AI原生。AI方面,钉钉推出五大产品,包括钉钉ONE、DingTalk A1、AI听记、AI搜问和AI表格,全面升级语音智能、搜索和表格功能,同时在客服、营销、教育等场景中深度应用AI,提升效率与体验。来源:钉钉

    8月25·周一

    会头脑风暴的 AI — 国内首个并行思考模型 问小白o4 来啦!

    国内首个并行思考模型问小白o4上线。模型可同时开启8条思考路径,自动筛选最优解,大幅提升答案精准度。问小白o4采用第四代开源推理范式,融合强化学习与过程奖励学习机制,具备深度推理与高质量思考筛选能力。来源:问小白

    Looki L1 国行版上市计划

    Looki L1 国行版计划于2025年第四季度上市。自全球上线以来,产品受到广泛关注,尤其在国内,众多用户表达了对它的喜爱与期待。目前,Looki L1 正在进行本地化部署与适配工作,以确保国内用户获得成熟、流畅且贴合本地使用习惯的体验。来源:LookiAI

    打造“AI版Labubu”,深圳AI硬件创企跃然创新获2亿融资

    国内AI玩具龙头企业跃然创新(Haivivi)宣布完成2亿元A轮融资,由中金资本旗下基金、红杉中国等领投。跃然创新成立于2021年,由前锤子手机营销总监李勇创办,打造AI玩具。2024年6月,推出全球首款AI玩具BubblePal,融合多语言对话、AI故事共创等功能,首月售出超万台,总销量突破20万台。来源:智东西

    首款类人决策智能体Bloom,获高瓴光速数千万美元投资

    前阿里云高管占超群创立的质变科技发布首款类人决策智能体Bloom。获得高瓴创投与光速光合数千万美元投资。Bloom解决复杂数据分析和决策场景中的准确性、可解释性和可用性问题,采用智能体团队协作、可解释性技术栈和端到端结果级交付等创新方式,推动AI成为更可靠的生产力工具。来源:Z Finance

    马斯克开源Grok 2.5:中国公司才是xAI最大对手

    马斯克宣布xAI开源Grok 2.5,Grok 3也将在半年后开源。Grok 2.5可在HuggingFace下载,包含42个文件,大小约500GB,需8个超40GB显存的GPU运行。模型曾在LMSYS排行榜上超越Claude和GPT-4,在多领域表现优异。开源协议较严格,仅限非商业用途。来源:量子位

    Meta 与 Midjourney 达成美学技术授权合作

    Meta与AI文生图片/视频研究团队Midjourney达成授权合作。Meta未来AI模型和产品将使用Midjourney的美学技术。Meta首席AI官Alexandr Wang在Threads上宣布了这一合作,称赞Midjourney在AI技术和美学表现上的成就。此次合作是Meta联合其他AI参与者实现优势互补的策略之一,也是其扩大AI技术资源储备的行动的一部分。来源:IT之家

    8月22·周五

    阿里巴巴推出 AI Agentic 编程工具:Qoder,预览阶段全功能免费开放

    阿里巴巴推出AI编程工具 Qoder ,具备代码库语义搜索、架构洞察、持续记忆、动态模型路由等功能,支持自然语言任务委派与一键“维基化”代码库。预览阶段全功能免费开放。传统编程工具只是帮你“写代码”,Qoder 则像一个“读过你全部代码、记得你全部习惯、能跨系统替你干活”的资深同事。来源:AI工具集

    钉钉联手通义推出Fun-ASR语音识别大模型,可听懂十大行业黑话

    钉钉与通义实验室语音团队联合推出新一代语音识别大模型 Fun-ASR。模型经过上亿小时音频数据训练,可精准识别家装、畜牧等十大行业的专业术语,实测在保险、家装等行业准确率提升 15%-20%。Fun-ASR 能结合企业信息优化转写结果,支持企业专属定制训练,已集成至钉钉会议字幕、智能纪要等功能模块。来源:钉钉黑板报

    阿里云和五所高校一起,共同打造了一门免费AI课程!

    阿里云联合超星尔雅及北京大学、南京大学、复旦大学、上海交通大学、浙江大学五所高校名师,共同推出 AI 通识公益系列课程「动手学 AI:人工智能通识与实践」,将于 9 月 1 日正式开放。课程依托阿里云技术,采用“学 – 练 – 评 – 管”模式,分为理论课和在线实践课,涵盖 AI 发展历程、核心技术等内容,设置 8 个实验环节。来源:阿里云

    CodeBuddy IDE 国内版正式开放公测!无需邀请码

    CodeBuddy IDE 国内版正式开放公测,支持最新 DeepSeek V3.1 模型,无需邀请码即可免费使用。IDE 提供一站式开发体验,涵盖产品设计、研发编码和部署验证等功能。DeepSeek V3.1 在编程能力、Agent 能力、思考效率和长文本处理能力上均有显著提升,尤其在 Aider 编程基准测试中超越多个开源模型。来源:腾讯云代码助手

    8月21·周四

    字节跳动Seed开源Seed-OSS-36B模型,512k上下文

    字节跳动Seed团队开源了Seed-OSS系列模型,包含360亿参数的Base和Instruct版本,支持最长512k上下文窗口,是目前开源模型中最长的。模型使用12万亿tokens训练,在多个基准测试中表现优异,如AIME24上达91.7%。其推理预算功能允许用户灵活调整推理长度,提升效率。来源:机器之心

    轻量级易开发,8B参数释放大实力!科学多模态模型Intern-S1-mini开源

    上海人工智能实验室推出轻量化科学多模态模型Intern-S1-mini。模型参数为8B,兼具通用与专业科学能力,适合快速部署和二次开发。Intern-S1-mini在多项权威基准测试中表现卓越,尤其在化学、材料等领域显著领先,强大的跨领域泛化能力。轻量化设计降低了对高端计算设备的依赖,仅需24GB单卡即可完成微调。来源:书生Intern

    vivo首款MR头显vivo Vision,硬刚苹果,全球最轻,眼手交互,预约名额秒空

    vivo正式发布首款MR头显——vivo Vision探索版,正式进军XR赛道。该头显重量仅398克,比苹果AirPods Max耳机还轻,搭载双目8K Micro-OLED屏幕,支持眼动追踪和手势交互,VST全彩透视延迟低至13ms。vivo Vision探索版支持PC VR无线连接、多窗口办公等功能。来源:智东西

    前美团硬件负责人创业,做了一款项链式的“AI相机”:Looki L1

    前美团硬件负责人孙洋创立的「光智时空Looki」发布首款多模态AI穿戴设备——Looki L1。这是一款仅重30克的AI生活相机,可磁吸或佩戴于脖子上,具备视觉和听觉感知能力,结合云端大模型为用户提供主动式服务。来源:智能涌现

    金数据发布 Jiri AI表单助手,把想法变成专业表单

    金数据推出名为Jiri的AI表单助手。Jiri能根据用户描述秒懂需求,自动生成表单字段组合,自动撰写专业文案,智能匹配高清头图,能根据用户反馈随时修改调整。用户可以通过一句话描述、粘贴内容、上传图片或链接等多种方式生成表单。来源:金数据

    百度推出蒸汽机MuseSteamer 2.0版本

    百度将推出蒸汽机MuseSteamer 2.0版本,包括Turbo、Lite、Pro和有声版全系模型,具备多人音视频一体化生成、复杂运镜、电影级人物表演等能力,将在影视创作、客户营销等多场景应用。官方应用平台为绘想,自7月2日上线以来,注册用户超30万。来源:AI工具集

    腾讯开源ToonComposer:能生成一部完整的动画短片

    腾讯 ARC 实验室联合北京大学、香港中文大学开源了 ToonComposer。仅需 1 张关键帧草图和 1 张彩色参考图,能生成完整的上色动画,能通过文本、草图、图片混合输入,一键转换为多种卡通风格动画。来源:AI工具集

    8月20·周三

    ChatExcel获近千万天使轮融资,打造数据全链路商业闭环平台

    ChatExcel团队宣布完成近千万天使轮融资,投资方为上海常垒资本和武汉东湖天使基金。ChatExcel由北京大学团队创立,是国内领先的生成式AI表格处理与数据智能体,累计服务用户超千万次。此次融资将用于加速产品研发迭代和全球化市场推广。来源:元空AIExcel

    DeepSeek 开源新模型 V3.1,上下文长度拓展至 128K

    DeepSeek宣布开源新基础模型DeepSeek-V3.1-Base。模型在Hugging Face发布后迅速冲上热门模型榜第4位。DeepSeek-V3.1-Base采用混合专家(MoE)架构,上下文长度拓展至128k,与V3版本参数量相同。来源:AI工具集

    智谱AutoGLM上线:给每个手机都装上通用Agent

    智谱AutoGLM 2.0正式上线,作为全球首个手机Agent,开创了Agent+云手机/云电脑的新技术范式,不占用用户本地设备资源,可在任何设备和场景下运行。AutoGLM 2.0由国产模型GLM-4.5和GLM-4.5V驱动,具备推理、代码与多模态能力,可完成多样化任务,如在生活场景中操作美团、京东等应用,或在办公场景中完成全流程工作。来源:智谱

    Firecrawl融资1450万美元:AI爬虫独角兽盈利突围,百万美元悬赏“AI员工”

    AI爬虫公司Firecrawl完成1450万美元A轮融资,由Nexus Venture Partners领投,Shopify首席执行官Tobias Lütke和Y Combinator跟投。Firecrawl为开发者和AI智能体提供开源网络爬虫工具,通过API提供商业支持版本。来源:AI工具集

    8月19·周二

    哪里不对改哪里!全能图像编辑模型Qwen-Image-Edit来啦

    Qwen团队推出全能图像编辑模型Qwen-Image-Edit。模型基于20B参数的Qwen-Image模型进一步训练,具备语义与外观双重编辑能力,支持中英文双语文字精准编辑,可实现原创IP创作、视角转换、风格迁移、元素增删改等功能。来源:通义千问Qwen

    淘天集团发布首个 3D 动作游戏专用 VLA 模型

    淘天集团未来生活实验室团队发布了首个3D动作游戏专用的视觉-语言-动作(VLA)模型CombatVLA,模型在动作角色扮演游戏的战斗任务中,成功率超越了人类玩家和GPT-4o。CombatVLA基于3B参数规模,通过动作追踪器收集的视频-动作对进行训练,采用渐进式学习范式,逐步从视频级到帧级优化动作生成。来源:IT之家

    AI 助手理想同学MindGPT 3.1来了,模型即Agent,就是现在!

    理想汽车旗下AI助手理想同学MindGPT 3.1升级为端到端智能体模型,引入模型即Agent功能,将智能体能力融入大模型,支持边想边搜,提升推理能力。新版本通过自主思考、调用工具、进一步推理的循环机制优化复杂任务处理,显著提高任务完成率。来源:AI理想同学

    快手Klear-Reasoner登顶8B模型榜首,GPPO算法双效强化稳定性与探索能力!

    快手 Klear 团队推出 Klear-Reasoner 语言大模型,在 8B 模型中登顶,数学与代码推理能力突出。模型基于 Qwen3-8B-Base 打造,采用 GPPO(Gradient-Preserving Clipping Policy Optimization)算法,有效平衡训练稳定性和探索能力。来源:快手技术

    淘宝灰度测试“AI 万能搜”新功能

    淘宝正在灰度测试“AI 万能搜”新功能,功能位于淘宝 App 搜索页面,支持用户通过自然语言提问,AI 将生成包含文字、商品、图片和视频的“答案报告”,帮助解决购物攻略、口碑评测、优惠咨询等问题。来源:IT之家

    8月18·周一

    逗逗AI 1.0发布:为了实现HER中的AI陪伴体验,我们做了三件事

    逗逗AI 1.0版本正式上线。打造“陪你游戏的AI伙伴”,通过无扰陪伴、实时感知和长效记忆三大创新功能,为用户提供深度陪伴体验。逗逗AI采用桌宠和悬浮球双模式,支持实时语音交互,具备视觉和听觉感知能力,能将多模态信息融合为场景记忆。来源:逗逗游戏伙伴

    腾讯AI Lab团队推出的多模态音频生成工具AudioGenie

    腾讯团队提出了一种全新的多智能体框架AudioGenie,用于从多模态输入(如视频、文本、图像)生成多样化且上下文对齐的音频类型(如音效、语音、音乐和歌曲)。采用双层架构,包含生成团队和监督团队。来源:AI工具集

    智元机器人全系产品正式开售!领衔人机共生新时代

    智元机器人宣布其全系产品正式开售,涵盖六大机器人产品线。精灵G1通用具身智能机器人售价45万元,具备高质量数据集和软硬件开发支持,适用于科研教育、数据采集和垂域场景训练。智元远征A2青春版售价16.8万元,具备文娱表演、展厅讲解等功能。来源:智元机器人

    上交投资的首家语音大模型宇生月伴完成数千万元融资

    情感语音交互模型初创公司宇生月伴完成新一轮融资,由靖亚资本和小苗朗程领投,上海交大母基金跟投。本轮融资将用于语音模型优化、产品矩阵拓展及国际化商业落地。来源:Z Finance

    Anthropic为Claude赋予“结束聊天”能力

    Anthropic宣布为Claude Opus 4及4.1版本推出新功能,模型可在极少数情况下主动结束对话。功能针对持续性有害或辱骂性互动,如用户索取可能导致大规模暴力或恐怖行动的信息。Anthropic强调,此举旨在保护AI模型本身,同时与模型对齐和安全措施相关。来源:IT之家

    8月15·周五

    Mureka V7.5模型上线,AI音乐创作水平再迎新高度

    昆仑万维正式上线Mureka V7.5模型。模型在中文歌曲创作上取得重大突破,提升了音色与演奏技法,优化了咬字和情感表现。通过ASR技术精准捕捉演唱细节,使AI演绎的歌曲更贴近真人演唱,显著增强了自然度和情感深度。来源:昆仑万维集团

    消费级显卡就能跑的世界模型来了,腾讯混元3D世界模型推出Lite版本

    腾讯混元3D世界模型1.0推出Lite版本,大幅降低显存开销,支持消费级显卡运行。模型是业界首个开源可编辑的世界生成模型,用户可通过文本或图片输入生成可漫游的3D世界。Lite版本采用动态FP8量化、SageAttention量化及Cache算法优化,显存需求从26GB降至17GB以下,推理速度提升3倍以上。来源:腾讯混元

    会记住你说的每句话:谷歌 AI Gemini App 上线记忆功能

    谷歌Gemini AI助手App新增“记忆”与“临时聊天”功能。开启“记忆”功能后,Gemini可记住用户对话内容及偏好,实现更自然的交流,目前该功能已向部分国家或地区的Gemini 2.5 Pro用户开放,将在未来几周内推广至欧盟、英国、瑞士等地区的Gemini 2.5 Flash用户。来源:IT之家

    Meta视觉基座DINOv3王者归来:自监督首次全面超越弱监督,商用开源

    Meta推出并开源了DINOv3,基于自监督学习的SOTA级视觉基础模型。DINOv3在多个视觉任务中首次超越弱监督学习模型,训练数据量达17亿张图像,模型参数规模达70亿,创新的自监督学习技术摆脱了对标注数据的依赖,降低了训练成本。来源:机器之心

    智元推出首个机器人世界模型开源平台 Genie Envisioner

    智元机器人推出行业首个机器人世界模型开源平台Genie Envisioner(GE)。GE基于约3000小时真实机器人操控视频数据,整合未来帧预测、策略学习与仿真评估,形成闭环架构,使机器人实现从“看”到“想”再到“动”的端到端推理与执行。来源:IT之家

    解锁任意模态模型训练,字节跳动Seed开源VeOmni框架

    字节跳动Seed团队开源了全模态PyTorch原生训练框架VeOmni,推动全模态大模型的研究与应用。VeOmni采用以模型为中心的分布式训练方案,将复杂的分布式并行逻辑与模型计算解耦,大幅降低工程开销,提升训练效率和扩展性。来源:字节跳动Seed

    8月14·周四

    混元最新开源:Hunyuan-GameCraft,一张图,秒变游戏大片

    腾讯混元开源新工具 Hunyuan-GameCraft,可将一张图片结合文字描述和动作指令生成高清动态游戏视频。工具基于 HunyuanVideo 底模,支持第一人称跑酷、第三人称探险等多种场景,具备自由流畅的动作控制、记忆增强的历史一致性以及低成本生产优势。来源:腾讯混元

    昆仑万维正式发布Skywork Deep Research Agent v2

    昆仑万维发布 Skywork Deep Research Agent v2,是天工超级智能体的核心引擎。新版本首次整合多模态检索、理解和生成能力,推出“多模态深度调研”Agent,可将图文信息完整整合到深度研究中,提升交付物质量。来源:昆仑万维集团

    8月13·周三

    「Skywork UniPic 2.0」开源,统一多模态模型再迎新突破

    昆仑万维正式开源「Skywork UniPic 2.0」模型,是面向统一多模态建模的高效训练和推理框架。模型由生图编辑、统一模型能力和生图编辑后训练三个核心模块组成,具备生成模块轻量高效、引入强化学习提升性能和一体化灵活切换等核心优势。来源:昆仑万维集团

    Anthropic宣布Claude Sonnet 4支持高达100万Token的上下文窗口

    Anthropic宣布Claude Sonnet 4 API支持高达100万Token的上下文窗口,容量是之前的5倍。开发者可在单次请求中处理大型代码库或数十篇研究论文。来源:AI工具集

    OpenAI ChatGPT 更新:GPT-5 引入三种模式,4o 模型回归

    OpenAI CEO 萨姆・奥尔特曼宣布 ChatGPT 重大更新。GPT-5 新增“自动”“快速”“思考”三种模式,用户可按需选择。“思考”模式每周限 3000 条消息,超限可用 mini 版,上下文限制为 196,000 个 token。4o 模型回归,付费用户可在网页设置中切换多款模型。来源:IT之家

    Perplexity想花345亿美元收购谷歌Chrome

    美国AI搜索初创公司Perplexity计划以345亿美元全现金收购谷歌Chrome浏览器。收购动机在于AI搜索领域增长焦虑,传统浏览器仍是重要流量入口。Perplexity承诺若收购成功,将投资30亿美元维持Chrome开源并保留默认搜索引擎。来源:智能涌现

    8月12·周二

    Seele AI:全球首个端到端AI 3D游戏生成工具上线

    Seele AI是全灵公司推出的全球首个端到端AI 3D游戏生成工具。用户可通过自然语言描述生成3D游戏,如FPS、飞行模拟等,实现零代码开发。工具支持多模态交互,涵盖文本、3D建模和物理引擎。Seele AI已开放全球公测。来源:AI工具集

    全球多模态推理新标杆,GLM-4.5V正式上线并开源

    智谱发布并开源了全球100B级效果最佳的开源视觉推理模型GLM-4.5V,总参数106B,激活参数12B。模型基于智谱新一代文本基座模型GLM-4.5-Air,综合效果在41个公开视觉多模态榜单中达到SOTA水平,支持图像、视频、文档理解及GUI Agent等任务。来源:智谱

    Vercel 推出全栈应用构建AI工具——v0.app

    Vercel 推出全栈应用构建工具 v0.app,可根据用户输入的文本提示,快速生成基于 React、Shadcn UI 和 Tailwind CSS 的网页用户界面代码,提供三种界面选择。用户能直接复制代码,可以对生成的 UI 进行微调和优化。目前处于免费内测阶段,可以访问官网加入等候名单。来源:AI工具集

    昆仑万维发布「Matrix-Game 2.0」,国产开源的Genie 3来啦!

    昆仑万维发布自研世界模型Matrix系列的升级版本「Matrix-Game 2.0」。实现通用场景下的交互式实时长序列生成,支持25 FPS速度生成连续视频内容,时长可达分钟级,具备高帧率、低延迟、强物理一致性和多场景泛化能力。与依赖文本语义的模型不同,「Matrix-Game 2.0」通过视觉驱动和物理规律学习构建虚拟世界,避免语义偏置。来源:昆仑万维集团

    达摩院开源具身智能“三大件” 机器人上下文协议首次开源

    阿里达摩院宣布开源具身智能“三大件”:视觉 – 语言 – 动作模型RynnVLA-001-7B、世界理解模型RynnEC和机器人上下文协议RynnRCP。RynnVLA-001-7B可从第一人称视频中学习人类操作技能并迁移到机器人手臂操控;RynnEC能从多维度解析场景物体并精准定位;RynnRCP打通了从传感器数据采集到机器人动作执行的完整工作流,支持多款热门模型和机械臂。来源:达摩院DAMO

    昆仑万维开源Matrix-3D大模型,树立3D世界生成新标杆

    昆仑万维开源了Matrix-3D大模型,用于3D世界的生成与探索。Matrix-3D是融合全景视频生成与三维重建的统一框架,能从单张图像生成高质量、轨迹一致的全景视频,还原可漫游的三维空间。模型具有场景全局一致、生成范围大、高度可控、泛化能力强和生成速度快等优势,支持文本和图像输入,生成的3D场景可自由探索。来源:昆仑万维集团

    8月11·周一

    昆仑万维正式发布SkyReels-A3模型,让数字人“说话”的魔法

    昆仑万维发布SkyReels-A3模型,是基于“DiT视频扩散模型+插帧模型+强化学习动作优化+运镜可控”的音频驱动人像视频生成模型。用户只需上传人像图片和音频,可生成自然同步的视频,支持照片“活”起来、创作新视频、改台词等功能。来源:昆仑万维集团

    百川开源大模型Baichuan-M2,医疗能力登顶世界第一

    百川智能发布开源医疗增强大模型Baichuan-M2。该模型在HealthBench评测中以60.1分超越OpenAI的gpt-oss120b等众多开源模型,成为全球医疗能力最强的开源大模型。Baichuan-M2通过AI患者模拟器和端到端强化学习,实现了医疗场景的高度还原和模型性能的大幅提升。来源:百川大模型

    Grok 4 现已免费开放,非订阅用户每天可限量使用

    马斯克宣布AI模型Grok 4向所有用户免费开放,非订阅用户每天可限量使用。Grok 4号称“全球最强”AI模型,具备深度推理能力,经过xAI的Colossus超级计算机训练,逻辑推理和文本生成能力出色。来源:AI工具集

    8月8·周五

    GPT-5 正式发布!奥特曼:这是全球最好的模型

    OpenAI正式发布GPT-5,CEO Sam Altman称其为全球最佳模型。GPT-5引入“智能路由”系统,能自动判断问题难度,快速或深度思考作答。全面取代并超越GPT-4等前代模型,免费用户即可使用。GPT-5 Pro(付费)则具备“扩展推理”能力,适合高难度问题。来源:AI工具集

    8月7·周四

    讯飞星火代码画布上线!「动嘴开发」的时代到了

    科大讯飞推出星火代码画布,标志着“动嘴开发”时代的到来。工具通过语音指令、草图、链接或文字描述,快速生成交互网页。来源:讯飞开放平台

    MiniMax Speech 2.5上线:多语种表现力更强,音色复刻更“像”

    MiniMax发布新一代语音生成模型Speech 2.5,再次刷新全球最强语音模型记录。Speech 2.5在多语种表现力、音色复刻和语种覆盖范围上实现三大突破。支持40种语言,中文表现全球最强,英文相似度显著提升,音色复刻精度行业领先,可跨语种保留口音和风格。来源:MiniMax 稀宇科技

    灵心巧手完成数亿元天使轮融资,蚂蚁集团领投

    全球高自由度灵巧手领军企业灵心巧手完成数亿元天使轮融资,由蚂蚁集团领投,多家知名机构跟投,老股东红杉中国种子基金加注。本轮融资将用于技术储备提升和具身智能数据采集场建设,加速灵巧手落地应用。来源:灵心巧手LINKERBOT

    通义千问推出Qwen-Flash,全员拥抱1 M上下文!

    Qwen API 迎来重大更新,推出 Qwen-Flash、Qwen3-Coder-Flash 两款新模型,升级了 Qwen-Plus。三款模型均支持 1M 超长上下文,理解力大幅提升。Qwen-Flash 以极速响应著称,适合轻快任务。来源:通义千问Qwen

    谷歌正式推出异步 AI 编程智能体工具 Jules

    谷歌正式推出异步AI编程智能体工具Jules,由Gemini 2.5 Pro驱动。Jules支持集成GitHub,可克隆代码库至Google Cloud虚拟机,在GitHub仓库中异步处理任务,助力开发者提升效率。Jules定价分免费版(每日15任务,3并发)和付费版(Google AI Pro每月19.99美元,Ultra套餐124.99美元)。来源:AI工具集

    Qwen3-4B超顶小模型更新登场!手机也能轻松跑!

    Qwen3-4B-Instruct-2507 和 Qwen3-4B-Thinking-2507 两款小尺寸语言模型更新发布。Qwen3-4B-Instruct-2507 通用能力大幅提升,超越闭源的 GPT4.1-Nano,支持多语言长尾知识,上下文理解能力扩展至 256K。Qwen3-4B-Thinking-2507 推理能力显著增强,AIME25 测评获 81.3 分。来源:通义千问Qwen

    谷歌 Gemini AI 推出“引导式学习”功能

    谷歌 Gemini AI 推出“引导式学习”功能,通过提问和逐步指导帮助用户理解问题,答案形式包括图片、视频和互动小测验等。促进学习而非简单提供答案,谷歌与教育专家合作确保其科学性。来源:AI工具集

    8月6·周三

    OpenAI首次推出开源语言模型——gpt-oss

    OpenAI开源大模型gpt-oss,包含1200亿和200亿参数两种版本,支持Apache 2.0商业化。模型针对AI Agent进行特殊训练,支持函数调用、网络搜索等功能,可助力快速开发智能体。来源:AI工具集

    小红书 hi lab 开源多模态大模型 dots.vlm1,效果接近闭源 SoTA 模型

    小红书hi lab开源了多模态大模型dots.vlm1。模型基于12亿参数的NaViT视觉编码器和DeepSeek V3 LLM构建,具备强大的视觉感知和文本推理能力。视觉编码器从零训练,支持动态分辨率,引入纯视觉监督提升感知能力。来源:小红书技术REDTech

    谷歌DeepMind推出通用世界模型Genie 3,首个可实时交互世界模型

    谷歌DeepMind推出通用世界模型Genie 3,是首个可实时交互的世界模型。基于文本提示,Genie 3能以每秒24帧、720p分辨率生成长达数分钟的交互式3D环境,相比Genie 2的10到20秒有了显著提升。Genie 3在模拟世界物理特性、自然世界、动画和小说建模等方面表现出色,能突破时空限制生成内容。来源:智东西

    Anthropic发布Claude Opus 4.1模型,全面超越OpenAI o3

    Anthropic发布Claude Opus 4.1模型,Pro/Max/Team用户可在网页端使用,API也已开放。Claude Opus 4.1性能更强,价格不变。在Agent能力、高级编程、搜索和写作等方面全面提升,能准确处理长时程任务和复杂企业工作流程,完成上千步骤的长程编程任务。来源:AI工具集

    谷歌Gemini上线 AI 生成故事书功能——Storybook

    谷歌Gemini AI聊天机器人上线“Storybook”功能,可生成10页图文并茂的故事书。用户只需简单描述,能生成带插图的故事,Gemini能朗读内容。用户可定制故事风格,如黏土动画、动漫等,可上传图片,如孩子的画作,让Gemini以此编故事。来源:AI工具集

    美国AI Agent营销平台Clay完成1亿美元C轮融资

    美国AI营销平台Clay完成1亿美元C轮融资,投后估值达31亿美元。本轮融资由Alphabet旗下CapitalG领投,Meritech Capital Partners、红杉资本等参投。Clay成立于2017年,总部位于纽约,最初聚焦“让编程民主化”,后转型为AI营销工具,帮助销售和市场团队寻找潜在客户并推动转化。来源:智东西

    ElevenLabs推出AI音乐生成工具:Eleven Music

    ElevenLabs推出AI音乐生成工具Eleven Music,可根据文本提示快速生成高质量、定制化的音乐作品。用户通过自然语言描述调整歌曲风格、节奏、歌词等,支持逐段编辑,实现无缝过渡和精确情绪转换。来源:AI工具集

    8月5·周二

    告别文字乱码!全新文生图模型Qwen-Image来咯

    通义千问团队开源了20B参数的文生图模型Qwen-Image。作为通义千问系列首个图像生成基础模型,Qwen-Image在复杂文本渲染和精确图像编辑方面表现出色,支持多行布局、段落级文本生成及细粒度细节呈现,英语或是中文,能实现高保真输出。来源:通义千问Qwen

    腾讯混元「AI播客」来了,ima、腾讯新闻都在用

    腾讯混元正式发布AI播客功能,功能可将文本、网页、文档一键转化为自然流畅的双人对谈式音频,将晦涩难懂的内容转化为有逻辑、有节奏的对话。用户可通过主题描述、网页URL和文档上传三种模式输入内容,平均90秒即可完成转换。来源:腾讯混元

    京东战略领投!帕西尼4个月狂揽10亿元

    帕西尼完成新一轮A系列融资,由京东战略领投,浦耀信晔等多家机构跟投,老股东持续加码,4个月内融资达10亿元人民币。帕西尼凭借高精度多维触觉感知技术及亿级全模态数据集,构建具身智能核心生态闭环,推进具身智能模型落地。来源:帕西尼感知科技

    松延动力半年订单破亿,两年六轮融资狂飙突进

    成立不足两年的松延动力近日完成数亿元A++轮融资,由金浦投资领投,北汽产投等跟投。是其今年上半年的第三轮融资,累计已达六轮。松延动力上半年斩获超2000台人形机器人订单,合同额破亿,成为国内第二家迈入“千台销量”门槛的公司。来源:NOETIX松延动力

    8月4·周一

    继续开源:腾讯混元 0.5B、1.8B、4B、7B模型发布

    腾讯宣布开源四款小尺寸混元模型,参数分别为0.5B、1.8B、4B、7B,可在消费级显卡上运行,适用于低功耗场景,支持垂直领域低成本微调。这些模型在语言理解、数学、推理等领域表现优异,具备agent能力和超长上下文窗口(256k),可处理超长内容。来源:腾讯混元

    小米开源声音理解大模型 MiDashengLM-7B

    小米开源了声音理解大模型MiDashengLM-7B。模型基于Xiaomi Dasheng音频编码器和Qwen2.5-Omni-7B解码器,采用创新训练策略,实现语音、环境声和音乐的统一理解,性能在22个公开评测集上刷新最佳成绩。来源:小米技术

    全球首个!纳米AI多智能体蜂群上线

    360集团宣布纳米AI完成品牌焕新,升级为“多智能体蜂群”,成为全球首个迈入L4级别的智能体系统。实现了从“单兵作战”到“群体协同”的进化,突破以往智能体在跨领域复杂问题上的瓶颈。纳米AI独创的“蜂群协作框架”可让多个推理型智能体灵活拉群、多层嵌套、组队协作,完成超长复杂任务,如制作10分钟电影级大片仅需20分钟。来源:360公司

    小红书推出首个社交大模型RedOne

    小红书推出首个社交大模型RedOne。模型采用“继续预训练→监督微调→偏好优化”的三阶段训练策略,针对社交网络服务(SNS)领域的复杂数据特征和多元场景进行优化。来源:AI工具集

    谷歌推出 Gemini 2.5 Deep Think 模型

    谷歌推出 Gemini 2.5 Deep Think,面向 Google AI Ultra 订阅者开放。模型基于在国际数学奥林匹克竞赛中获得金牌标准的版本改进,具备更快的推理速度和日常可用性,达到 2025 年 IMO 铜牌水平。Deep Think 通过并行思考技术,延长推理时间,生成多种想法并逐步优化,适用于复杂问题解决、科学发现、算法开发等场景。来源:AI工具集

    昆仑万维发布并开源全新推理大模型 MindLink

    昆仑万维推出并开源全新推理大模型Skywork MindLink,基于Qwen3-32B和Qwen2.5-72B后训练而成。模型采用新的推理范式Plan-based Reasoning,去掉了“think”标签,能根据任务难度自适应整合推理和非推理生成回复,降低推理成本且提升多轮对话能力。来源:AI工具集

    8月1·周五

    Manus 推出 Wide Research,支持上百个 Agents 同时工作

    Manus AI 上线以来最大更新,推出 Wide Research 功能。功能支持用户一键开启大规模并行 Agent 协作,可同时启动多达100个 Agent 处理复杂任务。来源:APPSO

    Black Forest Labs开源新版Flux模型:FLUX.1 Krea dev

    Flux开源模型新版本FLUX.1 Krea dev 正式发布。模型由Black Forest Labs与krea_ai联合开发,专为照片级写实而生,具备业界领先的开源文本生成图像能力,图像质量卓越且真实感强,能有效避免常见的“AI感”和过度饱和纹理问题。来源:AI工具集

    Kimi K2 高速版发布:kimi-k2-turbo-preview

    kimi-k2-turbo-preview 是 kimi-k2 的高速版,模型参数与 kimi-k2 一致,但输出速度由每秒 10 Tokens 提升至每秒 40 Tokens。目前限时 5 折特惠,9月1日恢复原价,折扣后的价格:模型每百万 tokens 输入价格(缓存命中)¥2.00,输入价格(缓存未命中)¥8.00,输出价格 ¥32.00。来源:Kimi 开放平台

    阿里通义千问发布 Qwen3-Coder-Flash 编程模型

    编程模型 Qwen3-Coder-Flash 正式发布。模型全称 Qwen3-Coder-30B-A3B-Instruct,性能出色,具备超强的 Agentic 能力,超越当前顶级开源模型,仅次于顶配版 Qwen3-Coder 和部分领先闭源模型。原生支持 256K tokens,可通过 YaRN 扩展至 1M tokens,能理解整个项目库代码,避免上下文断层。来源:通义千问Qwen

    字节跳动发布实验性扩散语言模型 Seed Diffusion

    字节跳动Seed团队发布实验性扩散语言模型Seed Diffusion Preview。验证离散扩散技术作为下一代语言模型基础框架的可行性,通过两阶段扩散训练、约束顺序学习与强化高效并行解码等关键技术,实现了每秒2146 tokens的推理速度,相比同等规模的自回归模型提升5.4倍。来源:字节跳动Seed

    7月31·周四

    通义千问推出全新推理模型 Qwen3-30B-A3B-Thinking-2507

    Qwen3-30B-A3B模型迎来重大升级,新版本Qwen3-30B-A3B-Thinking-2507在推理能力、通用能力及上下文长度上显著提升。在数学和代码能力评测中超越Gemini2.5-Flash和Qwen3-235B-A22B,在写作、Agent能力、多轮对话等通用能力上也表现优异。新模型原生支持256K tokens,可扩展至1M tokens,思考长度增加,适合复杂推理任务。来源:通义千问Qwen

    Ollama发布桌面客户端,本地AI从此告别命令行

    Ollama推出适用于macOS和Windows的桌面应用。应用支持下载并聊天模型,具备文件拖拽功能,可处理文本或PDF文件,能通过增加上下文长度处理大型文档(需更多内存)。新应用支持多模态功能,可向支持该功能的模型(如Google DeepMind的Gemma 3)发送图像。能处理代码文件以帮助理解文档。来源:AI工具集

    零次方机器人再获两轮亿元级融资 加速具身基础模型突破与量产爬坡

    零次方机器人宣布完成天使+轮和天使++轮亿元级融资,半年内已获三轮融资。资金将用于深化具身智能基础模型研发、加速量产交付以及生态布局。零次方已发布专项场景操作基础模型Zerith-V0和轮臂人形机器人Zerith-H1,成为国内首家实现超长序列多任务连贯操作的企业。来源:Zerith零次方

    阿里巴巴旗下1688推出“1688 AI版”AI生意助手应用

    阿里巴巴集团旗下1688在浙江省“平台+产业”AI对接会上推出“1688 AI版”App及多项AI产品。1688 AI版聚焦创业与拿货场景,集成AI搜索、选品、创款、图搜、查企等核心功能,覆盖商机发现到产品创新全链路。来源:智东西

    阿里推出 AI 医学助手“氢离子”,收录千万级医学核心期刊文献

    阿里健康发布 AI 医学助手“氢离子”。收录千万级医学核心期刊文献,支持权威指南查阅、AI 总结、全文翻译及智能问答,能查询疾病和药品信息。AI 研读功能可总结外文文献重点并标注出处。来源:AI工具集

    京东健康推出 AI 情绪漫画生成应用“小星绪”

    京东健康团队推出 AIGC 产品“小星绪”,用户可通过语音或文字输入情绪或讲述故事,AI 将生成个性化漫画及故事解读。帮助用户表达情绪、激发创意并构建社交关系链。来源:AI工具集

    7月30·周三

    拒绝代做作业:OpenAI 发布 ChatGPT Study 学习模式

    OpenAI发布ChatGPT Study学习模式,面向教育领域,提供交互式提示、支架式回应、个性化教育和知识点检查等功能,深度解读难题解题思路,培养学生的批判性思维和自主学习能力。来源:AI工具集

    RoboScience 完成近 2 亿元天使轮融资,京东领投

    RoboScience宣布完成近2亿元天使轮融资,由京东领投,招商局创投、商汤国香资本跟投,老股东零一创投继续追投。RoboScience专注于具身智能技术,采用快慢脑分层端到端模型,自主研发仿真物理引擎和具身操作大模型,实现机器人操作的高精度和高泛化能力。来源:RoboScience

    昆仑万维开源多模态统一预训练模型「Skywork UniPic」

    昆仑万维推出并开源了多模态统一预训练模型Skywork UniPic。模型融合图像理解、文本生成图像和图像编辑三大核心能力,采用自回归路线,基于大规模高质量数据进行端到端预训练。1.5B参数规模实现轻量级与高性能的平衡,具备指令遵循、复杂指令生图和图像编辑的领先能力。来源:昆仑万维集团

    无影AgentBay来了!给AI智能体装上“超级大脑”

    阿里云在上海世界人工智能大会上推出首款AI Agents“超级大脑”——无影AgentBay。是一款云端电脑,具备视觉理解、自然语言控制等AI技能,可在多系统间无缝切换,调用云端算力与资源,仅需三行代码即可接入。来源:阿里云

    豆包·图像编辑模型3.0上线火山方舟

    豆包·图像编辑模型SeedEdit 3.0正式上线火山方舟。模型基于强大的文生图模型Seedream 3.0,支持高清图像生成与处理,可精准锁定编辑区域,实现人物姿态调整、文字修改、光影变换等功能,同时保留图像细节。来源:火山引擎

    谷歌AI笔记应用NotebookLM,新增“视频概览”功能

    谷歌宣布升级AI笔记应用NotebookLM,新增“视频概览”功能。功能可根据用户输入的主题自动创建带有旁白的幻灯片视频,从用户上传的图片、图表、引用和文档中提取数据以丰富内容。来源:AI工具集

    7月29·周二

    GLM-4.5发布:面向推理、代码与智能体的开源SOTA模型

    智谱旗舰模型 GLM-4.5 重磅发布并开源,作为首款SOTA级原生智能体模型,国产综合评测第一,性能媲美全球最强旗舰模型。参数效率翻倍,API价格仅为Claude的1/10,速度最快可达100tokens/秒。率先在一个模型中实现多能力原生融合并取得重要技术突破——单个模型同时具备强大的推理、代码、智能体等能力,已上线智谱清言和Z.ai开放免费体验。来源:智谱

    通义万相2.2开源!首创电影级美学控制系统

    阿里正式开源通义万相Wan2.2,含文生、图生及统一视频三模型,首次在扩散模型中引入MoE架构,降耗50%,并首创电影级美学控制系统,光影色彩媲美专业片。小模型5B可在消费级显卡22G显存跑5秒720P视频,代码已上架GitHub、Hugging Face与魔搭。来源:通义万相Wan

    阶跃 AI 有了一个研究小助手:阶跃深研

    阶跃星辰推出了“阶跃深研”研究小助手,开启邀测。阶跃深研能在约十分钟内完成复杂问题的研究任务,生成深度、专业的研究报告,适用于金融、咨询、医疗、法律、政策与学术研究等多个领域。在红杉中国发布的xbench-DeepSearch评测中以70%的通过率位列第一,在OpenAI的BrowseComp基准测试中也达到行业领先水平。来源:阶跃星辰

    微软为 Edge 浏览器引入 Copilot 模式,变为“AI 原生”浏览器

    微软在 Edge 浏览器中推出实验性功能“Copilot 模式”,将其从传统网页浏览器转变为“AI 原生”浏览器。Copilot 被定位为用户的“浏览智能体”,能看懂所有打开的标签页,帮助总结、对比信息,甚至未来可预订行程、处理琐事。来源:APPSO

    Runway推出多任务视频生成与编辑模型——Aleph

    Runway 近日宣布推出 Runway Aleph,是多任务视频生成与编辑模型。Aleph 能对输入视频进行多种编辑操作,包括添加、移除和转换对象、生成任意角度的场景,以及修改风格和灯光等。来源:AI工具集

    7月28·周一

    腾讯正式发布混元3D世界模型 1.0,全面开源

    腾讯在世界人工智能大会上正式发布并开源混元3D世界模型1.0。是业界首个开源的可沉浸漫游、可交互、可仿真的3D世界生成模型,融合全景视觉生成与分层3D重建技术,支持文字和图片输入,能在几分钟内生成高质量3D场景。来源:腾讯混元

    快手可灵 AI 发布全新创意工作台「灵动画布」

    快手可灵 AI 发布全新创意工作台「灵动画布」和升级后的「多图参考」功能。「灵动画布」支持最多 5 人协同创作,素材共享且可实时联动;「多图参考」功能则大幅提升了 AI 视频生成中角色、主体和场景的一致性,解决了以往角色形象前后不一致、画风突变等痛点。来源:AI工具集

    千问推出Qwen3升级版:Qwen3-235B-A22B-Thinking-2507

    Qwen3-235B-A22B推理模型升级版本Qwen3-235B-A22B-Thinking-2507正式发布。版本在推理性能和通用能力上取得巨大飞跃,可比肩Gemini-2.5 Pro、O4-mini等顶尖闭源模型,创下全球开源模型SOTA最佳性能表现。来源:通义千问Qwen

    阶跃星辰发布新一代基模Step 3,推理效率创行业新高

    阶跃星辰在上海发布新一代基础大模型Step 3。模型总参数量321B,激活参数量38B,采用MoE架构,具备强大的视觉感知和复杂推理能力,性能达到开源SOTA水平。Step 3在推理效率上实现行业领先,尤其在国产芯片上效率显著提升。来源:阶跃星辰

    上海AI实验室开源发布『书生』科学多模态大模型Intern-S1

    上海人工智能实验室在世界人工智能大会(WAIC 2025)上发布并开源了“书生”科学多模态大模型Intern-S1。模型是首个融合专业科学能力的开源通用模型,具备跨模态科学解析能力,可精准解读多种复杂科学模态数据,如化学分子式、蛋白质结构、地震波信号等,并在化学、材料、地球等多学科专业任务基准上超越顶尖闭源模型Grok-4。来源:书生Intern

    商汤科技发布「悟能」具身智能平台,官宣入局具身智能

    在世界人工智能大会(WAIC 2025)大模型论坛上,商汤科技发布「悟能」具身智能平台,正式入局具身智能领域。商汤凭借十年多模态技术积累和世界模型经验,推出日日新V6.5多模态推理大模型,其图文交错思维链显著提升了跨模态推理精度,性价比提升5倍。来源:量子位

    扣子开源:扣子开发平台Coze Studio和扣子罗盘Coze Loop

    Coze宣布开源两款核心产品:零代码开发平台Coze Studio和调试工具Coze Loop。扣子开发平台采用Apache 2.0开源协议,支持零代码开发,用户可通过拖拽组件快速搭建智能体工作流程。Coze Loop提供全生命周期管理工具链,涵盖开发、评测、观测和优化四大阶段,助力开发者高效调试和优化智能体。来源:AI工具集

    7月25·周五

    从灵感到网站,只要5分钟,扣子空间网页设计功能上线

    扣子空间推出了一键生成网页设计的新功能。用户只需输入需求,即可快速生成现代、响应式的网站,支持自然语言编辑和上传设计稿复刻。功能适用于招聘网站、活动营销页面、机构主页、个人主页、生活网页和前端工具等多种场景。来源:扣子Coze

    讯飞星火X1升级版正式上线!

    科大讯飞宣布其深度推理大模型讯飞星火X1升级版正式上线。此次升级实现了综合能力的大幅提升,对标OpenAI等一流大模型,在翻译、推理、文本生成、数学等方面保持领先。星火X1在幻觉治理方面取得显著进步,多语言能力覆盖130多种语种,为全球提供自主可控的大模型底座。来源:科大讯飞

    快手 AutoThink 大模型 KAT-V1 正式开源,40B 性能逼近 R1-0528

    快手开源了KAT-V1自动思考大模型,包含40B和200B两个版本。40B版本性能追平DeepSeek-R1(6850亿参数),200B版本在多项基准测试中超越Qwen、DeepSeek和Llama等旗舰模型。KAT-V1通过长短思考混合训练范式、新型强化学习方法Step-SRPO等技术创新,实现了根据问题难度自动切换思考模式。来源:快手技术

    宇树科技发布双足人形机器人新品Unitree R1,售价3.99万元起

    宇树科技发布双足人形机器人新品Unitree R1,售价3.99万元起,重量仅25千克。R1具备出色的运动控制能力,可下坡、翻跟头、倒立,支持开发与定制。来源:第一财经

    ChatGPT Agent 正式推送至所有 Plus、Pro 与团队用户

    ChatGPT Agent 功能现已正式向所有 Plus、Pro 与团队用户 推出。Agent 能在内置“虚拟电脑”环境中自主执行多步骤任务,包括上网浏览、填写表单、运行代码、生成表格与幻灯片等,用户通过对话中的“agent mode”菜单激活,可随时中断或确认 AI 操作。当前 Pro 用户每月可用 400 次,Plus 和团队用户为 40 次。来源:AI工具集

    阿里云通义千问宣布 Qwen-MT 机器翻译模型:支持 92 种语言互译

    基于Qwen3模型的机器翻译模型Qwen-MT正式发布。该模型支持92种语言互译,覆盖全球95%以上人口,具备高度可控性,提供术语干预、领域提示等功能。采用轻量级MoE架构,低延迟、低成本,API调用价格低至每百万输出token 2元。来源:通义千问Qwen

    Lovart 正式版上线,用 ChatCanvas 改写 AI 设计交互范式

    AI 设计智能体 Lovart 正式版发布,推出全新交互系统 ChatCanvas,实现从“工具”到“设计伙伴”的升级,首次将“评论系统”用于 AI 交互,用户可直接在画布上点击、标注、对话式修改图像;支持多图联动、Frame 管理、评论追踪与复用,像用 Figma 那样精细控制设计流程。来源:AI工具集

    7月24·周四

    字节跳动 Seed 团队发布端到端同声传译模型 Seed LiveInterpret 2.0

    字节跳动Seed团队推出了Seed LiveInterpret 2.0,是支持中英双向翻译的端到端同声传译模型。具备接近真人水平的翻译准确率和极低的延迟(仅3秒),能实时处理多人语音输入并进行“边听边说”翻译。零样本声音复刻功能可实时复刻说话人的音色,无需提前采集样本。来源:字节跳动Seed

    免费不限量,通义灵码已经全面支持 Qwen3-coder 模型

    阿里云宣布开源其AI编程大模型Qwen3-Coder,全面接入AI编程产品“通义灵码”,向全球开发者免费提供不限量服务。来源:通义灵码

    微软发布一键生成全栈应用工具——GitHub Spark

    微软发布GitHub Spark,可将自然语言描述一键生成全栈应用并部署上线。GitHub Spark遵循微应用理念,支持多种功能,如交互式预览、自动历史记录、托管运行时环境等,深度集成GitHub平台。来源:AI工具集

    像素绽放PixelBloom完成B3轮融资

    像素绽放PixelBloom近日宣布完成B3轮战略融资,由国内领先国有产业投资平台亦庄国投领投,国科投资、英诺天使基金、水木清华校友种子基金及探路者创始人盛发强先生参与投资。融资将支持PixelBloom加速全球化布局,确立AiPPT.com在全球AI演示软件领域的领导地位,扩展其独特的AI Venture Studio模式。来源:像素绽放PixelBloom

    加速进化宣布完成超亿元A+轮融资

    加速进化宣布完成超亿元A+轮融资,由北京市机器人产业发展投资基金领投,北京市人工智能产业投资基金和博华资本跟投。专注于双足人形机器人研发,其产品Booster T1在2025年RoboCup机器人世界杯上助力清华火神队获得成人组冠军。来源:智东西

    7月23·周三

    通义千问 Qwen3-Coder 宣布开源:480B 参数、原生支持 256K 上下文

    Qwen团队正式发布Qwen3-Coder,是迄今为止最具代理能力的代码模型。Qwen3-Coder-480B-A35B-Instruct是其最强大的版本,拥有480B参数激活35B参数,原生支持256K token上下文并可通过YaRN扩展到1M token,在Agentic Coding等任务上达到开源模型SOTA效果。来源:通义千问Qwen

    昆仑万维发布最新AI音乐模型——Mureka V7

    昆仑万维发布AI音乐模型Mureka V7。模型通过核心技术MusiCoT(音乐思维链)实现了先规划整体音乐结构再生成细节的功能,解决了传统AI音乐模型“走一步看一步”的问题,生成的音乐作品更具连贯性和感染力。Mureka V7支持10种语言,可创作流行、摇滚等多种风格音乐,最长单曲时长5.5分钟。来源:AI工具集

    讯飞星火X1将于7月25日全新升级!

    科大讯飞宣布讯飞星火X1升级版将于7月25日正式上线。此次升级的核心亮点包括综合能力大幅提升,在数学、翻译、推理、文本生成等方面保持领先;幻觉治理显著进步,慢思考模式的幻觉治理准确率大幅领先;多语言能力全面扩展,支持130+语种。来源:科大讯飞

    阿里本周将发布首款自研AI眼镜,加入“百镜大战”

    阿里巴巴将于本周发布首款自研AI眼镜,加入“百镜大战”。产品具备语音助手、音乐播放、电话通话、实时翻译等功能,整合了阿里巴巴生态内的地图、支付、购物等功能。硬件上,分为不带显示的AI智能眼镜和带显示的AI+AR智能眼镜,采用双芯片架构。来源:智能涌现

    通用机器人模型GR-3发布!支持高泛化、长程任务、柔性物体双臂操作

    字节跳动Seed团队发布通用机器人模型GR-3。模型具备高泛化能力、长程任务处理能力和柔性物体双臂操作能力,能理解抽象语言指令并快速适应新环境和新任务。GR-3采用Mixture-of-Transformers网络结构,融合了视觉、语言和动作信息,通过遥操作机器人数据、人类VR轨迹数据和大规模视觉语言数据联合训练,提升了泛化性和灵活性。来源:字节跳动Seed

    零一万物发布万智企业大模型一站式平台2.0

    零一万物在北京发布万智企业大模型一站式平台2.0版本,并推出企业级Agent智能体,定位为“超级员工”。该Agent具备深度思考和任务规划能力,能访问手机和Web端,连接各类企业服务。来源:零一万物 01AI

    7月22·周二

    字节跳动TRAE推出SOLO模式,从需求到交付“一站式完成”

    字节跳动发布AI编程助手TRAE SOLO模式,主打全流程自动化开发体验。从需求输入到部署交付“一站式完成”,支持自然语言或语音输入需求,AI自动完成PRD撰写、代码生成、调试验证并直接上线。引入“实时跟随”功能,动态展示AI操作阶段,用户可随时切换AI主导与手动主导模式。来源:AI工具集

    首款本地大模型办公本来了!讯飞智能办公本X5正式发布

    科大讯飞发布全新旗舰级智能办公本X5。作为首款本地大模型办公本,具备离线AI能力,支持离线语音转写、多人识别、中英互译及会议纪要等功能,构建“全链路安全”体系。配备10.65英寸墨水屏,仅重355克,薄至4.6毫米,搭载6nm AI芯片和8核CPU,支持300PPI高清显示与GPU快刷技术,书写体验接近真实纸笔。来源:科大讯飞

    Qwen3深夜升级,全面告别混合思维模式

    阿里通义千问推出Qwen3-235B-A22B-Instruct-2507-FP8版本,通用能力显著增强,涵盖指令遵循、逻辑推理、文本理解等多领域。在多项测评中超越Kimi-K2、DeepSeek-V3等顶级模型。新版本在多语言长尾知识、主观任务契合能力及长文本处理方面进步显著,上下文理解能力提升至256K。来源:新智元

    腾讯推出全栈开发AI IDE——CodeBuddy IDE

    腾讯推出CodeBuddy IDE的AI助手,专为零基础用户设计,助力无经验者轻松开发互联网产品。用户只需输入简单指令,工具可完成产品构想、设计、开发及调试等全流程操作。CodeBuddy IDE支持多种AI模型,内嵌Figma设计工具,可一键将设计稿转为代码,现已开启内测。来源:腾讯

    专为开发者设计的AI源码解读工具——Zread

    Zread是帮助开发者快速掌握项目核心知识的AI工具,能一键生成清晰易懂的仓库Guide,快速梳理复杂代码,生成API文档和用户手册。支持多仓库对比学习,解读GitHub Trending热门项目,提供深度研究功能,助力开发者提升技能。来源:AI工具集

    7月21·周一

    千寻智能完成近6亿元PreA+轮融资,京东领投

    具身智能领域头部企业千寻智能宣布完成近6亿元PreA+轮融资,由京东领投,中网投、浙江省科创母基金等知名机构跟投,老股东P7、顺为资本等超额追加投资。本轮融资由高鹄资本担任独家财务顾问。来源:千寻智能 Spirit AI

    Le Chat再一次升级,全方面对标ChatGPT

    Mistral AI推出升级版Le Chat,全方位对标ChatGPT。Le Chat新增深度研究模式,可生成结构化研究报告;语音模式借助新发布的Voxtral模型实现语音输入;原生多语言推理功能提供更精准回答;项目管理功能可组织对话内容;高级图像编辑功能支持复杂图像修改。来源:机器之心

    宇树科技,开启上市辅导

    中国证监会官网显示,宇树科技已正式开启上市辅导,中信证券担任辅导机构。辅导备案报告披露,宇树科技控股股东及实际控制人为王兴兴,直接持有公司23.8216%股权,通过上海宇翼企业管理咨询合伙企业(有限合伙)控制10.9414%股权,合计控制公司34.7630%股权。来源:财联社

    「众擎机器人」连续完成Pre-A++与A1轮融资,京东领投

    众擎机器人连续完成两轮融资,Pre-A++轮由星航资本投资,A1轮由京东领投,宁德时代旗下溥泉资本、银泰集团等参投,老股东中东资本等也参与增资。来源:众擎机器人

    逐际动力获京东战略领投,以IDS生态协同加速具身智能技术落地

    具身智能机器人公司逐际动力LimX Dynamics宣布完成新一轮融资,由京东战略领投。逐际动力将推进全尺寸人形机器人量产与销售,深化具身大模型技术研发及IDS生态平台建设。其全尺寸人形机器人将于下半年公开销售,双足机器人TRON 1持续升级。来源:逐际动力

    7月18·周五

    OpenAI正式发布ChatGPT Agent!

    OpenAI正式发布ChatGPT Agent功能。功能整合了Operator、Deep Research和ChatGPT本体,用户只需描述任务,Agent能自主调用工具,完成网页访问、信息提取、代码运行、PPT生成等操作,支持任务中断与修改。ChatGPT Agent支持手机端使用,可连接Gmail、GitHub等应用,深度嵌入工作流。来源:APPSO

    全球首个A股金融博弈智能体应用FinGenius开源

    由00后团队创建的全球首个A股金融博弈智能体应用FinGenius在GitHub开源。项目在内测阶段吸引了4000+用户申请体验。FinGenius通过16个超级智能体分工协作,结合多智能体博弈机制,30秒内生成分析报告,解决传统金融工具信息加工过度、数据不真实、大模型局限性等问题。来源:AI工具集

    Perplexity 向印度 3.6 亿用户免费赠送一年 Pro 服务

    AI搜索企业Perplexity与印度第二大电信运营商Bharti Airtel达成独家合作,向其3.6亿用户免费提供原价200美元的12个月Perplexity Pro订阅服务。合作具有排他性,印度其他电信商不得提供Perplexity服务。来源:IT之家

    AI初创公司DecartAI发布全球首个实时视频生成模型MirageLSD

    初创公司DecartAI发布全球首个视频直播模型MirageLSD,获Andrej Karpathy天使投资。模型可实时将摄像头画面转化为其他风格和内容,支持24FPS稳定运行,延迟低于40毫秒。通过英伟达CUDA Megakernels和抗漂移训练实现效率提升,能重塑观看体验、革新游戏世界、赋能内容创作者等。来源:AI工具集

    7月17·周四

    Kimi Playground: 一站式体验 Kimi K2 的工具调用能力

    Kimi开放平台宣布正式上线Kimi Playground,为开发者提供一站式工具调用能力体验。平台支持直观的工具调用界面和便捷的调试体验,可快速选择不同工具并实时调整参数。来源:Kimi 开放平台

    普林斯顿团队领衔发布最强开源数学定理证明模型:Goedel-Prover-V2

    普林斯顿大学联合清华大学、北京大学等顶尖高校及英伟达等机构,发布了新一代开源数学定理证明模型Goedel-Prover-V2。32B旗舰模型在自动数学定理证明基准测试中大幅超越前代SOTA模型DeepSeek-Prover-V2-671B,8B小尺寸模型性能也与之持平。来源:机器之心

    无界方舟连续完成Pre-A & Pre-A+轮亿元级别融资

    无界方舟(AutoArk)宣布连续完成Pre-A & Pre-A+轮亿元级融资。公司基于自研多模态大模型,打造AI应用的“超级感官”与“真大脑”。无界方舟的EVA多模态模型在性能上对标OpenAI的GPT-4o,具备高智商分析、真人般交互、全自动数据合成等优势,已实现商业化落地。来源:AutoArk无界方舟

    Mistral首个开源语音模型Voxtral,全面碾压Whisper

    Mistral AI发布首个开源语音模型Voxtral,包含24B和3B参数规模版本,基于Apache 2.0许可证开源并提供API接口。Voxtral支持8大主流语言,可处理30分钟音频转录或40分钟语义理解任务,全面超越Whisper,在多语言基准测试中表现优异,语音翻译成绩占据榜首,语音理解能力追平GPT-4o-mini。来源:智东西

    MiniMax Agent全栈开发能力“靠谱”上新

    MiniMax Agent发布全栈开发功能,用户仅需一句话即可生成复杂全栈应用,无需编程基础。功能支持Supabase后端托管、Stripe支付、定时任务等,可快速开发演唱会选座系统、实时金融看板、出海独立站、企业数据看板等应用。来源:MiniMax 稀宇科技

    7月16·周三

    观猹正式发布,打造AI产品的专业点评平台

    由特工宇宙团队打造的AI产品点评社区「观猹」正式发布,用真实用户视角判断产品PMF。面向AI爱好者,观猹提供真实、可信的产品评分与交流社区。创作者可分享AI作品,获取反馈;创业者能冷启动项目,连接用户与投资人。来源:AI工具集

    亚马逊推出Kiro AI编程工具,正式开放公测

    亚马逊云科技宣布推出Kiro AI编程工具,正式开放公测。Kiro是Agentic IDE,提供AI编码辅助,能帮助开发者从想法到上线的全过程。Specs可将模糊需求转化为具体用户故事和边界条件,Hooks能在代码提交前自动完成测试、文档更新和安全扫描等任务。来源:亚马逊云科技

    百度上线TizzyAI,主打无广告智能搜索

    百度上线全新AI搜索App“Tizzy.ai”,定位为无广告的AI智能搜索助手。应用基于百度多个大模型能力开发,界面简洁,无弹窗和信息流推荐,仅设“搜索”和“资源库”两个核心入口。TizzyAI支持自动和深度搜索模式,能快速回答问题并提供深度分析。来源:AI工具集

    Grok 推出交互式「数字伴侣」,基于Grok 4大模型

    马斯克旗下Grok APP推出基于Grok 4大模型的“智能伴侣”功能,付费用户可优先体验。功能提供动漫头像Ani、卡通小熊猫Rudy等3D形象,支持更换背景和动作。来源:机器之心

    ChatExcel·桌面版全新上线、AI提示词优化、常用提示词保存功能

    ChatExcel桌面版全新上线,支持Mac和Windows平台,用户可直接在桌面处理Excel数据、生成图表等,无需浏览器。新增AI优化提示词功能,点击“魔术笔”可一键优化提示词内容,更规范、准确。上线常用提示词保存功能,方便用户在重复场景中快速使用。来源:元空AIExcel

    华为携手云南交投发布“绿美通道·交通大模型”

    云南省交通投资建设集团有限公司与华为、长安大学合作研发的“绿美通道·交通大模型”在昆明正式发布。模型历时两年研发,涵盖智算中心底座、高质量数据集、AI平台工具链、行业模型集及AI场景应用等成果。来源:华为

    OpenAI正在开发基于Chromium的AI浏览器——“Aura”

    OpenAI正在开发一款基于Chromium的AI驱动浏览器,内部代号为“Aura”。浏览器将利用生成式和代理式AI能力,彻底改变用户的网络浏览体验。来源:IT之家

    百度AI助手全新功能「视频通话」上线!

    百度AI助手推出全新功能「视频通话」。用户可通过百度APP进入「AI+」选择「视频通话」,开启与AI的视频互动。覆盖多种生活场景:可识别花草、解答难题;提供专业穿搭建议;解读宠物行为;倾听烦恼、提供慰藉。来源:百度搜索

    LG 推出韩国首个混合推理 AI 模型 EXAONE 4.0

    LG AI Research研究所推出韩国首个混合推理AI模型EXAONE 4.0。模型融合通用自然语言处理与高级推理能力,在数学、科学及编程等高难度领域表现优异,支持多语言并提供32B专业版和1.2B端侧版。来源:IT之家

    7月15·周二

    TRAE 自定义模型新增 Kimi-K2,国际版支持Grok-4

    TRAE自定义模型服务商宣布新增Kimi-K2模型,支持通过API Key接入,满足开发者对模型多样性和专业性的需求。TRAE国际版新增超级模型Grok-4(Beta),进一步丰富了模型阵容,支持全球主流大模型一站式调用。来源:TRAE.ai

    秘塔AI搜索推出“深度研究”模块,动态展示研究过程

    秘塔AI搜索宣布其“深度研究”模块正式上线。秘塔通过优化数据和算法,降低了算力成本,提升了准确率,在中文搜索上表现突出。秘塔版“深度研究”免费开放,增加了“问题链”功能,可动态展示研究过程,为复杂问题提供结构化报告。来源:AI秘塔

    华人团队Cognition收购Windsurf剩余团队

    编程助手公司 Cognition 宣布收购编程初创公司Windsurf剩余员工和资产,获得其银行账户中超过 1 亿美元资金。此次收购后,Windsurf 将短期独立运营,继续开发其 AI 驱动的 IDE,Cognition 提供资金支持并计划将 Windsurf 的 IP 和功能集成到自身产品中。来源:机器之心

    ima 网页版正式上线,随时进入知识库

    ima 网页版正式上线,用户无需下载,打开浏览器即可使用。访问 ima.qq.com 并登录账号,可基于全网或知识库内容提问,能逛知识库广场、加入感兴趣的知识库。来源:ima.copilot

    MiniMax已基本完成近 3 亿美元新一轮融资

    大模型公司 MiniMax 近期已完成近 3 亿美元新一轮融资,估值超 40 亿美元。本轮融资新增上海国资等出资方,成为今年 AI 六小虎中仅有的两家获得融资的公司之一。来源:IT之家

    智源全面开源RoboBrain 2.0与RoboOS 2.0:刷新10项评测基准

    智源研究院发布 RoboBrain 2.0RoboOS 2.0,RoboBrain 2.0 是集感知、推理与规划于一体的通用具身大脑,32B 版本刷新多项权威评测基准,7B 版本适配边缘设备。RoboOS 2.0 是全球首个具身智能 SaaS 开源框架,集成 MCP 协议与无服务器架构,支持多机协作,推出单机版及技能商店。来源:智源研究院

    7月14·周一

    通义千问推出Qwen Chat桌面端,一键使用MCP

    阿里巴巴旗下通义千问发布Qwen Chat桌面端,目前支持macOS端,支持多模型PK及MCP协议,可通过插件实时调用地图、搜索、本地文件等外部数据,实现更精准回答。来源:通义千问Qwen

    美图推出专注于影像与设计的AI智能体RoboNeo

    美图公司正式推出专注于影像与设计的AI智能体RoboNeo,用户可通过自然语言交互轻松完成修图、设计和视频制作等任务。RoboNeo具备智能修图、AI设计生成、视频智能处理及多模态创作等多项功能来源:美图公司

    奥尔特曼宣布延期 OpenAI 首个开源权重 AI 模型

    OpenAI CEO山姆·奥尔特曼7月12日宣布,再次推迟发布其首个开源权重AI模型,理由是需要更多时间进行安全测试及高风险内容审查,但未给出新的发布日期。该模型原计划下周亮相,已是年内第二次延期。来源:IT之家

    「汉阳科技Yarbo」近日完成超亿元B+轮融资

    消费级扫雪机器人公司「汉阳科技Yarbo」完成逾亿元B+轮融资,由国科投资、中金资本、九阳创投联合注资。本轮资金将用于技术研发、供应链优化及北美、欧洲市场拓展,借助九阳SharkNinja渠道加速全球化布局。来源:36氪

    OpenAI 收购 Windsurf 计划告吹,后者 CEO 及创始人已被谷歌招入麾下

    OpenAI收购AI编码助手Windsurf的交易正式取消。谷歌迅速出手,Windsurf CEO Varun Mohan、联合创始人Douglas Chen及核心团队集体加入DeepMind,谷歌以约24亿美元获其技术非独家授权。原30亿美元收购价落空,Windsurf高层换血,业务由临时CEO接手。来源:IT之家

    CAMEL-AI与Gemini官宣合作,实现数据可视化和自动化

    开源多智能体框架CAMEL-AI宣布与Google DeepMind合作,集成Gemini 2.5 Pro模型,推出OWL系统。用户只需一句自然语言指令,OWL即可自动完成搜索、提取、分析并生成可视化图表,支持在线数据、本地文件及浏览器操作。来源:CAMEL AI

    7月11·周五

    月之暗面Kimi正式发布k2模型,具备超强代码和 Agent 能力

    月之暗面发布MoE架构基础模型k2,总参1T、激活32B,上下文128k tokens,支持ToolCalls、JSON/Partial/联网,无视觉。输入价¥1.00/1M tokens,输出¥4.00/1M,缓存命中¥16.00/1M,性能领先开源模型。来源:AI工具集

    拍我AI(PixVerse)上线多关键帧生成功能,从“片段”迈向“故事性表达”

    拍我AI(PixVerse)上线“多关键帧生成”功能,用户可上传最多7张图,在首尾帧模式下生成长达30秒的叙事视频,实现动作、场景及景别自然衔接,助力短剧、广告等高效创作。来源:爱诗科技AIsphere

    欧盟公布最终版《通用人工智能行为准则》,8 月 2 日起正式实施

    欧盟发布最终版《通用人工智能行为准则》,8月2日实施,涵盖安全、透明、版权三方面,由13位专家联合1000多利益方制定,企业可自愿签署以减轻负担,旧模型有2年调整期,新模型1年。来源:IT之家

    墨刀AI重磅上线:原型图,现在可以自动生成了!

    墨刀AI上线全新原型生成能力,从灵感到可交付界面只需30秒,面向产品经理和设计师提供零门槛体验。支持文字/草图/截图转原型,自动识别布局与组件;多轮对话优化设计,像“聊天”一样改原型;自动生成产品文档与页面逻辑,规范输出流程。来源:墨刀

    微软发布 Phi-4-mini-flash-reasoning 端侧 AI 模型:10 倍吞吐量

    微软发布Phi-4-mini-flash-reasoning端侧AI模型,采用SambaY架构与GMU组件,推理吞吐量提升10倍、延迟降至1/3,专注数学与逻辑推理,已上线Azure AI Foundry等平台。来源:IT之家

    7月10·周四

    马斯克发布 Grok 4,处理学术问题达到博士级别

    马斯克旗下xAI发布新一代大模型Grok 4,推理能力较前代提升10倍,在多项基准测试中超越现有模型,达到“博士后水平”。Grok 4支持工具调用、语音交互、多模态任务,并在ARC-AGI等高难度测试中刷新纪录。来源:机器之心

    办公小浣熊 · 桌面版全新上线!

    商汤科技推出“办公小浣熊”桌面版,支持Windows和Mac平台,用户无需浏览器即可一键唤醒AI助手,实现任务拆解、数据分析、图表生成等办公功能。老用户可同步历史内容。来源:商汤小浣熊

    智谱Z.ai推出的实验性大模型GLM-Experimental

    智谱AI推出全新实验模型GLM-Experimental,主打“AI Presentation”功能,可一键生成网页版PPT,支持多种风格与互动效果。用户只需输入简单Prompt,模型可自动生成内容、设计排版,实现弹幕、动画等高级效果。来源:AI工具集

    Perplexity推出 AI 浏览器——Comet

    Perplexity发布AI浏览器Comet,主打“从浏览到思考”,整合网页解释、任务执行等功能,成为用户的“思考伙伴”。Comet目前仅向高价订阅用户开放。来源:AI工具集

    抖音快手前高管创业,上线AI图片工具 KIRA

    由抖音、TikTok、快手前核心成员创立的 AI 图片生成工具 KIRA 正式亮相。产品由 ILLA Cloud 孵化,支持一键替换/移除背景、修补、画质增强、扩图等操作,并具备 AI 生成图片能力。创始团队包括曾任抖音 & TikTok 研发、快手孵化业务大前端负责人陈龙博,及抖音、快手多项战略项目设计负责人吴晓松。来源:AI工具集

    7月9·周三

    谷歌Veo 3逆天升级,照片秒变活人开口讲话!

    谷歌AI视频生成模型Veo 3近日升级,用户只需上传一张照片,即可生成角色一致、配有音频的视频,实现“照片开口说话”。新功能支持多种运镜和风格,适用于广告、动漫等创作场景。来源:新智元

    字节旗下小荷健康推出AI医疗助手——小荷AI医生

    字节跳动推出首款AI医疗助手App“小荷AI医生”,提供健康咨询、报告解读、药品查询等服务,强调“先求证、再建议”的诊疗逻辑。用户可通过拍照上传报告或病灶图片,获取个性化分析和用药建议。来源:AI工具集

    昆仑万维发布并开源 Skywork-R1V 3.0,刷新开源模型性能上限

    昆仑万维正式开源多模态推理模型Skywork-R1V 3.0,模型在高考数学中取得142分,在多学科多模态评测MMMU中获得76分,刷新开源模型性能上限。Skywork-R1V 3.0通过强化学习策略提升跨模态推理能力。来源:昆仑万维集团

    具身智能星海图再获超 1 亿美元融资,美团龙珠、今日资本领投

    具身智能公司星海图完成A4轮及A5轮融资,总额超1亿美元,由美团、美团龙珠、今日资本领投,老股东持续加码。公司专注于“整机+智能”战略,推出多款机器人平台及开发工具,服务全球开发者生态。来源:星海图

    钉钉重磅发布全新“AI表格”

    钉钉发布全新“AI表格”,将AI能力深度融入表格工具,支持智能数据分析、自动化流程和多模态内容生成。新增“表格即文档”功能,实现结构化数据与非结构化信息融合,提升协作效率。来源:钉钉

    Vidu Q1 参考生视频全球上线:重新定义叙事

    AI视频模型Vidu Q1推出“参考生”功能,用户只需上传参考图,可快速生成高质量视频素材,省去传统分镜、拍摄和特效流程,大幅降低创作门槛和成本。来源:生数ShengShu

    通义开源 HumanOmniV2 比你还懂“社交潜台词”!

    通义大模型推出多模态推理模型HumanOmniV2,能更好理解人类社交潜台词。模型引入强制上下文总结机制,结合视觉、听觉和语言信息,提升对复杂意图的理解能力。通过多维度奖励机制和优化训练策略,HumanOmniV2在多个基准测试中表现优异。来源:通义大模型

    7月8·周二

    混元3D再升级,推出业界首个美术级3D生成大模型Hunyuan3D-PolyGen

    腾讯混元3D宣布升级,推出业界首个美术级3D生成大模型Hunyuan3D-PolyGen。模型结合自研高压缩率表征BPT技术,可生成上万面复杂几何模型,布线精度高,细节丰富,支持三边面和四边面,满足不同专业需求。来源:腾讯混元

    它石智航完成1.22亿美元天使+轮融

    具身智能公司它石智航(TARS)宣布完成1.22亿美元天使+轮融资,由美团战投领投,钧山投资、碧鸿投资、国汽投资、临港科创投、赛富投资基金、建发新兴投资跟投,老股东线性资本、襄禾资本持续加码。来源:蓝驰创投

    强化学习新范式!元石提出“自反思生成范式”MetaStone-S1

    元石科技发布新一代反思型生成式模型MetaStone-S1,采用“自反思生成范式”,融合Long-CoT强化学习与过程评分学习,实现深度推理与推理链路筛选能力统一。模型在多个基准测试中性能对标OpenAI o3-mini,具备更长思考长度与更低推理成本。来源:问小白

    云深处科技完成近5亿元新融资 加速具身智能产业化布局

    由浙大博导朱秋国创立的云深处科技宣布完成近5亿元融资,由达晨财智、国新基金等联合领投。本轮融资将用于四足机器人产线扩建、人形机器人技术研发及高端人才引进。来源:智东西

    7月7·周一

    通义网络智能体WebSailor开源,检索性能登顶开源榜单!

    阿里云通义实验室开源网络智能体WebSailor。智能体具备强大的推理和检索能力,在智能体评测集BrowseComp上超越DeepSeek R1、Grok-3等模型,登顶开源网络智能体榜单。WebSailor通过创新的post-training方法和强化学习算法DUPO,大幅提升了复杂网页推理任务的表现。来源:阿里云

    字节跳动开源 AI IDE 工具核心组件 Trae-Agent

    字节开源TRAE Agent 在 SWE-bench Verified 排行榜上取得 75.2% 的求解率,位居第一。TRAE Agent 是基于大语言模型的智能助手,专为软件工程任务设计,能自主完成代码理解、问题复现、修复方案制定、高质量代码编写等任务。来源:TRAE.ai

    星动纪元完成近5亿元A轮融资!通用具身技术突破驱动商业化落地

    星动纪元宣布完成近5亿元A轮融资,由鼎晖VGC和海尔资本联合领投。公司成立于2023年,是清华大学唯一持股的具身智能企业,致力于打造通用智能体。目前,星动纪元已向全球科技巨头批量交付超200台产品,订单中50%以上来自海外客户,在工业物流、连锁零售等行业加速落地。来源:北京星动纪元科技有限公司

    通义实验室开源首个音频生成模型 ThinkSound

    通义实验室开源首个音频生成模型ThinkSound,专为打破“静音画面”局限而生。模型通过引入思维链(CoT)技术,让AI学会结构化推理画面与声音的关系,实现高保真、强同步的空间音频生成。基于2531.8小时高质量多模态数据训练,包含对象级和指令级样本,支持交互式编辑。来源:通义大模型

    AIGC独角兽硅基智能完成D轮融资,数字人业务营收数亿

    AIGC独角兽硅基智能完成数亿元D轮融资,投资方为嘉兴高新区产业基金。本轮资金将用于研发创新、技术落地及产品市场化。自2017年成立以来,硅基智能已完成10轮融资,投资方包括腾讯、红杉中国等。来源:36氪

    TNG推出DeepSeek“野生版”R1T2:速度碾压官方,开源

    德国AI公司TNG推出“DeepSeek R1T2”模型。基于DeepSeek R1、R1-0528和V3三大模型开发,采用专家组合(AoE)技术,速度比R1快20%,推理能力显著提升。与初代模型相比,R1T2的智力大幅提升,解决了token一致性缺陷,在无系统提示时也能提供自然对话体验。来源:AI工具集

    7月4·周五

    京东内测“宠TA”与“聊愈小宇宙”AI设计产品

    京东APP悄然上线两款AI社交产品,“宠TA”和“聊愈小宇宙”。“宠TA”围绕宠物数字人提供陪聊、换装、问诊及一键购粮等闭环消费;“聊愈小宇宙”则通过情绪识别、回忆日历和社区交流,结合专业的心理咨询服务。来源:AI工具集

    谷歌 Veo 3 AI文生视频模型正式向 Pro / Ultra 会员开放

    谷歌Veo 3 AI文生视频模型正式向Pro/Ultra会员开放。Pro会员每天可生成3段视频,Ultra会员生成数量未公布。Veo 3的“照片生成视频”功能即将上线。来源:AI工具集

    昆仑万维再次开源奖励模型!Skywork-Reward-V2

    昆仑万维开源第二代奖励模型Skywork-Reward-V2系列,共8个模型,参数规模从6亿到80亿不等。系列在七大主流奖励模型评测榜单中全面夺魁。来源:昆仑万维集团

    腾讯元宝支持一句话搜索图片、视频号内容

    腾讯元宝推出新功能,支持用户通过“一句话搜索”匹配图片和视频号内容。用户开启“联网搜索”后,元宝可自动根据提问匹配图片与视频号,支持任意模型,不限“深度思考”是否开启。来源:腾讯元宝

    OmniGen2重磅升级,统一图像生成再进化

    智源研究院宣布 OmniGen2 图像生成模型重磅升级。OmniGen2采用分离式架构与双编码器策略,强化上下文理解与指令遵循能力,图像生成质量大幅提升。重构数据生成流程,解决开源数据集质量缺陷问题,引入图像生成反思机制,提升模型自我优化能力。来源:智源研究院

    7月3·周四

    智谱获上海国资10亿元战略融资

    国产AI大模型企业智谱在开放平台产业生态大会上宣布获得上海国资10亿元战略投资,由浦东创投集团和张江集团完成首笔交割。同时,三方与上海仪电、浦发集团合作,共同建设AI新型基础设施。来源:钛媒体AGI

    星流 Agent上线!更适合中国设计师的一站式创意设计Agent

    星流Agent正式上线,是专为中国设计师打造的一站式创意设计Agent。星流Agent延续了Lovart的全栈式智能设计能力,全面适配中文语义、东方美学和本地场景。用户只需输入一句话,能自动拆解任务、匹配风格、生成整套设计物料,支持多模态内容创作,涵盖图像、视频、3D等多种格式。来源:LiblibAI

    Perplexity Max 订阅上线,月费 200 美元

    Perplexity推出高端订阅服务Perplexity Max,月费200美元(约合1433元人民币)。订阅用户可无限制访问电子表格和报告生成工具Labs,提前体验Comet浏览器等新功能,调用OpenAI的o3-pro和Claude Opus 4等先进AI模型。来源:AI工具集

    7月2·周三

    智谱发布并开源 GLM-4.1V-Thinking 系列视觉模型

    智谱发布两项重要成果。一是开源新一代通用视觉语言模型GLM-4.1V-Thinking,10B级轻量版在多项权威评测中表现卓越,具备图像、视频、文档等多模态输入能力,支持复杂推理任务。二是上线MaaS“Agent应用空间”平台,启动Agent开拓者专项扶持计划,助力企业低门槛接入Agent能力,推动AI原生创业发展。来源:智谱

    百度推出自研多模态大模型MuseSteamer和AI视频创作平台绘想

    百度发布自研视频生成模型MuseSteamer及AI视频创作平台“绘想”。MuseSteamer是全球首个实现中文音视频一体化生成的模型,打破传统AIGC视频“先画面后配音”的流程,可实现画面、音效与人声台词协同创作。用户仅需上传一张图片即可生成专业级视频内容。来源:AI工具集

    阿里云加码领投,智能体开发平台BetterYeah AI完成超亿元B轮融资

    企业级AI智能体开发平台BetterYeah AI宣布完成超亿元人民币B轮融资,由阿里云领投、名川资本跟投。资金将用于新一代智能体产品研发。BetterYeah AI由钉钉创始团队成员创立,核心团队具备深厚的企业级产品基因。来源:钛媒体AGI

    北京中小学生 9 月起开设 AI 通识课

    北京宣布从2025年秋季学期起,全市中小学将全面普及人工智能通识教育,每学年不少于8课时。课程将涵盖人工智能的基本概念、应用与技术、实现方法及伦理与社会等方面,并将评价结果纳入学生综合素质评价体系。来源:北京市教育委员会

    豆包「图像生成」超能创意2.0开启灰度测试

    豆包超能创意 2.0 已在网页版和电脑版灰度测试,模型升级至豆包大模型 1.6 版本,接入 seedream 3.0、seededit 3.0 和 seedance 1.0 Pro 模型,分别提升图片生成、编辑和视频生成效果。来源:AI工具集

    7月1·周二

    Cursor 推出网页端和移动端 Agent,支持多任务并行

    Cursor 新推出的网页端和移动端 Agent 功能,用户可以在任何设备上通过浏览器访问 Cursor Agents,连接 GitHub 后即可使用。随时分配任务,Agent 后台自动运行并通知;支持多设备访问,满足不同场景需求;可分享工作链接,方便团队协作;支持多任务并行,提供多种解决方案。来源:AI工具集

    通义千问推出语音合成模型Qwen-TTS,新增三种中文方言

    Qwen-TTS发布了最新版本,新增支持生成北京话、上海话和四川话三种中文方言。语音合成模型使用超过300万小时语料库训练,合成效果自然且富有表现力,能自动调整韵律、节奏和情绪。来源:通义千问Qwen

    Meta宣布正式成立「超级智能实验室」11人豪华团队

    Meta正式宣布成立「超级智能实验室」(Meta Superintelligence Labs,MSL)。实验室由Scale AI前CEO Alexandr Wang担任首席人工智能官并领导,同时挖角了来自OpenAI、Anthropic和谷歌DeepMind的11位顶尖人才。来源:机器之心

    ima.copilot更新,支持图文并茂回答

    ima.copilot更新,支持图文并茂的回答。更新覆盖首页、知识库、侧边栏和笔记AI帮写等功能。用户可上传PDF、Word或PPT,ima能提炼重点并生成图文结合的内容。来源:ima.copilot


  • 11款免费好用的AI翻译工具和软件,覆盖100+语言

    对于个人、学生、上班族和游客来说,使用翻译应用程序和服务可以帮助打破语言和沟通障碍。在本篇文章中,我们将介绍11个好用的免费AI翻译工具,无论你是需要翻译网站、进行双语对话,还是理解一段外语,这些人工智能翻译工具都可以帮助你轻松翻译上百种语言。

    沉浸式翻译

    沉浸式翻译是一款支持双语对照的网页翻译插件,能翻译网页、PDF、EPUB电子书和视频字幕,同时提供原文与译文的对照,帮助用户更好地理解外语内容。插件内置了多种顶尖翻译引擎,如DeepL、OpenAI、谷歌翻译等,用户可以根据自己的偏好选择。还具备鼠标悬停翻译和输入框翻译等便捷功能,适合语言学习者、研究人员、商务人士、技术开发者和内容创作者等不同用户群体使用,提升语言理解和学习效率。

    ✅产品优点

    • 双语对照:提供原文与译文的对照,有助于用户更准确地理解外语内容。
    • 多格式支持:支持网页、PDF、EPUB电子书和视频字幕的翻译,满足不同场景的需求。
    • 顶尖翻译引擎:集成了DeepL、OpenAI、谷歌翻译等知名翻译引擎,确保翻译质量。
    • 便捷交互:支持鼠标悬停翻译和输入框翻译,提高用户翻译效率。
    • 格式保留:在翻译PDF和EPUB文件时,能够保留原文件的格式,便于阅读和引用。

    ⛔产品不足

    • 翻译引擎限制:虽然支持多种翻译服务,高级翻译引擎如DeepL和OpenAI需要付费或配置API密钥才能使用 。
    • 文件大小限制:对于大型PDF文件,翻译可能会受到文件大小的限制,超大文件可能需分割处理 。

    DeepTranslate

    DeepTranslate是一个免费的AI双语翻译器,支持超过142种语言,能一键生成双语网页,帮助用户快速准确地翻译各种内容,包括新闻、学术论文、社交媒体帖子等。具有自定义翻译风格、友好的用户界面和多平台兼容性,适合学生、研究人员和普通用户使用,提高工作效率和理解力。

    ✅ 产品优点

    • 多语言支持:DeepTranslate 支持超过142种语言的翻译,覆盖了全球大部分语言,满足不同用户的需求。
    • 双语页面生成:用户可以一键生成双语网页,方便对比不同语言的内容,提升理解力。
    • 自定义翻译风格:通过内置的AI提示,可以根据需要自定义翻译风格,确保翻译结果符合行业术语和特定语境。
    • 快速准确:依托强大的翻译引擎,DeepTranslate 能快速、准确地翻译复杂的内容,包括习语和专业术语。

    ⛔产品不足

    • 语言支持限制:与Google Translate等相比,DeepTranslate 支持语言主要集中在欧洲语言、中文、日文和韩文。
    • 文件大小限制:免费版本的文件翻译有大小限制,不适合翻译大型文件。

    百度翻译

    百度翻译官网

    百度翻译是一款由百度公司提供的在线AI翻译工具,提供中文和190多种其他语言之间的快速机器翻译,可以将文字和语音翻译成目标语言,并朗读出来。相较于其他翻译工具,在汉译时,更好地支持习语、俚语和文化细微差别。此外,百度翻译还提供了一些其他功能,例如文档翻译、语音翻译、短语翻译等。

    ✅ 产品优点

    • 支持多种语言之间的翻译,覆盖了全球大多数国家和地区
    • 提供多种特色功能,如双语对照、英文润色、同反义词、双语例句等
    • 支持多个平台,包括网页端、桌面端、移动端应用程序、浏览器插件等

    ⛔ 产品不足

    • 有时翻译结果可能不够准确,需要进行手动修正

    谷歌翻译

    谷歌翻译

    谷歌翻译是由谷歌于2006年推出的免费多语言神经机器翻译服务,提供130多种不同语言之间的即时翻译,包括英语、中文、西班牙语、法语、阿拉伯语等,并且支持的语言之间可以进行任何方向的翻译。除开在线翻译外,谷歌翻译还支持即时翻译、图片翻译、语音翻译、离线翻译、文档翻译和网页翻译等。

    ✅ 产品优点

    • 免费、快速、支持多种语言,并且可以离线使用。
    • 神经机器翻译提供了高质量的翻译

    ⛔ 产品不足

    • 国内用户可能无法直接访问
    • 复杂的句子、不常见的方言或俚语中翻译质量不佳
    • 没有提供词典、例句、同义词等更加全面的功能

    火山翻译

    火山翻译

    火山翻译是由字节跳动 AI Lab(人工智能实验室)自主研发推出的AI翻译工具,支持120多种语言间互相翻译,内置权威词典、支持多种查词方式。10+ 语种丰富音色免费开放,练听力练跟读。提供PDF文字格式整理、对照阅读模式、个人术语库等特色功能。

    ✅ 产品优点

    • 支持的语言翻译覆盖范围广
    • 支持网页端、浏览器插件、微信小程序等多个平台
    • 搭配火山写作,可进行AI英文拼写和语法修改

    ⛔ 产品不足

    • 暂未提供iOS和Android端应用程序
    • 网页端的翻译暂不支持图片、语音翻译等,需要在小程序使用

    DeepL

    DeepL

    DeepL是一款备受用户好评的在线AI翻译工具,凭借其准确的翻译质量和高效的语言识别能力,成为了市场上备受瞩目的翻译工具之一。DeepL的翻译质量在业内处于领先地位,其翻译结果比其他翻译工具更为准确。由于DeepL的翻译算法采用了先进的深度学习技术,能够模拟人类在翻译过程中的思维和技巧,从而更准确地把握句子的语义和上下文信息。

    ✅ 产品优点

    1. 英语和德语翻译质量较好
    2. 支持多个平台,包括网页端、Mac、Windows、iOS、Android、Chrome扩展
    3. 匹配上 DeepL Write 人工智能写作助手可检查拼写和语法

    ⛔ 产品不足

    1. 由于服务器在国外,有时网站加载速度较慢
    2. 支持的语种相对较少,目前提供30多种语言的翻译
    3. 免费版单次输入的翻译字符数不能超过3000字符

    必应翻译

    必应翻译

    必应翻译是微软作为其必应搜索引擎的一部分而提供的机器翻译服务,支持70多种不同语言的免费翻译,包括常见的英语、西班牙语、法语、德语、汉语、日语、俄语等通用语言之间的翻译。

    ✅ 产品优点

    • 与微软旗下其他产品(如Bing、Office、Skype和SwiftKey键盘)有集成
    • 翻译速度快,支持多种通用语言

    ⛔ 产品不足

    • 语言覆盖范围相比其他产品要少,翻译中偶尔会出现不准确的地方
    • 免费版本可以连续翻译的文本数量有限制,不同语言的翻译质量也不同

    腾讯翻译君

    腾讯翻译君

    腾讯翻译君是腾讯最新出品的实时会话翻译软件,支持中、英、日、韩等17门语言之间的翻译。具有精准语言识别,高效、免费等特点。非常适用于境外旅游、对外交流、口语练习等情境,让你体验同声传译般的流畅和快感。

    ✅ 产品优点

    • 提供AR翻译、口语评测、同声传译等特色功能
    • 支持免费使用全球最大最权威的《新牛津词典英汉双解大词典》

    ⛔ 产品不足

    • 支持的语言数量相对较少
    • 需要连接互联网才能使用全部功能,无法离线使用
    • 不支持文档翻译、网页翻译等翻译模式

    搜狗翻译

    搜狗翻译

    搜狗翻译是一款由搜狗搜索推出的AI翻译产品,它结合了机器翻译与人工翻译的优点,支持中、英、法、日等50多种语言之间的互译,并且提供多种功能。搜狗翻译可以应用于学习、生活和工作等多个场景,无论是需要查阅词典、翻译长文、还是进行实时对话翻译,它都能提供有效的帮助。

    ✅ 产品优点

    • 功能丰富,支持语音翻译、文本翻译、拍照翻译、双人对话等
    • 支持英文写作AI批改,可智能校正错误,升级句式

    ⛔ 产品不足

    • 在俚语和习惯用语的翻译方面也存在一些不足
    • 支持的语种还有待提高,不支持一些较为小众的语言

    阿里翻译

    阿里翻译

    阿里翻译是由阿里巴巴提供的多语种在线实时AI翻译网站,由阿里巴巴达摩院机器智能技术实验室提供技术支持,提供多种领域、覆盖200+语言的智能机器翻译服务。阿里翻译还支持文档翻译、图片翻译、视频翻译、语音翻译等多模态翻译能力。

    ✅ 产品优点

    • 翻译准确性较高,由达摩院的AI技术加持
    • 覆盖的语言多,支持全球214种语言翻译
    • 适用场景范围广,适用于跨境电商、语言服务、翻译教育、企业办公等场景

    ⛔ 产品不足

    • 仅提供网页端体验和API接入,没有移动端应用程序
    • 更加适合于商业公司的产品接入适用,不适合个人用户日常高频使用

    讯飞智能翻译

    讯飞智能翻译

    讯飞智能翻译是由科大讯飞推出的一个快速准确、稳定可靠的人工智能翻译平台,支持超过140多种语言间进行互译,并提供文档翻译、文本翻译、语音翻译、图片翻译、网页翻译、视频翻译、音频翻译等多种翻译模式。

    ✅ 产品优点

    • 结合讯飞先进的语音识别和翻译技术,语音翻译准确度高
    • 支持23种文档格式翻译,保留原版格式样式和排版

    ⛔ 产品不足

    • 目前仅提供网页端使用,不支持其他终端设备
    • 免费版文本翻译限制为2000字符
    • 需要登录注册后方可使用翻译功能