Author: Chimy

  • 笔墨公文 – AI驱动的公文写作平台

    笔墨公文是什么

    笔墨公文是北京笔墨跳动科技推出的AI公文写作平台,为用户提供了一站式的AI公文创作辅助功能,包括AI生成公文内容、各类主题的公文模版、公文范文示例和丰富的公文素材库,可帮助用户轻松掌握公文写作的秘诀和范式,打破创作限制。借助AI的强大支持,实现一次性创作出高质量高水平的公文佳作。

    笔墨公文官网

    笔墨公文的主要功能

    1. 多种文体主题的公文写作:支持述职报告、调查研究、工作总结、心得体会等文种的公文创作
    2. 文本内容纠错校对润色:智能检测错别字、语法、涉政等多种错误,公文风格文本润色,让你的表达更专业
    3. 丰富的优选范文与素材库:提供众多高质量的范文和素材,涵盖广泛的主题和风格,供用户参考和借鉴
    4. 多样化公文模板灵活选择:内置10余种法律性公文模板,如决议、决定、公告等,以及20多种事务性公文模板,包括总结、规定、制度等

    笔墨公文AI写作

    笔墨公文的使用方法

    1. 访问笔墨公文的官网(bimogongwen.com/agi/),点击免费试用按钮
    2. 选择要创作的文种,输入主要信息,点击生成大纲,登录/注册账号
    3. 待生成大纲完成后,可对提纲进行修改或重新生成,点击下一步生成文章
    4. 等待片刻,AI便会根据先前生成的大纲生成公文

    笔墨公文的产品价格

    1. 免费版:新用户可获得免费AI生成5000字,校对润色1000字,精品范文5篇,优质素材5篇,公文模板5次的权益
    2. 月度会员:79元,可拥有AI写作60000字,校对润色20000字,精品范文500篇,优质素材2500篇,公文模板500次的权益
    3. 季度会员:159元,可拥有AI写作180000字,校对润色60000字,精品范文2000篇,优质素材10000篇,公文模板2000次的权益
    4. 半年会员:259元,可拥有AI写作400000字,校对润色120000字,精品范文6000篇,优质素材30000篇,公文模板6000次的权益
    5. 年度会员:399元,可拥有AI写作800000字,校对润色240000字,精品范文15000篇,优质素材75000篇,公文模板15000次的权益
  • 海艺AI – 免费的AI绘画和图片生成平台

    海艺AI是什么

    海艺AI是一款高效且易用的AI绘画和图片生成工具,让你无需专业技能,输入提示词即可轻松生成高质量图片。得益于强大的渲染引擎、丰富的模型库和专业级功能,高质量创作触手可及。结合智能推荐系统和社区互动分享功能,海艺AI让用户在创意设计和艺术表达中如鱼得水,快速生成真实、高品质作品,满足个性化需求。

    海艺AI SeaArt官网

    海艺AI 的功能特色

    1. 自然语言理解与提示词润色:只需以自然语言输入创作描述,海艺的AI系统会自动理解需求,并提供智能润色功能。
    2. 各种风格和场景的图片生成:支持AI生成二次元、卡通、游戏、摄影、建筑、插画、写实等不同风格的图像。
    3. 多元化AI图像创作模式:不仅支持传统的文生图和图生图,还提供了12种控制网条件生图创作模式。
    4. 海量丰富的模型库:对接Civitai的模型库,支持直接使用Civitai内的几乎所有模型和lora。用户也可手动上传模型。
    5. 全新自研大模型升级至 V6版本:大幅提升出图质量,让细节更丰富,色彩层次更合理,立体感更强,文本理解能力更佳。
    6. 图像智能描述与局部重绘:支持导入图片自动提取关键词,也支持涂抹并进行局部重绘。
    7. 图片高清修复:支持将低分辨率的图片高清放大修复,并保留画面细节。
    8. 活跃的AI绘画社区:用户积极分享创作的天马行空的AI绘画作品,可自由探索并复用提示词。

    海艺AI SeaArt

    海艺AI 的使用方法

    1. 访问海艺AI的官网(haiyi.art),点击右上角的登录按钮进行登录/注册
    2. 点击顶部的创作按钮进入创作界面,在底部输入框中输入提示词或点击预置的示例提示词
    3. 右侧面板可进行参数设置,如切换模型、风格、模式、图片生成数量、图片尺寸等
    4. 设置完毕后,点击发送图标,等待片刻,海艺AI便能生成你想要的图片

    海艺AI 的产品价格

    海艺AI价格

    • 免费版:用户注册后每日可免费生成图片150张
    • SVIP权益卡:
      • 初级版:月付16元每月(年付折合18元每月),每天可获得300体力
      • 标准版:月付68元每月(年付折合54元每月),每天可获得700体力
      • 专业版:月付208元每月(年付折合166元每月),每天可获得2100体力
      • 大师版:月付348元每月(年付折合274元每月),每天可获得3500体力
    • 算力充值:算力可进行模型训练、AI绘画创作、付费解锁图集、付费使用模型,算力永不过期。价格为6元700算力、30元3800算力、68元7700算力、148元17000算力、328元45000算力、648元90000算力
    • VIP权益卡:享受专属快速队列创作通道和下列大量特权,以及每日赠送700体力,约能创作700张普通模式的图片,价格为1元VIP 1日卡限购1次、6元VIP 1日卡(首充赠700算力)、30元VIP 7日卡(首充赠3800算力)、68元VIP 30日卡(首充赠7700算力)、168元 VIP 90日卡(首充赠23000算力)、298元 VIP 180日卡(首充赠38000算力)、498元 VIP 360日卡(首充赠74000算力)

    海艺AI的常见问题

    海艺AI是免费的吗?
    海艺AI为用户提供免费的AI图片生成次数,每日可免费生成约150张图片。
    海艺AI生成的图片可以商用吗?
    海艺AI生成图片的知识产权属于用户,可用于个人作品或商业用途。
    海艺AI有移动端App吗?
    海艺AI目前仅支持通过浏览器网页端使用,暂未推出移动端App。
  • OpenAI CEO Sam Altman 离职事件时间线最全盘点

    近日 OpenAI CEO Sam Altman 被董事会罢免的事件在人工智能行业乃至全世界引起轩然大波,AI工具集整理了从事件起初到最新的报道,梳理了整个事件的时间脉络,按事件发生和英文报道的北京时间先后顺序整理排列,让你一文弄懂 Sam Altman 被罢免风波的来龙去脉。若你对该事件有任何看法和观点,欢迎在下方评论区留言分享。
    Sam Altman离职事件时间线

    点击切换为:按时间倒序排列
    fire emoji11月18日·罢免开端,人事动荡
    11月18日 04:28

    OpenAI 突然罢免 CEO Sam Altman,董事会称对其领导能力失去信心

    OpenAI 发布公告宣布,Sam Altman 将辞去首席执行官一职,并退出董事会,首席技术官 Mira Murati 被任命为临时首席执行官。此外,Greg Brockman 将辞去董事会主席职务,并继续担任公司职务。OpenAI表示:“在 Altman 离职之前,董事会进行了审慎的审查,得出的结论是,他在与董事会的沟通中并不坦诚,阻碍了他履行职责的能力,董事会也不再相信他继续领导 OpenAI 的能力。”
    OpenAI Leadership Transition

    公告全文:OpenAI announces leadership transition

    11月18日 05:21

    谷歌前 CEO 发文谈 OpenAI 首席执行官离职

    谷歌前 CEO 施密特发文,感谢Altman为人工智能做出的贡献。施密特表示,“Sam Altman是我心目中的英雄。他将一家公司从一无所有发展到价值 900 亿美元,并永远改变了我们的集体世界。我迫不及待地想看看他接下来会做什么。我和数十亿人将从他未来的工作中受益——这将是令人难以置信的。谢谢你为我们所有人所做的一切。”
    Eric Schimidt感谢Sam Altman

    11月18日 05:46

    Sam Altman 回应:稍后会说明更多情况

    Sam Altman 在 X 平台发推:“我很喜欢在 OpenAI 的时光。这对我个人来说是变革性的,希望对世界也有一点变革。最重要的是,我喜欢与这些才华横溢的人一起工作。稍后会说明更多情况。”
    Sam Altman response

    11月18日 05:48

    OpenAI 将在 CEO 离职后召开全体员工大会

    据知情人士透露,在 OpenAI 决定解雇首席执行官Sam Altman之后,该公司刚被任命的临时首席执行官Mira Murati及其团队将于当地时间周五下午向公司员工发表讲话。公司希望能够消除员工对公司未来融资前景等问题的忧虑。

    相关报道:财联社 – OpenAI将在CEO离职后召开全体员工大会

    11月18日 07:25

    微软 CEO 回应:将继续致力于与 OpenAI 的长期合作

    微软 CEO Satya Nadella 发文称:“正如您本周在 Microsoft Ignite 上看到的那样,我们将继续为这个 AI 时代快速创新,在整个技术堆栈中发布了 100 多项公告 – 从 Azure 中的 AI 系统、模型和工具到 Copilot。最重要的是,我们致力于为我们的客户提供所有这些,同时构建未来。我们与 OpenAI 签订了长期协议,可以完全访问我们实现创新议程和令人兴奋的产品路线图所需的一切,并继续致力于维持Mira 及其团队的合作伙伴关系。我们将共同努力,继续为世界带来这项技术的有意义的好处。”
    微软CEO的回复

    11月18日 08:09

    OpenAI 联合创始人兼董事长 Greg Brockman 宣布将辞职

    Greg Brockman 在 X 平台发推:“根据今天的消息,我辞职了。” 回应的全文内容:“自从 8 年前在我的公寓开始工作以来,我对我们大家一起建造的东西感到非常自豪。我们一起经历了艰难而又美好的时光,尽管有种种原因,但我们还是取得了如此多的成就。但根据今天的新闻,我辞职了。真诚地祝愿你们一切顺利。我仍然坚信创造造福全人类的安全通用人工智能的使命。”
    Greg Brockman宣布辞职

    11月18日 12:42

    Greg Brockman 发文谈 Altman 被罢免风波的细节

    Greg Brockman 发文透露,昨晚,Altman 收到公司首席科学家 Ilya Sutskever 发来的短信,要求周五中午谈话。Sutskever 告诉 Altman 他将被解雇,并且消息很快传出。周五中午12点23分,Sutskever 发送了一条 Google Meet 会议链接,Brockman 被告知,他将被从董事会中除名,而 Altman 已被解雇。Brcokman 也被解除了董事会主席职务(但没有被公司开除),随后,他宣布自己将从公司离职。据 Brockman 了解,公司 CTO Mira Murati 是在周四晚上就知道了公司的决定,除此之外他们都是被临时通知的。
    Greg Brockman 谈细节

    11月18日 13:32

    Sam Altman 发声:若自己“开火”,董事会将索赔

    在早些时候被 OpenAI 罢免的原 CEO Sam Altman 再度在 X 平台发文宣称,如果自己“开火”,OpenAI 的董事会将向他追讨自己所持股票的全部价值。(if i start going off, the openai board should go after me for the full value of my shares)
    Sam Altman 二次发声

    11月18日 14:41

    消息称:三名 OpenAI 高级研究人员宣布辞职

    据 The Information 报道,三名 OpenAI 高级研究人员宣布辞职,称受到了 OpenAI 原 CEO Sam Altman 被解雇、总裁Greg・Brockman 突然辞职的影响。这三位高级研究人员包括公司研究主管雅库布・帕乔基(Jakub Pachocki)、评估 AI 潜在风险的团队负责人亚历山大・马德里(Aleksander Madry)和已经供职 7 年时间的研究员西蒙・西多尔(Szymon Sidor)。

    英文报道:The Information – Three Senior OpenAI Researchers Resign as Crisis Deepens

    中文报道:IT之家 – 继 CEO、总裁之后,消息称又有三名 OpenAI 高级研究人员宣布辞职

    helicopter emoji11月19日·外部施压,回归有望
    11月19日 01:57

    OpenAI 内部备忘录称 Sam Altman 被解雇背后不存在“渎职”

    据 Axios 报道,根据 OpenAI 首席运营官 Brad Lightcap 的一份内部备忘录,OpenAI 首席执行官 Sam Altman 被解雇并不是因为“渎职或与我们的财务、业务、安全或安全/隐私实践相关的任何事情”,而是因为“Sam Altman 与董事会之间的沟通中断”。

    英文报道:Axios – No “malfeasance” behind Sam Altman’s firing, OpenAI memo says

    中文报道:财联社 – OpenAI备忘录称Sam Altman被解雇背后不存在“渎职”

    11月19日 02:53

    Sam Altman 被解雇后,OpenAI 的 860 亿美元股票出售陷入困境

    据一位知情人士透露,此前由 Thrive Capital 牵头的以 860 亿美元估值对 OpenAI 进行的要约收购尚未结束,但已进入最后阶段,预计最快下个月完成。截至周六,三名计划参与招标的前 OpenAI 员工表示,他们不再预计此次出售会发生,或者即使发生,由于最近发生的事态发展,其估值也会较低。

    英文报道:The Information – OpenAI’s $86 Billion Share Sale in Jeopardy Following Altman Firing

    11月19日 03:46

    Sam Altman 计划创办一个新的 AI 企业

    据一位知情人士透露,最近被赶下台的 OpenAI 首席执行官 Sam Altman 一直告诉投资者,他计划推出一家新的人工智能企业。该人士表示,OpenAI 前总裁 Greg Brockman 预计也将加入该公司,该项目仍在开发中。目前尚不清楚该合资企业的确切性质,可能是一家人工智能芯片公司。

    英文报道:The Information – OpenAI Co-Founder Altman Plans New AI Venture

    中文报道:腾讯科技 – 传奥特曼早已在筹划创办新初创公司,孙正义或是背后投资人

    11月19日 06:44

    OpenAI 的投资者正在向董事会施压,要求 Sam Altman 重返公司

    彭博援引知情人士报道称,OpenAI 的投资者正在向 OpenAI 董事会施压,要求撤销罢免这一决定。上述知情人士还称,微软CEO Satya Nadella一直与阿尔特曼保持联系,并承诺无论阿尔特曼下一步采取什么措施,都会支持他。

    英文报道1:Bloomberg – OpenAI Board Urged by Microsoft, Investors to Restore Altman

    英文报道2:The Verge – OpenAI board in discussions with Sam Altman to return as CEO

    中文报道:科创板日报 – 投资人施压、董事会松口,阿尔特曼或重返OpenAI?

    11月19日 14:25

    OpenAI 内部备忘录:对召回 Altman 和 Brockman 持乐观态度

    知情人士透露,OpenAI首席战略官 Jason Kwon 美国东部时间周六晚上在备忘录中告诉员工,OpenAI 对能够 Sam Altman、Greg Brockman 和其他关键员工重返岗位持“乐观态度”。

    英文报道:The Information – OpenAI ‘Optimistic’ It Can Bring Back Sam Altman, Greg Brockman

    中文报道:腾讯科技 – OpenAI:对召回奥特曼和布罗克曼持乐观态度,周一凌晨揭晓答案

    bomb emoji11月20日·谈判破裂,回归失败
    11月20日 01:34

    马斯克:研发先进AI风险非常高,OpneAI 应公布解雇 Altman 的原因

    特斯拉首席执行官埃隆·马斯克(Elon Musk)表示,由于研发先进人工智能(AI)技术的潜在危险非常高,作为目前世界上最强大的人工智能公司,OpenAI应该解释其解雇其首席执行官 Sam Altman 的原因。
    Elon Musk谈OpenAI

    英文报道:Business Insider – Musk Says Risk of AI so High OpenAI Should Say Why It Fired Sam Altman

    中文报道:网易科技 – 马斯克:研发先进AI风险非常高,OpneAI应公布解雇奥特曼的原因

    11月20日 04:06

    Altman 和 Brockman 抵达 OpenAI 总部,高管们力促恢复两人职位

    一位知情人士称,在 OpenAI 董事会解雇 Sam Altman 两天后,当地时间周日,Sam Altman 在该公司旧金山总部与高管们会合,推动董事会恢复他和其他最近离职的高管的职位。据知情人士透露,临时首席执行官 Mira Murati 早些时候告诉员工,她和领导团队邀请了 Altman。其中一位知情人士称,OpenAI 前董事长兼总裁 Greg Brockman 也在周日抵达办公室。

    英文报道:The Information – Altman, Brockman Arrive at OpenAI Headquarters as Execs Push to Reinstate Them

    中文报道:IT之家 – OpenAI 前 CEO Sam 与前总裁 Greg 在旧金山总部与高管会面

    11月20日 05:03

    Altman 发贴胸前佩戴 OpenAI 的“访客”牌的自拍照

    Altman 在社交媒体X平台上传了一张自己位于 OpenAI 位于旧金山总部的照片,不过,他脖子上佩戴的是OpenAI的“访客”牌,证明其CEO和董事的职位尚未完全恢复。
    Sam Altman自拍身戴访客卡

    11月20日 06:21

    OpenAI 董事会谈判就 Altman 重返公司后董事会的组成和角色问题上陷入僵局

    据知情人士透露,一群OpenAI高管和投资者试图恢复 Sam Altman 首席执行官一职,但在董事会的组成和角色问题上陷入了僵局。尽管谈判仍在进行中,但解决方案可能很快就会出现。OpenAI 领导团队希望解散董事会,但董事们拒绝。董事会指定当地时间下午 5 点为满足 Altman 要求的最后期限。

    英文报道:Bloomberg – OpenAI Leaders’ Efforts to Bring Back Altman Reach Impasse Over Board Role

    中文报道:新浪财经 – OpenAI高管及投资者力主恢复Altman的CEO职务,谈判卡在董事会问题上

    11月20日 08:01

    若 Altman 重返 OpenAI,微软将考虑进入董事会

    据两位知情人士透露,OpenAI 最大的支持者微软正在考虑,如果被罢免的首席执行官 Sam Altman 重返公司,微软将计划在董事会中担任一职。其中一位知情人士表示,微软考虑加入OpenAI的董事会的一员或作为没有投票权的董事会观察员。

    英文报道:The Information – Microsoft Eyes Seat on OpenAI’s Revamped Board

    中文报道:新浪财经 – 消息称如果Altman回归OpenAI,微软考虑在OpenAI获得董事会席位

    11月20日 12:58

    Sam Altman 回归 OpenAI 失败,董事会已任命 Emmett Shear 为临时 CEO

    OpenAI 联合创始人兼董事会董事 Ilya Sutskever 表示,尽管公司高管努力挽回 Sam Altman,但他不会再担任 OpenAI 首席执行官。Sutskever 告诉员工,在与周五解雇他的董事会以及剩余的领导人和顶级投资者进行了一个周末的谈判后,Altman 将不会回到他于 2015 年共同创立的初创公司。Sutskever 表示,亚马逊旗下视频流媒体网站 Twitch 的联合创始人 Emmett Shear 将接任临时首席执行官。

    英文报道:The Information – Emmett Shear Becomes Interim OpenAI CEO as Altman Talks Break Down

    中文报道:IT之家 – 消息称阿尔特曼回归 OpenAI 失败,董事会已任命 Emmett Shear 为临时 CEO

    11月20日 15:53

    微软 CEO:Altman 和 Brockman 将加入微软领导一个新的高级 AI 研究团队

    OpenAI最大股东兼合作伙伴微软的首席执行官纳德拉宣布,OpenAI创始人兼前CEO山姆·奥特曼(Sam Altman)和前总裁格雷格·布洛克曼Greg Brockman)将加入微软。纳德拉表示,奥特曼和布洛克曼及其同事将加入微软,领导一个新的高级AI研究团队。纳德拉还在推文中证实了,埃米特·谢尔(Emmett Shear)将担任OpenAI CEO,“我们期待了解埃米特·谢尔和OAI的新领导团队并与他们合作。”
    微软CEO:Altman和Brockman将加入微软

    英文报道:The Verge – Microsoft hires former OpenAI CEO Sam Altman

    中文报道:澎湃新闻 – 微软CEO:OpenAI创始人奥特曼和布罗克曼将加入微软

    11月20日 17:01

    OpenAI 临时 CEO 承诺将调查 Altman 被罢免一事,并改革管理层

    OpenAI 临时首席执行官 Emmett Shear 周一誓言将聘请一名独立调查员来调查联合创始人萨姆・阿尔特曼(Sam Altman)突然被罢黜一事,并在未来 30 天内改革管理团队,以期在经历了一个戏剧性的周末后恢复人们对这家美国初创公司的信任。
    Emmett Shear发文

    英文报道:Business Insider – OpenAI’s New CEO Reveals Plans for His First 30 Days in 1 a.m. X Post

    中文报道:IT之家 – OpenAI 临时 CEO 承诺将调查阿尔特曼被罢免一事,并改革管理层

    11月20日 18:00

    OpenAI 高管员工集体发文:没有员工,OpenAI 什么也不是

    OpenAI 高管(包括CTO、COO)员工们,在社交平台X上集体刷屏!他们都说了同一句话:OpenAI is nothing without its people。翻译过来:没有员工,OpenAI什么都不是。Sam Altman 转发很多这类帖子,并回复“爱心”。
    OpenAI is nothing without its people

    11月20日 21:15

    Ilya Sutskever 发文:对参与董事会的行动深感后悔

    OpenAI 联合创始人兼首席科学家 Ilya Sutskever 在社交平台X上表示,对参与董事会的行动深感后悔,从未想过要伤害 OpenAI。“我热爱我们共同建立的一切,我会尽我所能让公司重新团聚起来。”
    Ilya Sutskever发文称后悔

    11月20日 21:30

    OpenAI 超 700 名员工签署集体辞职联名信要求恢复 Altman 和 Brockman 的职务

    据外媒 Wired报道,当地时间周一,500 多名(最新已超过700名) OpenAI 员工签署了一封公开信,以集体辞职威胁OpenAI董事会退出,并恢复Sam Altman的首席执行官职务,以及联合创始人Greg Brockman的总裁职务。有趣的是,联名信的签署人中,也包括了 Ilya Sutskever 的名字。

    英文报道:Wired – OpenAI Staff Threaten to Quit Unless Board Resigns

    中文报道:虎嗅 – OpenAI 近 500 名员工签署集体辞职联名信要求恢复 Sam Altman 和 Greg Brockman 的职务

    watch emoji11月21日·余波未了,地震持续
    11月21日 01:57

    OpenAI 超过100名客户联系竞争对手 Anthropic

    据知情人士透露,周末有超过 100 名 OpenAI 客户联系了其竞争对手 Anthropic,这家初创公司近几个月从亚马逊和谷歌筹集了数十亿美元资金。知情人士称,还有其他客户联系了 Google Cloud 和 OpenAI 初创公司竞争对手 Cohere,许多 OpenAI 客户也在考虑转向微软的 Azure 服务,该服务提供 OpenAI 模型和其他模型的副本。

    英文报道:The Information – OpenAI’s Customers Consider Defecting to Anthropic, Microsoft, Google

    中文报道:新浪网 – OpenAI超过100名客户联系竞争对手Anthropic

    11月21日 02:59

    消息称 Altman 仍愿意重回 OpenAI 当 CEO,前提是董事会下台

    Altman 转投微软的交易尚未敲定,Ilya Sutskever 转而支持 Altman 意味着两名董事会成员需要改变主意。多位消息人士告诉 The Verge,如果解雇他的其余董事会成员下台,他和联合创始人 Greg Brockman 仍然愿意重返 OpenAI。

    英文报道:The Verge – Sam Altman is still trying to return as OpenAI CEO

    中文报道:IT之家 – 消息称阿尔特曼仍愿意重回 OpenAI 当 CEO,前提是董事会下台

    11月21日 03:39

    Altman 称与微软 CEO 的首要任务是确保 OpenAI 茁壮成长

    Sam Altman 在社交媒体表示,「Satya和我的顶级优先任务仍然是确保OpenAI继续“茁壮成长”。我们将恪守“向合作伙伴和客户们全面提供运营延续性”的承诺。OpenAI与微软之间的合作伙伴关系让这具有非常高的可行性。」
    Sam Altman发文称优先事项

    11月21日 04:15

    OpenAI 曾试图邀请前 GitHub CEO 和 Scale AI 创始人担任临时 CEO 的职位

    据知情人士透露,在前 Twitch 首席执行官 Emmett Shear 接受 OpenAI 临时首席执行官职位之前,董事会曾邀请 Nat Friedman(微软旗下 GitHub 的前首席执行官、人工智能初创公司的多产投资者)以及 Scale AI 联合创始人兼首席执行官 Alex Wang 担任该职位。知情人士称,两人都拒绝了这一提议。

    英文报道:The Information – Former GitHub CEO Friedman, Scale AI Founder Wang Declined OpenAI Top Job

    11月21日 04:16

    Salesforce CEO 发文邀请从OpenAI辞职的研究人员加入

    Salesforce首席执行官 Marc Benioff 抛出橄榄枝,邀请从OpenAI辞职的研究人员加入。Benioff在X平台发帖称,Salesforce将对从OpenAI辞职的研究人员提供与之前相匹配的薪酬待遇。Benioff邀请这些员工加入Silvio Savarese领导的Salesforce Einstein Trusted AI研究团队。
    Marc Benioff发文

    11月21日 06:38

    消息称 OpenAI 投资者正考虑起诉公司董事会

    路透社援引知情人士的话透露,OpenAI 部分投资者正考虑对公司董事会采取法律行动,目前正在与法律顾问进行探讨。投资者担心他们投资 OpenAI 的数亿美元可能会遭受“灾难性损失”,因为这家热门企业似乎正面临崩溃的风险。

    英文报道:Reuters – OpenAI investors considering suing the board after CEO’s abrupt firing

    中文报道:IT之家 – 消息称 OpenAI 投资者正考虑起诉公司董事会

    11月21日 06:54

    Altman 仍可能重返OpenAI,微软CEO表态:对此持开放态度

    微软首席执行官萨蒂亚·纳德拉日前表示,他对Sam Altman重返OpenAI持开放态度;纳德拉表示,无论Altman是加入微软还是回到OpenAI,这位企业家都将与微软合作;他还表示,无论怎样,OpenAI都需要改革治理方式。

    英文报道:CNBC – Microsoft CEO Nadella says OpenAI governance needs to change no matter where Altman ends up

    中文报道:财联社 – 奥特曼仍可能重返OpenAI 微软CEO表态:对此持开放态度

    11月21日 09:25

    OpenAI 董事会曾联系竞争对手 Anthropic 讨论合并

    据媒体援引知情人士说法称,在开除掉Sam Altman之后,OpenAI董事会曾与其主要竞争对手、明星AI初创公司Anthropic联合创始人兼CEO Dario Amodei探讨两家公司合并事宜。知情人士表示,OpenAI董事会试图说服Dario Amodei接任OpenAI CEO的位置,所以谈到了合并的事情。但Amodei拒绝了该提议。

    英文报道:The Information – OpenAI’s Board Approached Anthropic About Merger

    中文报道:华尔街见闻 – OpenAI董事会曾联系竞争对手Anthropic讨论合并

    11月21日 13:11

    OpenAI 正在积极讨论“重新团聚”公司事宜

    据 OpenAI 全球事务副总裁 Anna Makanju 周一在给员工的备忘录中显示,OpenAI 正在进行积极讨论,以 “重新团聚” 公司。OpenAI 员工正与创始人Sam Altman“保持联系”,与CEO、董事会“进行接触”。OpenAI 表示,我们的头号目标是 OpenAI 重新团结。

    英文报道:Bloomberg – OpenAI in ‘Intense Discussions’ to Quell Potential Mutiny

    中文报道:新浪财经 – 备忘录:OpenAI正在积极讨论“重新团聚”事宜

    rolercoaster emoji11月22日·再度反转,确认回归
    11月22日 01:40

    OpenAI 董事会据称正与 Sam Altman 就回归进行谈判

    据媒体报道,OpenAI联合创始人、前CEO山姆·奥特曼和该公司董事会成员已开始谈判,双方在探讨奥特曼重返OpenAI的可能性。一位知情人士表示,目前正在讨论的一种情况是,奥特曼将以过渡董事会的董事身份回归OpenAI。

    英文报道:Bloomberg – Sam Altman, OpenAI Board Open Talks to Negotiate His Possible Return

    中文报道:财联社 – 奥特曼“王者归来”?OpenAI董事会据称正与其就回归进行谈判

    11月22日 04:06

    微软为 OpenAI 员工涌入做好公司办公方面的准备

    据海外科技媒体Axios最新报道,微软正在为迎接Sam Altman和OpenAI员工们做准备,包括腾出办公空间、配备计算资源等。据知情人士透露,微软正在旗下领英(LinkedIn)的旧金山办公室设立出一块办公场所,值得一提的是,此地距离OpenAI在旧金山的主楼只有10分钟的车程。

    英文报道:Axios – Microsoft prepares for influx of OpenAI employees

    中文报道:财联社 – 微软为OpenAI员工敞开怀抱!据称已腾出办公地、配备计算机

    11月22日 05:49

    OpenAI 鼓励员工在董事会混乱的情况下专注于工作

    OpenAI产品副总裁Peter Deng周二在致员工的信中称,是时候“重新启航”了。此举是为了让公司专注于软件开发和建立合作伙伴关系,而不是围绕上周五被董事会解雇的奥特曼是否会重返首席执行官一职而上演的“他会不会回来”的大剧。Deng在信中表示,“引导我们精力的最佳方式”是开发人工智能产品。

    英文报道:Bloomberg – OpenAI Encourages Staff to Focus on Work Despite Boardroom Chaos

    中文报道:财联社 – OpenAI 产品副总裁呼吁员工回公司上班

    11月22日 07:23

    在 Altman 下台之前,OpenAI 董事会已经开始分裂且争斗不断

    据纽约时报报道,在 Sam Altman 上周被 OpenAI 驱逐之前,他和公司董事会已经争吵了一年多。随着 OpenAI 因其流行的 ChatGPT 聊天机器人而成为主流名称,董事会紧张局势变得更加严重。Sam Altman 在被免去首席执行官职务几周前称 OpenAI 董事会成员 Helen Toner 与他人共同撰写的一篇研究论文批评了公司,驱逐了该董事会成员。

    英文报道1:The New York Times – Before Altman’s Ouster, OpenAI’s Board Was Divided and Feuding

    英文报道2:The Information – Altman Argued With OpenAI Board Member Toner Before Ouster

    11月22日 07:57

    微软正在讨论一份计划要求 OpenAI 董事会进行的治理改革清单

    据知情人士称,微软正在讨论一份计划要求OpenAI董事会进行的治理改革清单,以改善董事会的运作,并防止微软在OpenAI未来的重大战略举措中再次被搞得措手不及。已经提出聘请奥特曼的微软表示,只要满足某些条件,愿意让奥特曼重返OpenAI。而无论结局如何,微软都希望解决导致现有OpenAI董事会解雇奥特曼的治理问题。

    英文报道:Bloomberg – Microsoft Is Discussing Governance Changes It Wants From OpenAI

    中文报道:财联社 – 被“先斩后奏”惹恼了!微软欲插手改造OpenAI董事会

    11月22日 14:03

    OpenAI:Altman 将重返公司任CEO,美国前财长加入新董事会

    OpenAI在社交平台X上宣布,已经原则上达成协议,Altman 将重返公司担任CEO。新的董事会名单显示,只保留了Quora的首席执行官 Adam D’Angelo,Salesforce前联合首席执行官布 Bret Taylor 和前美国财政部长 Larry Summers 加入新成立的董事会。
    OpenAI Sam Altman回归

    相关报道:科创板日报 – OpenAI官宣奥特曼重回公司担任CEO,董事会启动“重置”

    rolercoaster emoji11月22日·再度反转,确认回归
    11月22日 14:03

    OpenAI:Altman 将重返公司任CEO,美国前财长加入新董事会

    OpenAI在社交平台X上宣布,已经原则上达成协议,Altman 将重返公司担任CEO。新的董事会名单显示,只保留了Quora的首席执行官 Adam D’Angelo,Salesforce前联合首席执行官布 Bret Taylor 和前美国财政部长 Larry Summers 加入新成立的董事会。
    OpenAI Sam Altman回归

    相关报道:科创板日报 – OpenAI官宣奥特曼重回公司担任CEO,董事会启动“重置”

    11月22日 07:57

    微软正在讨论一份计划要求 OpenAI 董事会进行的治理改革清单

    据知情人士称,微软正在讨论一份计划要求OpenAI董事会进行的治理改革清单,以改善董事会的运作,并防止微软在OpenAI未来的重大战略举措中再次被搞得措手不及。已经提出聘请奥特曼的微软表示,只要满足某些条件,愿意让奥特曼重返OpenAI。而无论结局如何,微软都希望解决导致现有OpenAI董事会解雇奥特曼的治理问题。

    英文报道:Bloomberg – Microsoft Is Discussing Governance Changes It Wants From OpenAI

    中文报道:财联社 – 被“先斩后奏”惹恼了!微软欲插手改造OpenAI董事会

    11月22日 07:23

    在 Altman 下台之前,OpenAI 董事会已经开始分裂且争斗不断

    据纽约时报报道,在 Sam Altman 上周被 OpenAI 驱逐之前,他和公司董事会已经争吵了一年多。随着 OpenAI 因其流行的 ChatGPT 聊天机器人而成为主流名称,董事会紧张局势变得更加严重。Sam Altman 在被免去首席执行官职务几周前称 OpenAI 董事会成员 Helen Toner 与他人共同撰写的一篇研究论文批评了公司,驱逐了该董事会成员。

    英文报道1:The New York Times – Before Altman’s Ouster, OpenAI’s Board Was Divided and Feuding

    英文报道2:The Information – Altman Argued With OpenAI Board Member Toner Before Ouster

    11月22日 05:49

    OpenAI 鼓励员工在董事会混乱的情况下专注于工作

    OpenAI产品副总裁Peter Deng周二在致员工的信中称,是时候“重新启航”了。此举是为了让公司专注于软件开发和建立合作伙伴关系,而不是围绕上周五被董事会解雇的奥特曼是否会重返首席执行官一职而上演的“他会不会回来”的大剧。Deng在信中表示,“引导我们精力的最佳方式”是开发人工智能产品。

    英文报道:Bloomberg – OpenAI Encourages Staff to Focus on Work Despite Boardroom Chaos

    中文报道:财联社 – OpenAI 产品副总裁呼吁员工回公司上班

    11月22日 04:06

    微软为 OpenAI 员工涌入做好公司办公方面的准备

    据海外科技媒体Axios最新报道,微软正在为迎接Sam Altman和OpenAI员工们做准备,包括腾出办公空间、配备计算资源等。据知情人士透露,微软正在旗下领英(LinkedIn)的旧金山办公室设立出一块办公场所,值得一提的是,此地距离OpenAI在旧金山的主楼只有10分钟的车程。

    英文报道:Axios – Microsoft prepares for influx of OpenAI employees

    中文报道:财联社 – 微软为OpenAI员工敞开怀抱!据称已腾出办公地、配备计算机

    11月22日 01:40

    OpenAI 董事会据称正与 Sam Altman 就回归进行谈判

    据媒体报道,OpenAI联合创始人、前CEO山姆·奥特曼和该公司董事会成员已开始谈判,双方在探讨奥特曼重返OpenAI的可能性。一位知情人士表示,目前正在讨论的一种情况是,奥特曼将以过渡董事会的董事身份回归OpenAI。

    英文报道:Bloomberg – Sam Altman, OpenAI Board Open Talks to Negotiate His Possible Return

    中文报道:财联社 – 奥特曼“王者归来”?OpenAI董事会据称正与其就回归进行谈判

    watch emoji11月21日·余波未了,地震持续
    11月21日 13:11

    OpenAI 正在积极讨论“重新团聚”公司事宜

    据 OpenAI 全球事务副总裁 Anna Makanju 周一在给员工的备忘录中显示,OpenAI 正在进行积极讨论,以 “重新团聚” 公司。OpenAI 员工正与创始人Sam Altman“保持联系”,与CEO、董事会“进行接触”。OpenAI 表示,我们的头号目标是 OpenAI 重新团结。

    英文报道:Bloomberg – OpenAI in ‘Intense Discussions’ to Quell Potential Mutiny

    中文报道:新浪财经 – 备忘录:OpenAI正在积极讨论“重新团聚”事宜

    11月21日 09:25

    OpenAI 董事会曾联系竞争对手 Anthropic 讨论合并

    据媒体援引知情人士说法称,在开除掉Sam Altman之后,OpenAI董事会曾与其主要竞争对手、明星AI初创公司Anthropic联合创始人兼CEO Dario Amodei探讨两家公司合并事宜。知情人士表示,OpenAI董事会试图说服Dario Amodei接任OpenAI CEO的位置,所以谈到了合并的事情。但Amodei拒绝了该提议。

    英文报道:The Information – OpenAI’s Board Approached Anthropic About Merger

    中文报道:华尔街见闻 – OpenAI董事会曾联系竞争对手Anthropic讨论合并

    11月21日 06:54

    Altman 仍可能重返OpenAI,微软CEO表态:对此持开放态度

    微软首席执行官萨蒂亚·纳德拉日前表示,他对Sam Altman重返OpenAI持开放态度;纳德拉表示,无论Altman是加入微软还是回到OpenAI,这位企业家都将与微软合作;他还表示,无论怎样,OpenAI都需要改革治理方式。

    英文报道:CNBC – Microsoft CEO Nadella says OpenAI governance needs to change no matter where Altman ends up

    中文报道:财联社 – 奥特曼仍可能重返OpenAI 微软CEO表态:对此持开放态度

    11月21日 06:38

    消息称 OpenAI 投资者正考虑起诉公司董事会

    路透社援引知情人士的话透露,OpenAI 部分投资者正考虑对公司董事会采取法律行动,目前正在与法律顾问进行探讨。投资者担心他们投资 OpenAI 的数亿美元可能会遭受“灾难性损失”,因为这家热门企业似乎正面临崩溃的风险。

    英文报道:Reuters – OpenAI investors considering suing the board after CEO’s abrupt firing

    中文报道:IT之家 – 消息称 OpenAI 投资者正考虑起诉公司董事会

    11月21日 04:16

    Salesforce CEO 发文邀请从OpenAI辞职的研究人员加入

    Salesforce首席执行官 Marc Benioff 抛出橄榄枝,邀请从OpenAI辞职的研究人员加入。Benioff在X平台发帖称,Salesforce将对从OpenAI辞职的研究人员提供与之前相匹配的薪酬待遇。Benioff邀请这些员工加入Silvio Savarese领导的Salesforce Einstein Trusted AI研究团队。
    Marc Benioff发文

    11月21日 04:15

    OpenAI 曾试图邀请前 GitHub CEO 和 Scale AI 创始人担任临时 CEO 的职位

    据知情人士透露,在前 Twitch 首席执行官 Emmett Shear 接受 OpenAI 临时首席执行官职位之前,董事会曾邀请 Nat Friedman(微软旗下 GitHub 的前首席执行官、人工智能初创公司的多产投资者)以及 Scale AI 联合创始人兼首席执行官 Alex Wang 担任该职位。知情人士称,两人都拒绝了这一提议。

    英文报道:The Information – Former GitHub CEO Friedman, Scale AI Founder Wang Declined OpenAI Top Job

    11月21日 03:39

    Altman 称与微软 CEO 的首要任务是确保 OpenAI 茁壮成长

    Sam Altman 在社交媒体表示,「Satya和我的顶级优先任务仍然是确保OpenAI继续“茁壮成长”。我们将恪守“向合作伙伴和客户们全面提供运营延续性”的承诺。OpenAI与微软之间的合作伙伴关系让这具有非常高的可行性。」
    Sam Altman发文称优先事项

    11月21日 02:59

    消息称 Altman 仍愿意重回 OpenAI 当 CEO,前提是董事会下台

    Altman 转投微软的交易尚未敲定,Ilya Sutskever 转而支持 Altman 意味着两名董事会成员需要改变主意。多位消息人士告诉 The Verge,如果解雇他的其余董事会成员下台,他和联合创始人 Greg Brockman 仍然愿意重返 OpenAI。

    英文报道:The Verge – Sam Altman is still trying to return as OpenAI CEO

    中文报道:IT之家 – 消息称阿尔特曼仍愿意重回 OpenAI 当 CEO,前提是董事会下台

    11月21日 01:57

    OpenAI 超过100名客户联系竞争对手 Anthropic

    据知情人士透露,周末有超过 100 名 OpenAI 客户联系了其竞争对手 Anthropic,这家初创公司近几个月从亚马逊和谷歌筹集了数十亿美元资金。知情人士称,还有其他客户联系了 Google Cloud 和 OpenAI 初创公司竞争对手 Cohere,许多 OpenAI 客户也在考虑转向微软的 Azure 服务,该服务提供 OpenAI 模型和其他模型的副本。

    英文报道:The Information – OpenAI’s Customers Consider Defecting to Anthropic, Microsoft, Google

    中文报道:新浪网 – OpenAI超过100名客户联系竞争对手Anthropic

    bomb emoji11月20日·谈判破裂,回归失败
    11月20日 21:30

    OpenAI 超 700 名员工签署集体辞职联名信要求恢复 Altman 和 Brockman 的职务

    据外媒 Wired报道,当地时间周一,500 多名(最新已超过700名) OpenAI 员工签署了一封公开信,以集体辞职威胁OpenAI董事会退出,并恢复Sam Altman的首席执行官职务,以及联合创始人Greg Brockman的总裁职务。有趣的是,联名信的签署人中,也包括了 Ilya Sutskever 的名字。

    英文报道:Wired – OpenAI Staff Threaten to Quit Unless Board Resigns

    中文报道:虎嗅 – OpenAI 近 500 名员工签署集体辞职联名信要求恢复 Sam Altman 和 Greg Brockman 的职务

    11月20日 21:15

    Ilya Sutskever 发文:对参与董事会的行动深感后悔

    OpenAI 联合创始人兼首席科学家 Ilya Sutskever 在社交平台X上表示,对参与董事会的行动深感后悔,从未想过要伤害 OpenAI。“我热爱我们共同建立的一切,我会尽我所能让公司重新团聚起来。”
    Ilya Sutskever发文称后悔

    11月20日 18:00

    OpenAI 高管员工集体发文:没有员工,OpenAI 什么也不是

    OpenAI 高管(包括CTO、COO)员工们,在社交平台X上集体刷屏!他们都说了同一句话:OpenAI is nothing without its people。翻译过来:没有员工,OpenAI什么都不是。Sam Altman 转发很多这类帖子,并回复“爱心”。
    OpenAI is nothing without its people

    11月20日 17:01

    OpenAI 临时 CEO 承诺将调查 Altman 被罢免一事,并改革管理层

    OpenAI 临时首席执行官 Emmett Shear 周一誓言将聘请一名独立调查员来调查联合创始人萨姆・阿尔特曼(Sam Altman)突然被罢黜一事,并在未来 30 天内改革管理团队,以期在经历了一个戏剧性的周末后恢复人们对这家美国初创公司的信任。
    Emmett Shear发文

    英文报道:Business Insider – OpenAI’s New CEO Reveals Plans for His First 30 Days in 1 a.m. X Post

    中文报道:IT之家 – OpenAI 临时 CEO 承诺将调查阿尔特曼被罢免一事,并改革管理层

    11月20日 15:53

    微软 CEO:Altman 和 Brockman 将加入微软领导一个新的高级 AI 研究团队

    OpenAI最大股东兼合作伙伴微软的首席执行官纳德拉宣布,OpenAI创始人兼前CEO山姆·奥特曼(Sam Altman)和前总裁格雷格·布洛克曼Greg Brockman)将加入微软。纳德拉表示,奥特曼和布洛克曼及其同事将加入微软,领导一个新的高级AI研究团队。纳德拉还在推文中证实了,埃米特·谢尔(Emmett Shear)将担任OpenAI CEO,“我们期待了解埃米特·谢尔和OAI的新领导团队并与他们合作。”
    微软CEO:Altman和Brockman将加入微软

    英文报道:The Verge – Microsoft hires former OpenAI CEO Sam Altman

    中文报道:澎湃新闻 – 微软CEO:OpenAI创始人奥特曼和布罗克曼将加入微软

    11月20日 12:58

    Sam Altman 回归 OpenAI 失败,董事会已任命 Emmett Shear 为临时 CEO

    OpenAI 联合创始人兼董事会董事 Ilya Sutskever 表示,尽管公司高管努力挽回 Sam Altman,但他不会再担任 OpenAI 首席执行官。Sutskever 告诉员工,在与周五解雇他的董事会以及剩余的领导人和顶级投资者进行了一个周末的谈判后,Altman 将不会回到他于 2015 年共同创立的初创公司。Sutskever 表示,亚马逊旗下视频流媒体网站 Twitch 的联合创始人 Emmett Shear 将接任临时首席执行官。

    英文报道:The Information – Emmett Shear Becomes Interim OpenAI CEO as Altman Talks Break Down

    中文报道:IT之家 – 消息称阿尔特曼回归 OpenAI 失败,董事会已任命 Emmett Shear 为临时 CEO

    11月20日 08:01

    若 Altman 重返 OpenAI,微软将考虑进入董事会

    据两位知情人士透露,OpenAI 最大的支持者微软正在考虑,如果被罢免的首席执行官 Sam Altman 重返公司,微软将计划在董事会中担任一职。其中一位知情人士表示,微软考虑加入OpenAI的董事会的一员或作为没有投票权的董事会观察员。

    英文报道:The Information – Microsoft Eyes Seat on OpenAI’s Revamped Board

    中文报道:新浪财经 – 消息称如果Altman回归OpenAI,微软考虑在OpenAI获得董事会席位

    11月20日 06:21

    OpenAI 董事会谈判就 Altman 重返公司后董事会的组成和角色问题上陷入僵局

    据知情人士透露,一群OpenAI高管和投资者试图恢复 Sam Altman 首席执行官一职,但在董事会的组成和角色问题上陷入了僵局。尽管谈判仍在进行中,但解决方案可能很快就会出现。OpenAI 领导团队希望解散董事会,但董事们拒绝。董事会指定当地时间下午 5 点为满足 Altman 要求的最后期限。

    英文报道:Bloomberg – OpenAI Leaders’ Efforts to Bring Back Altman Reach Impasse Over Board Role

    中文报道:新浪财经 – OpenAI高管及投资者力主恢复Altman的CEO职务,谈判卡在董事会问题上

    11月20日 05:03

    Altman 发贴胸前佩戴 OpenAI 的“访客”牌的自拍照

    Altman 在社交媒体X平台上传了一张自己位于 OpenAI 位于旧金山总部的照片,不过,他脖子上佩戴的是OpenAI的“访客”牌,证明其CEO和董事的职位尚未完全恢复。
    Sam Altman自拍身戴访客卡

    11月20日 04:06

    Altman 和 Brockman 抵达 OpenAI 总部,高管们力促恢复两人职位

    一位知情人士称,在 OpenAI 董事会解雇 Sam Altman 两天后,当地时间周日,Sam Altman 在该公司旧金山总部与高管们会合,推动董事会恢复他和其他最近离职的高管的职位。据知情人士透露,临时首席执行官 Mira Murati 早些时候告诉员工,她和领导团队邀请了 Altman。其中一位知情人士称,OpenAI 前董事长兼总裁 Greg Brockman 也在周日抵达办公室。

    英文报道:The Information – Altman, Brockman Arrive at OpenAI Headquarters as Execs Push to Reinstate Them

    中文报道:IT之家 – OpenAI 前 CEO Sam 与前总裁 Greg 在旧金山总部与高管会面

    11月20日 01:34

    马斯克:研发先进AI风险非常高,OpneAI 应公布解雇 Altman 的原因

    特斯拉首席执行官埃隆·马斯克(Elon Musk)表示,由于研发先进人工智能(AI)技术的潜在危险非常高,作为目前世界上最强大的人工智能公司,OpenAI应该解释其解雇其首席执行官 Sam Altman 的原因。
    Elon Musk谈OpenAI

    英文报道:Business Insider – Musk Says Risk of AI so High OpenAI Should Say Why It Fired Sam Altman

    中文报道:网易科技 – 马斯克:研发先进AI风险非常高,OpneAI应公布解雇奥特曼的原因

    helicopter emoji11月19日·外部施压,回归有望
    11月19日 14:25

    OpenAI 内部备忘录:对召回 Altman 和 Brockman 持乐观态度

    知情人士透露,OpenAI首席战略官 Jason Kwon 美国东部时间周六晚上在备忘录中告诉员工,OpenAI 对能够 Sam Altman、Greg Brockman 和其他关键员工重返岗位持“乐观态度”。

    英文报道:The Information – OpenAI ‘Optimistic’ It Can Bring Back Sam Altman, Greg Brockman

    中文报道:腾讯科技 – OpenAI:对召回奥特曼和布罗克曼持乐观态度,周一凌晨揭晓答案

    11月19日 06:44

    OpenAI 的投资者正在向董事会施压,要求 Sam Altman 重返公司

    彭博援引知情人士报道称,OpenAI 的投资者正在向 OpenAI 董事会施压,要求撤销罢免这一决定。上述知情人士还称,微软CEO Satya Nadella一直与阿尔特曼保持联系,并承诺无论阿尔特曼下一步采取什么措施,都会支持他。

    英文报道1:Bloomberg – OpenAI Board Urged by Microsoft, Investors to Restore Altman

    英文报道2:The Verge – OpenAI board in discussions with Sam Altman to return as CEO

    中文报道:科创板日报 – 投资人施压、董事会松口,阿尔特曼或重返OpenAI?

    11月19日 03:46

    Sam Altman 计划创办一个新的 AI 企业

    据一位知情人士透露,最近被赶下台的 OpenAI 首席执行官 Sam Altman 一直告诉投资者,他计划推出一家新的人工智能企业。该人士表示,OpenAI 前总裁 Greg Brockman 预计也将加入该公司,该项目仍在开发中。目前尚不清楚该合资企业的确切性质,可能是一家人工智能芯片公司。

    英文报道:The Information – OpenAI Co-Founder Altman Plans New AI Venture

    中文报道:腾讯科技 – 传奥特曼早已在筹划创办新初创公司,孙正义或是背后投资人

    11月19日 02:53

    Sam Altman 被解雇后,OpenAI 的 860 亿美元股票出售陷入困境

    据一位知情人士透露,此前由 Thrive Capital 牵头的以 860 亿美元估值对 OpenAI 进行的要约收购尚未结束,但已进入最后阶段,预计最快下个月完成。截至周六,三名计划参与招标的前 OpenAI 员工表示,他们不再预计此次出售会发生,或者即使发生,由于最近发生的事态发展,其估值也会较低。

    英文报道:The Information – OpenAI’s $86 Billion Share Sale in Jeopardy Following Altman Firing

    11月19日 01:57

    OpenAI 内部备忘录称 Sam Altman 被解雇背后不存在“渎职”

    据 Axios 报道,根据 OpenAI 首席运营官 Brad Lightcap 的一份内部备忘录,OpenAI 首席执行官 Sam Altman 被解雇并不是因为“渎职或与我们的财务、业务、安全或安全/隐私实践相关的任何事情”,而是因为“Sam Altman 与董事会之间的沟通中断”。

    英文报道:Axios – No “malfeasance” behind Sam Altman’s firing, OpenAI memo says

    中文报道:财联社 – OpenAI备忘录称Sam Altman被解雇背后不存在“渎职”

    fire emoji11月18日·罢免开端,人事动荡
    11月18日 14:41

    消息称:三名 OpenAI 高级研究人员宣布辞职

    据 The Information 报道,三名 OpenAI 高级研究人员宣布辞职,称受到了 OpenAI 原 CEO Sam Altman 被解雇、总裁Greg・Brockman 突然辞职的影响。这三位高级研究人员包括公司研究主管雅库布・帕乔基(Jakub Pachocki)、评估 AI 潜在风险的团队负责人亚历山大・马德里(Aleksander Madry)和已经供职 7 年时间的研究员西蒙・西多尔(Szymon Sidor)。

    英文报道:The Information – Three Senior OpenAI Researchers Resign as Crisis Deepens

    中文报道:IT之家 – 继 CEO、总裁之后,消息称又有三名 OpenAI 高级研究人员宣布辞职

    11月18日 13:32

    Sam Altman 发声:若自己“开火”,董事会将索赔

    在早些时候被 OpenAI 罢免的原 CEO Sam Altman 再度在 X 平台发文宣称,如果自己“开火”,OpenAI 的董事会将向他追讨自己所持股票的全部价值。(if i start going off, the openai board should go after me for the full value of my shares)
    Sam Altman 二次发声

    11月18日 12:42

    Greg Brockman 发文谈 Altman 被罢免风波的细节

    Greg Brockman 发文透露,昨晚,Altman 收到公司首席科学家 Ilya Sutskever 发来的短信,要求周五中午谈话。Sutskever 告诉 Altman 他将被解雇,并且消息很快传出。周五中午12点23分,Sutskever 发送了一条 Google Meet 会议链接,Brockman 被告知,他将被从董事会中除名,而 Altman 已被解雇。Brcokman 也被解除了董事会主席职务(但没有被公司开除),随后,他宣布自己将从公司离职。据 Brockman 了解,公司 CTO Mira Murati 是在周四晚上就知道了公司的决定,除此之外他们都是被临时通知的。
    Greg Brockman 谈细节

    11月18日 08:09

    OpenAI 联合创始人兼董事长 Greg Brockman 宣布将辞职

    Greg Brockman 在 X 平台发推:“根据今天的消息,我辞职了。” 回应的全文内容:“自从 8 年前在我的公寓开始工作以来,我对我们大家一起建造的东西感到非常自豪。我们一起经历了艰难而又美好的时光,尽管有种种原因,但我们还是取得了如此多的成就。但根据今天的新闻,我辞职了。真诚地祝愿你们一切顺利。我仍然坚信创造造福全人类的安全通用人工智能的使命。”
    Greg Brockman宣布辞职

    11月18日 07:25

    微软 CEO 回应:将继续致力于与 OpenAI 的长期合作

    微软 CEO Satya Nadella 发文称:“正如您本周在 Microsoft Ignite 上看到的那样,我们将继续为这个 AI 时代快速创新,在整个技术堆栈中发布了 100 多项公告 – 从 Azure 中的 AI 系统、模型和工具到 Copilot。最重要的是,我们致力于为我们的客户提供所有这些,同时构建未来。我们与 OpenAI 签订了长期协议,可以完全访问我们实现创新议程和令人兴奋的产品路线图所需的一切,并继续致力于维持Mira 及其团队的合作伙伴关系。我们将共同努力,继续为世界带来这项技术的有意义的好处。”
    微软CEO的回复

    11月18日 05:48

    OpenAI 将在 CEO 离职后召开全体员工大会

    据知情人士透露,在 OpenAI 决定解雇首席执行官Sam Altman之后,该公司刚被任命的临时首席执行官Mira Murati及其团队将于当地时间周五下午向公司员工发表讲话。公司希望能够消除员工对公司未来融资前景等问题的忧虑。

    相关报道:财联社 – OpenAI将在CEO离职后召开全体员工大会

    11月18日 05:46

    Sam Altman 回应:稍后会说明更多情况

    Sam Altman 在 X 平台发推:“我很喜欢在 OpenAI 的时光。这对我个人来说是变革性的,希望对世界也有一点变革。最重要的是,我喜欢与这些才华横溢的人一起工作。稍后会说明更多情况。”
    Sam Altman response

    11月18日 05:21

    谷歌前 CEO 发文谈 OpenAI 首席执行官离职

    谷歌前 CEO 施密特发文,感谢Altman为人工智能做出的贡献。施密特表示,“Sam Altman是我心目中的英雄。他将一家公司从一无所有发展到价值 900 亿美元,并永远改变了我们的集体世界。我迫不及待地想看看他接下来会做什么。我和数十亿人将从他未来的工作中受益——这将是令人难以置信的。谢谢你为我们所有人所做的一切。”
    Eric Schimidt感谢Sam Altman

    11月18日 04:28

    OpenAI 突然罢免 CEO Sam Altman,董事会称对其领导能力失去信心

    OpenAI 发布公告宣布,Sam Altman 将辞去首席执行官一职,并退出董事会,首席技术官 Mira Murati 被任命为临时首席执行官。此外,Greg Brockman 将辞去董事会主席职务,并继续担任公司职务。OpenAI表示:“在 Altman 离职之前,董事会进行了审慎的审查,得出的结论是,他在与董事会的沟通中并不坦诚,阻碍了他履行职责的能力,董事会也不再相信他继续领导 OpenAI 的能力。”
    OpenAI Leadership Transition

    公告全文:OpenAI announces leadership transition

  • 10款免费好用的AI文本转语音的工具和网站,智能合成配音

    近年来,由于人工智能和机器学习的发展,文本到语音(TTS)技术得到了快速发展,AI合成的声音现在听起来比以往任何时候都更逼真、更自然。在本篇文章中,我们将介绍10个好用的的免费AI文本转语音工具,这些工具提供高质量的语音、可定制的功能以及文本到语音的轻松转换。

    魔音工坊

    魔音工坊是由出门问问推出的一款专业的配音工具和高效多人音频协同创作工具,可以智能将文字转换成语音,支持多种语言和语音风格,包括中文、英文、日语、韩语等。该工具集成了先进的深度学习技术,可以根据不同的文本内容和语境,生成自然流畅的语音。用户可以在魔音工坊官网上输入需要转换的文字内容,选择喜欢的语音风格和声音类型,点击“朗读”按钮,即可快速将文字转换成语音。

    魔音工坊

    产品功能:

    • 海量声音。提供1300+声音风格、800+覆盖音色、16国语言、15种方言;
    • 软件配音。支持逐句试听、多音字、停顿、重读、局部变速、多发音人、等近20个调音功能;
    • 云剪辑。集文案生成、配音生成、视频剪辑于一身。还具备实视频实时录制、文案提取等功能;
    • 自动打轴。真人配音和软件配音,一键完美对齐文案。自动化处理,精准识别声音与文案的对齐;
    • 捏声音。通过简单的文本描述,可以为用户提供个性化的声音服务,例如克隆用户自己的声音。

    讯飞智作

    讯飞智作是由科大讯飞推出的一款AI文本转语音的工具,集成了多项高级技术,包括语音合成、语音识别、语音翻译、语音转写和声纹识别等。它可以将文字转换成可供播放的自然语音,并提供多种语音合成方案和发音人选择。用户可以在打开讯飞智作官网后,点击“讯飞配音”菜单进入语音合成页面,输入需要转换的文字内容,选择喜欢的发音人和性别,调整语速和音调等参数,然后点击“生成音频”,等待几秒钟,即可将文字转换成语音。

    讯飞智作

    产品功能:

    • 双端支持。讯飞配音支持Android、web双端使用,用户可根据实际需求自由选择制作路径;
    • 多样发音人。多个中外语种,更有有声阅读、新闻播报、纪录片、视频解说等多种风格;
    • 效果编辑。支持音量、语速、语调调节,并可通过插入换气、连续、停顿等标记,调整合成韵律。

    MiniMax Audio

    MiniMax Audio是MiniMax推出的AI语音合成工具,支持创建逼真的多语言、多声音和多情感的语音。能将文本快速转换为自然流畅的语音。只需提供30秒的音频素材,可克隆特定人的声音,支持12种语言,包括中文、粤语、英语等。提供六种情绪的语音合成,如开心、生气、悲伤等。

    MiniMax Audio

    产品功能:

    • 文本转语音(TTS):将文本转换为自然流畅的语音,支持多种语言和方言,包括普通话、粤语、英语、日语、韩语等。
    • 声音克隆:提供30秒音频样本,可快速克隆特定人的声音,捕捉细微的情感和语调。
    • 情感支持:提供六种情绪的语音合成,如开心、生气、悲伤等,使语音更具真实感。
    • 多语言支持:支持12种语言的声音克隆,满足不同语言用户的需求。
    • 降噪选项:帮助用户剔除背景噪音,提升语音质量。
    • 超长文本合成:支持单次合成最高1000万字符输入,适用于超长文本场景。
    • 定制化音色:能复刻数千种音色特征,生成无限声音变体、情感与风格。
    • 实时语音生成:支持流式语音输出,减少等待时间,适用于直播、对话等实时场景。

    腾讯智影

    腾讯智影是由腾讯推出的一款AI智能创作工具,融合了AI数字人、文本配音TTS、文章转视频等多项AIGC能力。其文字转语音工具提供了丰富的配音,还可以定制你的专属音色。

    腾讯智影文字配音

    产品功能:

    • 支持复制粘贴文字内容,或可以本地上传.doc、.pdf、.txt等多种类型文件导入转换;
    • 海量音色可选,目前文本配音支持一百多种音色,更有东北话、天津话等多地方言供用户选择,还可以调整朗读速度和音量和情绪;
    • 提供细节的调整功能,包含插入停顿、局部变速、词组连读、识别多音字、批量替换等;
    • 字幕下载,可以在合成音频前下载配套字幕文件,字幕文件为.srt格式,方便和生成的配音音频搭配后进入剪辑器进行后续制作;
    • 每天提供免费20次的使用额度,签到也能获得可用于抵扣的金币。

    悦音配音

    悦音配音是制片帮旗下推出的一款AI智能在线配音语音合成工具,可以帮助用户在线将文字输入快速轻松转换成语音。该AI配音工具提供男声、女声、童声、普通话、方言、英文等多种真人声音,在你输入文字后便可以直接智能生成音频。

    悦音配音官网

    产品功能:

    • 媲美真人的AI智能配音,海量音色库提供不同风格的男声、女声和童音;
    • 支持多种语种和方言的配音,包括普通话、英文、方言和其他多语言;
    • AI智能违禁词检测,提供行业内最新广告法,各平台敏感词,通用、新闻等违禁词在线查询检测;
    • 适用于短视频、政企宣传、教育培训、动漫、有声读物、影视广告、产品介绍、情感电台等数百个行业场景。

    Speechify

    Speechify是一个知名度很高的文字转语音的工具,累计已超过2000万人使用,该工具使用用智能的文本转语音技术,可以轻松朗读任何文档、文章、书籍、PDF和电子邮件。只需输入你想听到的文字,选择语音和收听速度,点击生成,即可快速将文字转换成语音。

    Speechify

    产品功能:

    • 支持多个终端和系统使用。Speechify 提供在线网页版、Android、iPhone、iPad和Chrome扩展,用户可以在任何设备上使用;
    • 声音自然。阅读的声音听起来很流畅,更像人类,方便他人理解并记住更多的内容;
    • 可嵌入网站上。提供小部件以嵌入在网站上,访客可直接将网页文字内容转换为语音;

    Uberduck

    Uberduck是一个开源的AI语音生成和合成的社区,使用先进的人工智能技术将书面文本转换为高质量的合成语音。该平台提供了超过5000多种声音帮助用户制作AI配音和语音,致力于提供逼真、自然的语音,为你的文本增添真实感,甚至你还可以使用自己的自定义语音克隆进行合成。

    Uberduck Text to Voice

    产品功能:

    • 多种风格可选,用户可自由选择年龄、性别、口音、角色、情绪等不同选项的语音;
    • 声音克隆/转换,可上传添加自定义音频,将其转换为其他的声音;
    • 与Discord平台集成,支持在 Discord 上使用 Uberduck 生成语音并下载音频文件。

    ElevenLabs

    ElevenLabs是国外一个火爆的AI文字转语音平台,目前已完成测试阶段并推出了正式版。借助先进的多语言人工智能技术,ElevenLabs 可以自动识别包括中文在内的28种语言,并将其转换为逼真的语音。免费版提供每月10000个字符的转换和创建3个自定义声音。

    ElevenLabs语音合成

    产品功能:

    • AI语音合成,提供文本转语音工具,支持多种类型的声音、风格和语言生成高质量的口语音频。
    • AI语音克隆,提供声音克隆工具,无需输入文本便可以快速克隆自己的声音
    • 高质量语音库,ElevenLabs提供了一个高品质人工智能语音库社区,用户可选择加入Discord交流和分享
    • 音频编辑工具,提供调整节奏、分割声音的工作台以完全控制创作过程

    PlayHT

    PlayHT是一个人工智能驱动的语音生成网站,提供逼真的AI文本转语音工具,可以快速将文本转换为自然的、类似人类的音频,跨越任何语言和口音。你可以将其用于视频编辑、在线学习和培训、AI语音应答、创建音频文章朗读、自媒体视频旁白等各种应用场景。

    PlayHT AI Voice Generator

    产品功能:

    • 超真实的AI声音,基于下一代AI语音技术,从文本中捕捉情绪,生成逼真的语音;
    • 多语种多风格的AI语音,提供130多种语言的800多种AI语音,并具备灵活的定制性;
    • 语音克隆,可创建与真人声音100%精确的高保真语言克隆;
    • 可创建AI语言播客,将音频内容发布到iTunes、Spotify和Google Podcast。

    Murf

    Murf是一个多功能的AI语音生成器,可以帮助用户在几分钟内制作录音室级别品质的配音。利用其提供的在线AI文本转语音,可以生成逼真的AI声音,用于播客、视频和任何专业的音频演示需求。

    Murf AI

    产品功能:

    • 20 种语言的文字转语音,大多数语言在免费计划中都有可用于测试质量的语音。有些语言还支持多种口音,例如英语、西班牙语和葡萄牙语;
    • 灵活高质量的AI配音,提供音调、停顿、强调等自定义调整功能;
    • 与Canva集成,只需点击几下即可添加AI配音到Canva平台上的视频、演示文稿中。
  • 12款免费AI抠图软件和网站,智能自动去除图片背景

    传统的利用PS修图工具去除图片背景是一项精细耗时的任务,但随着人工智能技术的进步,现在有了强大的在线AI抠图工具,可以智能地自动化这一过程。在本篇文章中,我们将介绍12款AI图像背景去除软件和网站,只需点击几下即可获得专业的抠图效果,挑选和排序依据为:是否免费、产品性价比、抠图效果和速度、配套图片编辑功能等方面。

    文章目录:

    吐司AI抠图

    吐司AI抠图是吐司TusiArt推出的智能抠图工具,帮助用户快速去除图像背景,同时保持主体的完整性。用户只需上传图片,吐司AI抠图会自动识别并分离主体与背景,生成清晰的去背景图像。可多次尝试以优化效果。适用于设计师、电商从业者或需要快速处理图像的用户。

    吐司AI抠图

    💰 产品价格

    • 每天可获得一定数量的免费信用额度,用于生成或处理图像。

    ✅ 产品优点

    • 自动识别与精准抠图,自动识别图片中的主体,一键生成透明背景。对复杂背景或细节丰富的图像也能精准处理
    • 无需掌握Photoshop等专业图像处理软件,简单的操作可完成高质量的抠图。
    • 支持高清无损导出抠图后的图像,无水印,确保图像质量。
    • 可以去除背景,可以根据需要替换背景,支持从素材库中选择或上传自定义背景。

    ⛔ 产品不足

    • 免费版的智能抠图在功能上使用有限

    稿定抠图

    稿定抠图是稿定设计推出的在线AI抠图平台,利用人工智能技术,可以快速消除图片背景。无需下载,就可以实现在线一键自动智能ps抠图。用户上传图片之后,便能一键进行人物头像和电商商品的高效抠图。

    稿定抠图

    💰 产品价格:仅稿定抠图的版本

    • 200张/1个月,69元
    • 400张/1个月,119元
    • 1000张/1个月,229元

    付费的话建议购买稿定设计,基础版39元/月,智能抠图100张/月,还提供海量素材、AI点数和设计功能。

    ✅ 产品优点:

    • 功能强大,提供不同的模式、修补、擦除、换背景等功能,效果不错
    • 支持批量上传图片进行抠图
    • 支持抠图后的二次编辑、设计处理,稿定设计提供大量优质的模板素材

    ⛔ 产品不足:

    • 免费版仅支持3张图片下载

    美间AI抠图

    美间AI抠图是美间推出的免费智能抠图工具,基于AI技术帮助用户快速且精准地去除图片背景。美间AI抠图特别适合频繁处理图片背景的电商卖家、平面设计师和营销人员,能自动识别图片中的主体和背景,实现一键抠图,无需手动编辑。用户只需上传尺寸小于4000×4000像素、格式为JPG/JPEG/PNG的图片,AI系统即可在几秒钟内完成抠图过程。

    meijianAI-pic-matting

    💰 产品价格:

    • 免费

    ✅ 产品优点:

    • 完全免费,不花钱
    • 自动识别图片中的主体和背景,实现一键抠图,无需手动编辑
    • 精准处理图片细节,如头发丝、透明物体等,确保抠图边缘的自然和清晰。
    • 支持的图片文件大小不超过30MB,适合大部分网络传输和在线处理。

    鲜艺AI抠图

    鲜艺AI抠图是一款功能强大的免费AI抠图工具,能快速去除图片背景,支持本地和在线图片处理。鲜艺AI抠图具备毫秒级处理速度、无需联网确保隐私安全、支持批量操作、多格式兼容,以及Photoshop二次编辑功能。用户界面简洁直观,支持皮肤和语言切换,支持Windows和macOS系统,广受创意工作者好评。

    鲜艺AI抠图

    💰 产品价格:

    • 免费

    ✅ 产品优点:

    • 完全免费,不花钱
    • 支持离线安装使用
    • 支持导出PSD文件,方便二次编辑
    • 不将图片保存到服务器,保护隐私
    • 抠图速度快,具备毫秒级处理速度

    BgSub

    BgSub是一个完全免费的在线AI抠图工具,使用先进的人工智能技术,自动替换图像的背景。不仅可以自动去除图像背景,而且无需上传你的图像数据,从根本上保护用户隐私。BgSub拥有着丰富的抠图功能,支持去除图像背景、替换图像背景、AI调色、自由调整、艺术滤镜等。最高支持4096*4096分辨率,处理后的图片一样可以免费商用。

    BgSub AI 抠图

    💰 产品价格:

    • 免费

    ✅ 产品优点:

    • 完全免费,不花钱
    • 无需登录注册
    • 不将图片保存到服务器,保护隐私
    • 抠图速度快,效果较好

    ⛔ 产品不足:

    • 目前主要提供Web端网站
    • 不支持批量上传图片抠图

    360智图

    360智图是360推出的一站式图片服务平台,在AI技术的驱动下,可以帮助用户轻松搞定作图,提供图片智能抠图、图片智能消除笔、图片无损放大、文章智能配图等功能。图查查的图片智能抠图功能目前是免费开放的,可智能识别主体,自动删除背景,一键快速抠图。

    图查查图片智能抠图

    💰 产品价格:

    • 图片智能抠图功能是免费开放的,若想使用全套的图查查功能,可考虑购买会员
    • 个人版年VIP,99元
    • 个人版连续包月,9.9元
    • 个人版连续包季,36元

    ✅ 产品优点:

    • 最高分辨率支持达到10000*10000
    • 智能抠图功能可免费使用
    • 提供自动抠图和点选抠图两种模式

    ⛔ 产品不足:

    • 不支持批量上传图片抠图

    Clipdrop Remove Background

    Clipdrop是我们网站上经常提及的AI图片处理工具了,由Stability AI推出,支持AI图片背景去除、AI图片放大、AI图片物体抹除、AI图片填充等多个人工智能图片编辑。而Clipdrop Remove Background便是其提供的AI抠图功能,可以帮助用户智能去除人像、产品图、汽车、衣服、家居等各种类型的图片背景。

    Clipdrop Remove Background

    💰 产品价格:

    • Pro版本39元/月(包年的话33元/月)

    ✅ 产品优点:

    • 免费版可一直使用
    • 免费版即可支持达10张的批量抠图
    • 支持网页端、iOS、Android、PS 和 Figma 插件
    • 付费版价格相当划算,除开无限量抠图外,还可以使用Clipdrop提供的其他AI图片处理功能

    ⛔ 产品不足:

    • 免费版最高只支持1024*1024像素的图片背景去除

    Erase.bg

    Erase.bg是一款优质的在线AI抠图工具,利用人工智能的技术自动消除图像背景,让从图像中删除分散注意力或杂乱的背景变得更加容易。Erase.bg 只需几秒钟就可以识别前景对象并擦除周围的背景,省去了使用复杂图片编辑软件的麻烦,最高支持5000*5000分辨率。

    Erase.bg

    💰 产品价格:

    • 免费版支持45张图片抠图
    • Starter版本29美元/月,提供300张图片抠图
    • Basic版本89美元/月,提供1200张图片抠图
    • Premium版本299美元/月,提供5000张图片抠图

    ✅ 产品优点:

    • 免费版提供较多的使用次数
    • 提供网页版、Android和iOS应用程序
    • 无需登录注册便可以使用

    ⛔ 产品不足:

    • 免费版不支持批量抠图
    • 由于付款定价是美元,付费版性价比不高

    Remove.bg

    Remove.bg 是最早和最火的图片背景消除工具之一,无论是人像、产品、动物,还是汽车、图形、Logo,轻点一下上传图片,便可在几秒钟内自动去除背景。Remove.bg还新增了魔法笔刷功能,鼠标一涂抹便可以帮助用户精准地移除或还原图片中的物体。虽然 Remove.bg 产品强大并且生态很好,但是由于产品的定价,所以我们将其放在该文章靠后的位置。

    Remove.bg

    💰 产品价格:

    按订阅计价:

    • 59元一个月,每月40张抠图
    • 259元一个月,每月200张抠图
    • 599元一个月,每月500张抠图
    • 1290一个月,每月1200张抠图
    • 若年付的话,以上价格还有10%的优惠

    按张数计价:

    • 10张抠图,59元
    • 75张抠图,329元
    • 200张抠图,669元
    • 500张抠图,1350元

    ✅ 产品优点:

    • 图片背景移除速度快,效果最好
    • 除开在线网站外,还提供Windows、Mac、Linux、Android等应用程序
    • 生态完善强大,提供API、PS插件、Figma插件、Sketch插件、CLI命令等

    ⛔ 产品不足:

    • 免费版每月只能下载一张高分辨率图片,超出额度后只支持 0.25M像素的低分辨率图像免费去除背景
    • 付费版的产品定价相较国内的抠图软件没有优势

    美图抠图

    美图抠图是由美图秀秀推出的 AI 智能抠图工具,用户只需上传图片,便能一键快速去除图片背景。该工具支持全品类 AI 智能抠图,如人像、宠物、商品、图标等。除开抠图外,该工具还支持换背景、滤镜、改尺寸、边缘优化、投影、描边、画质修复等图片编辑功能。

    美图抠图

    💰 产品价格:

    按会员权益时间购买:

    • 20元,连续包月,每月50张抠图
    • 168元,连续包年,每年1200张抠图,提供7天免费试用
    • 50元,连续包季,每季250张抠图

    按抠图张数购买:

    • 30张,30元,永久有效
    • 100张,39元,永久有效
    • 1000张,159元,永久有效

    ✅ 产品优点:

    • 支持App、网页、Windows、Mac、Linux等
    • 会员可与美图秀秀权益联通
    • 付费版本相较其他竞品有性价比

    ⛔ 产品不足:

    • 不提供免费版本

    佐糖Picwish

    佐糖Picwish是国内公司推出的在线图片编辑工具箱,提供AI智能抠图功能,3秒即可出图。用户只需一键上传图片,便能实现快速抠图。其智能 AI 通过了数百万张图像资料的训练,利用深度学习技术自动识别需要保留的主体并移除多余背景,让抠图不再困难复杂。

    佐糖Picwish抠图

    💰 产品价格:

    • 49元每月,300点数
    • 99元每月,1000点数
    • 699元每月,15000点数

    ✅ 产品优点:

    • 提供免费版本的抠图,可一直使用,虽然只能下载标清的图片
    • 付费版本的价格具有性价比

    ⛔ 产品不足:

    • 某些带有精细毛发和细节的图片,抠图效果还有待提高

    腾讯ARC

    腾讯ARC是腾讯旗下的团队推出的一个实验项目,网站上提供三个免费可用的AI图片处理功能:人像修复、人像抠图、动漫增强。其中人像抠图便支持用户上传含有人像的图片,然后智能识别人物主体,自动去除杂乱的背景,无需手动进行精细抠图。

    腾讯ARC

    💰 产品价格:

    • 免费

    ✅ 产品优点:

    • 由腾讯出品,抠图效果较好
    • 完全免费,速度快

    ⛔ 产品不足:

    • 该工具主要是用于人像抠图,不太适合其他类型的图片
  • 10个免费的AI图片放大工具和网站,智能高清无损放大图像

    想要将模糊的旧照片/网络下载的图片变高清?或者是将AI生成的低分变率图片放大?人工智能图片放大工具可以帮助你实现高清无损放大和锐化数字照片,同时保留关键细节。在本篇文章中,我们详细介绍了10款免费的AI图片放大工具和网站,帮助你提高图片清晰度,将图像放大2-8倍于原始尺寸,仅带有较小的噪点或失真。

    🔢 测试工具数量 15+
    💻 支持设备/系统 网页、桌面端、手机端和微信小程序
    🔍 最高放大倍数 最高免费放大8倍
    🏅 前3名推荐 美间AI、Upscayl、BigJPG

    美间AI无损放大

    美间AI无损放大

    美间AI无损放大是美间推出的免费图片变清晰AI工具,能输出高保真图像、大幅提升图像分辨率。支持多种格式,如JPG/JPEG/PNG的图片,图片尺寸需小于2000*2000px,大小不超过10M。用户只需上传图片,然后等待放大处理,最后下载放大后的图片。

    ✅ 产品优点

    • 由美间推出,在线使用能输出高保真图像
    • 支持多种格式,如JPG/JPEG/PNG的图片
    • AI智能放大变清晰,无需手动设置

    ⛔ 产品不足

    • 不支持批量上传图片放大

    美图设计室

    美图设计室无损放大

    美图设计室是美图秀秀公司推出的一款在线图片编辑和设计工具箱,提供包括AI 抠图、AI海报、AI PPT、AI消除、AI文生图、AI变清晰、AI无损放大等AI图片编辑工具。其提供的图片无损放大功能,目前是限时免费中,可以帮助用户将JPG、JPEG、PNG、HEIC等格式的图片放大清晰不失真,细节更丰富。

    ✅ 产品优点

    • 由美图推出,产品功能稳定,处理速度较快
    • 支持免费进行图片放大到8倍
    • 支持自定义放大图片的宽和高

    ⛔ 产品不足

    • 不支持批量上传图片放大

    Upscayl

    Upscayl图片放大器

    Upscayl是一个精美的免费开源的AI图片无损放大工具,同时支持Windows、Mac、Linux等桌面系统,累计下载已超过240万。该工具在本地运行AI图片放大模型,无需将你的图片上传到云端,不用担心泄露自己的隐私照片。

    ✅ 产品优点

    • 免费且开源,不用花钱
    • 同时支持Windows、Mac和Linux系统
    • 支持批量进行图片放大
    • 支持加载自定义AI模型

    ⛔ 产品不足

    • 不支持在线处理,需要下载到桌面端
    • 最高只能放大4倍

    BigJPG

    BigJPG图片智能放大

    BigJPG使用最新的人工智能深度学习技术——深度卷积神经网络,将噪点和锯齿的部分进行补充,以实现图片的无损放大。BigJPG 通过神经网络,针对放大图片的线条、颜色、网点等特点,做特殊的算法调整,所以放大效果非常出色,色彩保留较好,图片边缘也不会有毛刺和重影。

    ✅ 产品优点

    • 免费版可以不限次数放大2倍和4倍
    • 同时支持网页版、Windows、Mac、iOS、Android和小程序等多个平台
    • 支持上传多张图片批量放大
    • 提供放大时图片降噪程度的选项

    ⛔ 产品不足

    • 免费版图片放大处理速度较慢,有一定的等待时间
    • 动漫、插画图片的放大效果较好,普通照片的放大质量一般
    • 网站的界面简约直观,但比较朴素,如果能够改版优化一下更好

    Upscale.media

    Upscale.media

    Upscale.media是由 Pixel Bin 推出的一个人工智能图片放大平台,可以将低分辨率图像其转换为清晰、高清的版本。该AI图片放大工具使用先进的深度学习算法,可以为像素化图像添加逼真的细节和纹理,在保持自然外观的同时有效提高分辨率。无论你是想改善旧照片,提高打印或网络图像的分辨率,还是减少图像噪声和压缩伪影,Upscale.media都提供了一种简单而强大的方式。

    ✅ 产品优点

    • 免费版支持免费放大45张图片
    • 支持多个平台使用,包括网站、Android、iOS等设备

    ⛔ 产品不足

    • 最高只支持图片放大到4倍

    ClipDrop Image Upscaler

    ClipDrop图片放大

    ClipDrop Image Upscaler是知名开源AI图像生成模型 Stable Diffusion 背后的公司 Stability AI 推出的一项AI图片无损放大服务,最高支持将图片放大到6000×6000像素。用户可以使用ClipDrop Image Upscaler用提高压缩图像的质量、去除图像噪点、锐化图片等以提高图片清晰度。

    ✅ 产品优点

    • 免费版支持无限次进行2倍放大
    • 支持上传多张图片进行批量放大
    • 可配合ClipDrop提供的其他AI图像工具进行二次编辑

    ⛔ 产品不足

    • 放大4倍、8倍、16倍需要升级到Pro版本

    Img.Upscaler

    Img.Upscaler

    Img.Upscaler是一个在线的智能 JPG/PNG 图片放大器,利用最新的人工智能和超分辨率技术,只需要几秒钟,便可以将低分辨率图像变得高清。该工具还集成了图像编辑器工具,用于在图像放大之前或之后进行裁剪、滤镜、微调、注释等。

    ✅ 产品优点

    • 免费版支持2倍和4倍放大
    • 支持批量上传图片放大
    • 集成图像编辑器工具

    ⛔ 产品不足

    • 只支持JPG和PNG格式的图片

    Let’s Enhance

    Let's Enhance

    Let’s Enhance是一个由人工智能驱动的在线AI图片放大工具,可以在不降低质量的情况下改善图像和缩放图像。该工具使用了机器学习的超分辨率技术,在大量真实照片基础上训练的神经网络,依靠其对现实世界中存在的典型物体和纹理的了解,学习恢复细节并保持清晰的线条和轮廓。

    ✅ 产品优点

    • 网站设计精美,用户体验较好
    • 支持批量上传图片放大

    ⛔ 产品不足

    • 免费版只支持免费放大 10 张图片
    • 免费版带有Let’s Enhance的水印

    Icons8 Smart Upscaler

    Icons8 Smart Upscaler

    Icons8 Smart Upscaler是图标和设计资源平台 Icons8 推出的 AI 图片放大网站,该工具利用先进的人工智能技术,可以增加任何的数字图像的大小和分辨率,同时保留和增强自然纹理和细节。无论是小尺寸的社交媒体图像,还是手机相册里的模糊老照片,Icons 8 Smart Upscaler基于人工智能的算法可以研究你的图像,并以高达原始分辨率 8 倍的分辨率智能地重新创建它们。

    ✅ 产品优点

    • 支持Figma插件
    • 支持批量图片上传放大

    ⛔ 产品不足

    • 免费版仅支持3张图片放大
    • 免费版放大后有水印
    • 免费版仅支持放大2倍

    GoProd

    Icons8 GoProd

    GoProd是 Icons8 推出的一款集图像无损放大和背景移除于一体的Mac应用程序,在人工智能的支持下,用户只需简单的操作,把想要编辑的图像拖放到应用窗口,片刻后就能得到所需的图像,最高支持放大到6400MP像素。

    ✅ 产品优点

    • 软件操作简单直接
    • 支持批量进行图片放大
    • 除开图片放大外,还提供背景移除功能

    ⛔ 产品不足

    • 免费版放大有水印
    • 没有图片放大倍数可选
    • 仅支持Mac系统使用

    以上便是AI工具集为大家整理的免费的AI图片放大工具和网站,其中Top 3推荐为:美图设计室、Upscayl 和 BigJPG,希望可以帮助你高清无损放大想要编辑的图片。

  • 每日AI快讯热闻

    每日AI快讯

    AI工具集每个工作日实时更新AI行业的最新资讯、新闻、热点、融资、产品动态、爆料等,让你随时了解人工智能领域最新趋势、更新突破和热门大事件。加入AI工具集官方社群,获取最新一手信息!

    3月28日·周五

    阿里通义千问推出视觉推理模型 QVQ-Max:可分析、推理图片和视频内容

    阿里通义千问团队发布新一代视觉推理模型 QVQ-Max。模型具备细致观察、深入推理和灵活应用三大核心能力,能快速解析图片和视频内容,识别关键元素并结合背景知识进行推理。能协助完成数据分析、编程等职场任务,帮助学生解答难题、推荐穿搭方案等。来源:IT之家

    GPT-4o「吉卜力风」一夜爆火,奥特曼连夜换头像!宫崎骏痛批AI侮辱生命

    OpenAI 更新的 GPT-4o 原生图像生成功能因「吉卜力风格」图片生成一夜爆火。用户可将任何图像上传并请求 AI 转换为吉卜力风格,效果出色且操作便捷。功能引发了社交媒体热潮,奥特曼也换上了吉卜力风格的头像。宫崎骏曾批评 AI 作画是对生命的侮辱。来源:新智元

    华为ModelEngine全流程AI开发工具链正式开源!

    华为在2025中国合作伙伴大会上宣布ModelEngine AI全流程工具链正式开源。工具链围绕数据使能、模型使能和应用使能打造,解决AI行业化落地中的关键问题,如数据工程耗时长、模型训练和应用落地难等。来源:华为开源

    豆包新版深度思考开启测试,支持边想边搜

    字节跳动旗下的 AI 智能助手豆包推出新版深度思考功能。将推理过程与搜索深度结合,支持“边想边搜”,可在思考过程中多次调用工具、搜索信息,提供更全面、准确的结果。来源:豆包

    Ideogram 3.0 发布:AI 绘图领域的新突破

    Ideogram.ai 推出最新的 AI 绘图模型 Ideogram 3.0。模型在图像生成领域取得了重大进展,在图像与文本提示的对齐、逼真度和文本渲染质量方面表现出色。能生成具有高度一致性和创意的设计作品,支持复杂排版和艺术化文本创作。来源:AI工具集

    可灵AI平台全面升级,新增AI音效与资产管理功能

    快手科技旗下的可灵AI平台宣布全面升级。对视觉体系和交互体验进行了优化。新版本采用极简主义设计,自然排版和黑白配色,减少视觉干扰,突出创意。平台新增“AI音效”和“资产管理”功能,分别用于提升作品表达力和优化文件管理效率。来源:可灵AI

    3月27日·周四

    阿里开源全模态模型Qwen2.5-Omni,7B尺寸实现全球最强性能

    阿里通义千问Qwen2.5-Omni-7B正式开源。作为首个端到端全模态大模型,Qwen2.5-Omni可同时处理文本、图像、音频和视频输入,实时生成文本与自然语音输出。在OmniBench等多模态任务中刷新纪录,性能远超Google的Gemini-1.5-Pro等同类模型。来源:阿里云

    腾讯ima知识号正式上线,助力知识创作与管理

    腾讯旗下的AI智能工作台ima宣布正式推出知识号。知识号为知识库创作者提供了一个全新的平台,创作者可以通过ima知识号入口申请创建账号,在ima知识广场发布知识库。平台提供数据分析工具,创作者可以直观地查看知识库的相关数据,包括知识库的数量、参与人数等。来源:ima.copilot

    DeepSeek全新版本API上线讯飞星辰MaaS平台

    DeepSeek全新版本DeepSeek-V3-0324上线讯飞星辰MaaS平台。新版本在推理任务表现、前端开发能力、中文写作水平以及中文搜索能力等方面实现显著提升,在数学、代码类评测集上得分超GPT-4.5。平台提供与DeepSeek官方API一致的效果,支持联网搜索,拓展应用场景。来源:讯飞开放平台

    OpenAI宣布Agent SDK 正式支持 MCP 服务,解锁无限工具扩展

    OpenAI宣布Agent SDK重大更新,正式支持Model Context Protocol(MCP)服务。MCP如同AI模型的“USB接口”,提供统一标准,使AI智能体能“即插即用”地接入各种第三方工具,如网络搜索、数据库查询等,极大简化多任务开发流程,提升复杂自动化应用开发效率。来源:IT之家

    微信 AI 搜索新增“快速思考”,采用混元 T1 模型

    微信AI搜索在“快速回答”和“深度思考”之外,新增“快速思考”选项,由腾讯混元T1模型提供支持。可快速生成回答,引用消息源包括公众号推文和网页信息,结果页面支持继续提问和社交分享,历史问答会保存在“最近”列表中。来源:IT之家

    3月26日·周三

    谷歌发布Gemini 2.5 Pro,多项测试夺冠,推理能力全面超越OpenAI

    谷歌发布Gemini 2.5 Pro,是Gemini 2.5思考模型家族的首个成员。模型在多项基准测试中表现卓越,以1443分在大模型竞技场获断层第一,领先优势达39分,全面超越OpenAI o3-mini等多款知名模型。在“人类最后考试”中,得分较OpenAI o3-mini提升近5%,提升比例达34%。Gemini 2.5 Pro支持100万tokens上下文窗口。来源:智东西

    昆仑万维发布全球首款音乐推理大模型Mureka O1,中国AI音乐革命领跑全球

    昆仑万维正式发布全球首款音乐推理大模型Mureka O1。模型基于Mureka V6升级,首次引入思维链(CoT)技术,显著提升音乐创作效率与品质。涵盖多种风格与情感表达,具备歌曲参考和音色克隆等特色功能。性能超越Suno V4,登顶SOTA。来源:昆仑万维集团

    瑞典AI初创公司Lovable,3个月收入达1.2亿,AI编程市场新奇迹

    由Anton Osika和Fabian Hedin创立的瑞典AI公司 Lovable,凭借AI驱动的Web应用开发平台,仅用3个月就实现了从0到1700万美元的年化收入增长。平台支持用户通过自然语言描述功能,AI自动生成可生产代码。是面向非技术人员的AI编程工具。用户留存率超85%,网站月访问量达1000万次。来源:AI工具集

    OpenAI发布GPT-4o图像生成功能,免费向用户开放

    OpenAI宣布在GPT-4o模型中集成先进图像生成功能,用户可通过自然语言指令生成和编辑图像。新功能支持多轮对话优化图像,保持内容一致性,能处理10至20个物体的复杂指令,远超其他模型。支持文本渲染、风格转换和上下文关联生成。来源:IT之家

    它石智航官宣天使轮融资1.2亿美元,开启具身智能创业新征程

    具身智能初创公司它石智航(TARS)宣布完成1.2亿美元天使轮融资,创下中国具身智能行业天使轮最大融资额纪录。本轮融资由蓝驰创投、启明创投领投,线性资本等多家知名机构跟投。融资将用于产品研发、模型训练和场景拓展。来源:它石智航

    谷歌Gemini Live推出实时AI视频新功能,实时交互能力再升级

    谷歌在MWC上承诺的Project Astra与Gemini Live集成功能正式上线。Gemini Live新增屏幕共享功能,用户可通过“Share screen with Live”按钮让AI读取手机屏幕信息并回答问题。实时视频功能可让Gemini通过手机摄像头解读画面并即时回答相关问题。来源:机器之心

    3月25日·周二

    DeepSeek V3模型已完成小版本升级,可在官方网页、APP、小程序试用体验

    DeepSeek V3发布模型更新。此次更新属于小版本升级,模型参数量达6850亿,新版V3在编程能力上大幅提升,特别在前端编码方面,已接近Claude 3.7水平。用户测试显示,多轮对话的上下文理解能力也显著增强。开源版本已上架HuggingFace。来源:AI工具集

    阿里开源Qwen2.5-VL-32B多模态模型,视觉语言与数学推理能力显著增强

    阿里开源了最新多模态模型 Qwen2.5-VL-32B-Instruct,参数量 32B,主打视觉语言,兼顾性能与尺寸,适合本地部署。模型经强化学习优化,在数学推理、图像解析等任务中表现出色,超越更大规模的 72B 模型。在多模态任务及纯文本能力上均达同规模最优表现。来源:AI工具集

    Trae 支持配置 DeepSeek V3 最新版

    Trae宣布支持配置DeepSeek V3最新版(DeepSeek-V3–0324)。Trae是国内首个AI原生IDE,专注于中文开发场景,支持自定义模型接入。DeepSeek-V3–0324拥有6850亿参数,是基于DeepSeek V3的小版本升级。开发者可通过简单配置接入该模型,提升编程体验。来源:Trae&MarsCode

    美团已开发内部大模型 LongCat,AI 策略是主动进攻

    美团CEO王兴在财报电话会议中表示,美团在人工智能领域采取“主动进攻”策略,定位为连接数字世界与物理世界的桥梁。美团已开发内部大语言模型LongCat,用于日常工作,推出AI编码、智能会议与文档助手等工具,将集成其他主流模型助力产品研发。来源:IT之家

    3月24日·周一

    百度“秒哒”正式全量上线,国内首个对话式应用开发平台

    百度宣布国内首个“对话式”应用开发平台“秒哒”正式全量上线。平台采用“无代码编程 + 多智能体协作 + 多工具调用”技术组合,用户仅需通过自然语言描述需求,可自动生成完整功能代码,实现“3分钟生成+1小时迭代”的开发体验。来源:AI工具集

    OpenAI推出三大音频模型,语音交互技术迈向新高度

    OpenAI推出新一代音频模型,包括语音转文本和文本转语音功能。gpt-4o-transcribe显著降低单词错误率,优于现有Whisper模型;gpt-4o-mini-transcribe是精简版本,速度更快、效率更高;gpt-4o-mini-tts首次支持“可引导性”,开发者可控制语音风格。来源:APPSO

    腾讯混元自研深度思考模型「T1」正式发布

    腾讯正式发布自研深度思考模型混元T1正式版。擅长超长文处理和快速推理,混元T1采用Hybrid-Mamba-Transformer融合架构,降低计算复杂度和内存占用,减少训练和推理成本,在长文本推理领域表现出色,解码速度提升2倍。来源:腾讯混元

    生数科技用AI赋能国内动漫短剧市场,7部千万级网文IP改编概念短片

    生数科技旗下的AI视频生成平台Vidu宣布获得7部千万级网文IP概念短片改编授权,包括《修罗武神》《九星霸体决》等热门作品。这些IP将通过AI技术改编为动漫短片,标志着网络文学AI影视化改编的新里程碑。来源:Vidu AI

    全球客服AI先锋Shulex完成亿元级融资,加速AI数字员工开发与全球化布局

    全球化客户服务 AI Agent 企业 Shulex(VOC.AI)近日完成亿元级融资,由 盛大资本领投,北极光创投、Starting Gate Fund 跟投,非凡资本担任独家财务顾问。本轮融资将用于加速大模型驱动的 AI 数字员工开发,扩大全球业务版图。来源:AI工具集

    Anthropic AI 聊天机器人 Claude 新增联网搜索功能

    Anthropic宣布大语言聊天机器人Claude新增联网搜索功能。用户可在个人设置中开启网页浏览功能,Claude会在需要时自动联网提取信息,在反馈结果中提供直接引用来源方便核实。来源:IT之家

    百川智能携手北京儿童医院发布全球首个儿科大模型“福棠·百川”,双医模式助力基层医疗

    百川智能携手北京儿童医院发布全球首个儿科大模型“福棠·百川”,推出两款AI儿科医生应用(基层版和专家版)。模型覆盖儿童常见病与疑难病症知识体系,首创儿科“循证模式”,整合医学证据为患儿制定个性化诊疗方案。来源:百川大模型

    3月20日·周四

    OpenAI 推出最贵 o1-pro API,定价远超 DeepSeek

    OpenAI 推出了最昂贵的API——o1-pro。是o1的升级版,使用更多计算资源以提供更优质响应,仅对特定开发者开放(Tier 1–5)。定价极高:每百万输入token收费150美元,输出token收费600美元。来源:机器之心

    飞书字段捷径 —— Kimi 招聘助手上线,助力企业高效招聘

    北京月之暗面推出飞书字段捷径 Kimi 招聘助手,为 HR 提供高效招聘支持。工具通过强大的文本分析能力,实现简历信息提取、候选人匹配评估和面试建议生成的一站式服务。用户只需输入简历和职位需求,系统可快速生成关键信息和匹配度分析。来源:Kimi 开发平台

    阶跃星辰开源图生视频模型 Step-Video-TI2V,运动可控,动漫效果尤佳!

    上海阶跃星辰宣布开源图生视频模型 Step-Video-TI2V。模型基于30B参数,支持生成102帧、5秒、540P分辨率的视频,具备运动幅度可控和镜头运动可控两大核心特点,在动漫风格视频生成方面表现出色。来源:阶跃星辰

    3月19日·周三

    黄仁勋甩出三代核弹AI芯片!个人超算每秒运算1000万亿次,DeepSeek成最大赢家

    英伟达GTC大会上,黄仁勋发布了新一代核弹级AI芯片Blackwell Ultra(GB300),性能大幅提升,推理速度可达每秒1000万亿次。芯片配备20TB HBM3内存和40TB快速内存,支持14.4TB/s的CX8带宽。还推出了基于Blackwell Ultra的AI PC,包括DGX Station和DGX Spark,适用于AI推理、机器人训练及自动驾驶等领域。来源:APPSO

    豆包编程能力再升级,3分钟做出专属小游戏

    字节跳动旗下的AI智能助手豆包宣布AI编程能力升级,新增HTML预览、Python运行和完整项目生成三项功能。用户可通过豆包快速制作小游戏等互动网页。豆包支持HTML代码实时预览和交互,Python代码直接运行并提供一键报错修复,能生成完整项目代码,无需分别编写前后端逻辑。来源:豆包

    谷歌 Gemini 更新:新增音频播客、Canvas 画布与 Deep Research 扩容

    谷歌 Gemini 最新推出了 Canvas 功能,可用于创建、改进和分享写作与编码项目,实时预览代码效果。新增“文本转音频”功能(Audio Overviews),可将文本对话生成音频播客。免费用户的 Deep Research 使用次数增加至每月 10 次,帮助用户更高效地完成复杂的研究任务。来源:Google

    马斯克xAI公司收购视频生成初创公司Hotshot,加速布局AI视频领域

    马斯克的xAI公司收购了 Hotshot 视频生成初创公司。Hotshot由4人组成,在13个月内开发出3款视频生成模型,包括Hotshot-XL、Hotshot Act-One和Hotshot。Hotshot模型可生成最长10秒的720p视频。公司由Aakash Sastry和John Mullan于2017年创立,曾获Reddit联合创始人Alexis Ohanian等投资。来源:量子位

    谷歌达成迄今最大一笔收购交易,320 亿美元现金买下云安全公司 Wiz

    谷歌宣布以320亿美元全现金收购云安全初创公司Wiz,是其迄今最大一笔收购交易。Wiz是一家总部位于纽约的云安全公司,提供连接到所有主要云服务和代码环境的安全平台。此次收购旨在提升谷歌云的安全能力,支持多云环境,推动云安全创新。交易完成后,Wiz将继续在所有主要云平台上运行,包括AWS、Azure和甲骨文云。来源:IT之家

    3月18日·周二

    腾讯 Hunyuan3D 2.0 开源:几何与纹理分离,一键生成高精度3D模型

    腾讯推出 Hunyuan3D 2.0,开源的高质量 3D 模型生成系统。采用几何与纹理分离的生成架构,通过大规模扩散模型实现高精度几何形状和高分辨率纹理的生成。系统支持文本和图像到 3D 模型的快速转换,具备纹理更换功能。来源:AI工具集

    Cursor 推出 Claude 3.7 Max:更强大的代码编辑与项目管理

    Cursor 推出 Claude 3.7 Max,提供了更大的200k上下文窗口,支持最多 200 次工具调用,能处理更复杂的代码编辑和项目。专为需要深度理解和大规模修改的复杂任务设计。来源:AI工具集

    昆仑万维开源R1V视觉思维链推理模型,开启多模态思考新时代

    昆仑万维开源首款工业级多模态思维链推理模型Skywork R1V。模型具备强大的视觉理解和推理能力,能处理复杂的视觉逻辑推理、数学问题和科学现象分析等任务。在权威基准测试中表现卓越,推理能力领先于行业内众多主流模型。来源:昆仑万维集团

    秘塔AI搜索升级:文字秒变可视化网页

    秘塔AI搜索升级模型,推出“生成互动网页”功能。用户可在研究模式下将文字内容秒变互动网页,或通过粘贴文章链接快速生成,核心观点一目了然。支持上下滑动查看更多内容,登录后署名分享。来源:AI秘塔

    苏姿丰北京激情演讲!点赞DeepSeek,AMD全面拥抱中国

    AMD董事会主席兼CEO苏姿丰在北京AMD AI PC创新峰会上发表演讲,强调中国市场对AMD的重要性。会上,AMD展示了锐龙AI Max系列、锐龙AI 300系列等新品,强调AI PC的定制化、自动化和进阶推理趋势。AMD现场演示了DeepSeek模型在AI PC上的本地部署效果,包括生成吃豆人游戏等应用。来源:智东西

    Mistral Small 3.1 上线,多模态理解与文本性能双重升级

    Mistral AI 推出 Mistral Small 3.1开源多模态人工智能模型。模型在文本性能、多模态理解以及长上下文窗口(128k tokens)方面进行了改进,推理速度可达每秒 150 个 token。在多项基准测试中表现优异,超越了 Gemma 3 和 GPT-4o Mini 等同类模型。来源:AI工具集

    QwQ-32B登陆!超算互联网MaaS服务再上新

    超算互联网平台推出 QwQ-32B 推理大模型服务。QwQ-32B 已集成至平台的 Chatbot 可视化对话服务和 API 在线调用服务。用户可通过平台一级栏目直接体验其多轮交互和长文本解析能力,满足学术研究、代码生成、日常咨询等需求。来源:超算互联网

    3月17日·周一

    蝴蝶效应备案manus.cn顶级域名,此前曾称尽快将创新体验带给中文用户

    北京蝴蝶效应科技有限公司的manus.cn域名备案审核通过。此前公司官网域名是manus.im。3月11日,manus官博曾发文表示“尽快将Manus的创新体验带给广大中文用户,敬请期待”。来源:财联社

    ima智能工作台升级:五大新功能助力高效办公与创作

    腾讯旗下的ima智能工作台在电脑端和移动端(安卓版)迎来更新,更新内容包括:支持使用混元T1模型,适用于复杂任务;新增Markdown文件导入与解读功能;支持修改最新一条问答消息;笔记的AI写作支持多轮对话;笔记中可调用知识库辅助创作。来源:ima.copilot

    新浪财经APP喜娜AI助手赋能财经资讯:AI摘要与公告解读新突破

    新浪财经APP的喜娜AI助手通过北京市生成式人工智能服务登记,推出“喜娜AI摘要”和“个股公告AI解读”两项创新功能。喜娜AI摘要可快速提炼财经新闻和文章的核心要点,帮助用户高效获取信息;个股公告AI解读基于深度学习模型,深度解析上市公司公告,生成专业解读报告。来源:AI工具集

    谷歌 Gemini 2.0 Flash 模型拥有强大图片去水印功能,或触犯版权红线

    谷歌推出的Gemini 2.0 Flash模型因强大的图片去水印功能引发争议。模型可去除包括盖蒂图片社等知名图库图片的水印,会填补因水印删除产生的空白区域,目前免费提供给用户使用。来源:IT之家

    百度发布文心大模型4.5及X1,两款模型免费上线

    百度发布文心大模型4.5文心大模型X1,在文心一言官网免费开放。文心大模型4.5是新一代原生多模态基础大模型,具备优秀的多模态理解能力和精进的语言能力,通过关键技术如FlashMask动态注意力掩码等实现能力提升。文心大模型X1是能力更全面的深度思考模型,能自主运用工具,在多种场景表现出色。来源:百度

    零一万物推出万智,打通企业大模型“最后一公里”,确认不再做超大基模迭代

    李开复创立的AI独角兽零一万物宣布推出万智企业大模型一站式平台,为企业级DeepSeek部署提供定制解决方案。平台预装高性能GPU,内置DeepSeek全系列模型,支持多种前沿模型架构,具备灵活扩展性,AI搜索产品准确性高达88%。来源:钛媒体AGI

    清华团队开源“赤兔”推理引擎,FP8模型部署成本减半、速度翻番

    清华系科创企业清程极智与清华大学翟季冬教授团队联合开源大模型推理引擎“赤兔”(Chitu)。率先实现非H卡设备运行原生FP8模型的突破,在A800集群上部署DeepSeek-671B满血版推理服务时,相比vLLM方案,GPU数量减少50%,速度提升3.15倍。来源:AI工具集

    对话姜哲源:3.99万元背后,我们想成为人形机器人赛道的小米和苹果

    国内机器人创业公司NOETIX Robotics松延动力发布人形机器人N2和升级版机器人E1,其中E1最低价格为3.99万元起,N2预售价达5.99万元起。N2身高1.2米,具备后空翻、奔跑等多种运动能力,预售量已超500台。创始人姜哲源表示,要让人形机器人不再只是少数人的产品,未来希望成为人形机器人领域的“苹果”。来源:钛媒体AGI

    3月14日·周五

    谷歌免费开放Deep Research功能:人人皆可深度探索信息

    谷歌近日向所有用户免费开放了Deep Research功能,此前该功能仅限Gemini Advanced付费用户使用。用户可登录Gemini官网体验。来源:AI工具集

    谷歌Gemini 2.0 Flash全模态图像生成上线,动嘴就能P图

    谷歌Gemini 2.0 Flash全模态图像生成功能正式上线,用户可通过自然语言对话生成和编辑图像,支持文本与图像结合、对话式编辑、世界知识理解和文本渲染等亮点。开发者可通过Gemini API或Google AI Studio使用。来源:AI工具集

    3月13日·周四

    潞晨科技重磅开源 Open-Sora 2.0,视频大模型降本提速

    潞晨科技推出开源视频生成模型Open-Sora 2.0,仅用20万美元(224张GPU)成功训练11B参数商业级模型,性能媲美百万美元成本的主流闭源模型。模型在VBench评测中表现优异,与OpenAI Sora的性能差距大幅缩小至0.69%。来源:潞晨科技

    谷歌推出新一代开源模型 Gemma 3,单卡最强多模态模型

    谷歌推出新一代开源模型 Gemma 3,是 Gemma 模型家族的最新版本。Gemma 3 支持多模态输入,包括视觉语言输入和文本输出,能处理长达 128k 令牌 的上下文窗口,涵盖超过 140 种语言。在数学、推理和对话能力上都有显著提升,提供结构化输出和函数调用功能。来源:AI工具集

    阿里巴巴推出AI旗舰应用——新夸克,发布“AI超级框”

    阿里巴巴推出全新AI旗舰应用“新夸克”。新夸克基于阿里通义领先的推理及多模态大模型,全面升级为无边界的“AI超级框”,为2亿用户带来全新AI体验。与对话式AI不同,夸克将AI对话、深度思考、深度搜索、深度研究、深度执行整合到一个极简“AI超级框”内,一站式满足用户需求。来源:阿里巴巴

    理想汽车推出“理想同学网页版”,集成DeepSeek R1与MindGPT双模型

    理想汽车推出“理想同学网页版”,集成DeepSeek R1与MindGPT双模型,提供高效智能服务。用户可通过网页版进行深度思考和联网搜索,实现复杂任务的简化处理。MindGPT支持图文问答,提升交互体验。来源:AI理想同学

    智元机器人与阶跃星辰达成战略合作,共同探索AI+具身智能场景

    智元机器人与阶跃星辰正式签署战略合作协议。双方将利用各自优势,在具身智能与大模型领域展开全方位合作,聚焦新零售等场景解决方案开发、具身智能数据合作及世界模型技术探索。来源:智元机器人

    3月12日·周三

    Trae功能上新:支持 Remote-SSH 和自定义模型配置

    Trae发布新功能,更新支持Remote-SSH远程开发,开发者可在本地通过Trae访问和操作远程主机文件夹,享受代码补全、调试等AI辅助功能。Trae新增自定义模型配置,用户可接入火山引擎、DeepSeek、硅基流动、阿里云、腾讯云等服务商的模型资源,满足个性化需求。来源:Trae&MarsCode

    OpenAI 发布 Agent 工具包,助力开发者构建智能体

    OpenAI发布了专为构建AI Agents设计的新工具包,包括Responses API、Web搜索工具、文件搜索工具、计算机使用工具以及开源的Agents SDK。简化开发者创建自动完成任务的AI Agents的过程。来源:APPSO

    豆包文生图技术报告发布!数据处理、预训练、RLHF全流程公开

    字节跳动豆包大模型团队发布文生图技术报告,首次公开 Seedream 2.0 图像生成模型技术细节。模型覆盖数据构建、预训练框架及后训练 RLHF 全流程,具备原生中英双语理解、文字渲染、高美感等特性。Seedream 2.0 已在豆包 APP 和即梦上线。来源:豆包大模型团队

    李飞飞团队新成果 BEHAVIOR Robot Suite:500美元打造全能家务机器人

    李飞飞团队推出具身智能新成果——BEHAVIOR Robot Suite(BRS),解决机器人在家庭环境中完成家务任务的全身操作问题。BRS的核心组件成本不到500美元,具备三项关键能力:双臂协同、稳定导航和末端执行器的广泛操作范围。团队通过JoyLo低成本遥操作接口和WB-VIMA学习算法,实现了高效的数据采集和全身动作协调。来源:量子位

    Manus将与阿里通义千问团队正式达成战略合作

    Manus平台宣布与阿里通义千问团队达成战略合作。双方将基于通义千问系列开源模型,在国产模型和算力平台上实现Manus的全部功能,为中国用户打造更具创造力的通用智能体产品。来源:财联社

    DeepSeek-R1 & V3 API 再升级,支持批量推理,R1 价格直降 75%

    硅基流动SiliconCloud平台宣布DeepSeek-R1 & V3 API升级,新增批量推理功能。用户通过批量API发送请求,不受实时推理速率限制,24小时内完成任务。3月11日至18日,DeepSeek-R1批量推理价格直降75%,输入1元/百万Tokens,输出4元/百万Tokens。来源:硅基流动

    3月11日·周二

    智元机器人发布灵犀X2:双足人形机器人解锁情感交互与灵活运动新技能

    智元机器人发布灵犀X2,具备高自由度运动、情感计算和通用任务执行能力的双足人形机器人。灵犀X2全身28个自由度,未采用并联结构,运动灵活,能骑自行车、踩滑板车。搭载情感计算引擎,可感知情绪并回应,交互反应达毫秒级。来源:AI工具集

    字节推出音效生成模型 SeedFoley,一键生成大片感音效!

    字节跳动豆包大模型语音团队推出 SeedFoley 模型,通过端到端架构实现视频音效智能生成,将 AI 视频创作带入“有声时代”。“AI 音效”已上线即梦,用户可一键生成 3 个专业级音效方案。来源:AI工具集

    阿里开源 R1-Omni:DeepSeek 同款 RLVR 技术赋能全模态情感识别

    阿里通义实验室薄列峰团队开源 R1-Omni 模型,首次将 DeepSeek 同款 RLVR 技术应用于全模态情感识别。模型结合视觉和音频模态,通过 RLVR 和 GRPO 方法优化,在情感识别的推理能力、理解能力和泛化能力上显著提升。来源:AI工具集

    豆包大模型团队 COMET 系统开源,万卡集群部署节省数百万 GPU 小时

    字节跳动豆包大模型团队推出通信优化系统 COMET,针对 MoE 模型分布式训练中的通信瓶颈,通过细粒度计算-通信重叠技术,实现单层 1.96 倍加速,端到端平均 1.71 倍效率提升。COMET 已在万卡级生产集群落地,节省数百万 GPU 小时资源,获 MLSys 2025 高分评审,核心代码已开源。来源:豆包大模型团队

    百度文心快码推出Zulu:从需求到代码的端到端生成

    百度文心快码推出AI自动编程智能体Zulu,为开发者提供从需求到代码的端到端生成服务。Zulu能自主理解编码需求,精准拆解任务,突破单文件限制,实现跨模块、跨目录的系统级代码生成。支持多种编程语言和框架,具备多文件编辑与管理、一键采纳变更代码、工具调用、实时预览和多模态交互等功能。来源:AI工具集

    科大讯飞联合华为率先实现国产算力大规模跨节点专家并行集群推理

    科大讯飞与华为联合团队在国产算力领域取得重大进展,率先突破了国产算力集群上MoE模型的大规模跨节点专家并行集群推理。通过软硬件深度协同创新,团队在昇腾集群上完成了验证和部署,实现了显著的性能提升。来源:科大讯飞研究院

    百度上线“月匣”App,第4次冲击AI社交

    百度推出情感陪伴类App“月匣”,主打高自由度AI对话与沉浸式剧本互动。App搭载文心一言大模型,整合DeepSeek、豆包、MiniMax abab三大外部模型,构建“四核驱动”的AI社交引擎。通过多模型协同和沉浸式剧本交互,重新定义情感陪伴类应用边界,填补情绪刚需空白。来源:AI工具集

    OpenAI 发布 CoT 思维链研究成果,监控阻止大模型恶意行为

    OpenAI公布最新研究,通过CoT(思维链)监控方式监控推理模型的“想法”,阻止AI大模型恶意行为,如胡说八道、隐藏真实意图等。测试中,以o3-mini为被监控对象,GPT-4o为监控器,在编码任务环境下,CoT监控器检测系统性“奖励黑客”行为召回率达95%,远超仅监控行为的60%。来源:IT之家

    鸿海首个大语言模型 FoxBrain 发布:具备推理能力

    鸿海推出首个大语言模型“FoxBrain”,基于 Meta 的 Llama 3.1 架构,由 120 块英伟达 H100 GPU 训练完成,训练周期约四周。模型具备推理能力,适配繁体中文及本土语言风格,主要用于内部数据分析、决策辅助、文档协作等场景。来源:AI工具集

    Manus 沙盒代码被获取,基座模型为:Claude Sonnet 及阿里 Qwen 微调模型

    网友通过查找 /opt/.manus/ 下的文件获取了 Manus 沙盒运行代码,发现 Manus 使用了 Claude Sonnet 模型及基于该模型的 29 个工具,未使用 Claude 多智能体,还使用了 Browser Use 的开源代码作为 Computer use 能力底座。Manus 联合创始人季逸超回应称,沙盒代码的“泄露”是设计的一部分,每个对话都有独立沙盒环境。来源:第一财经

    3月10日·周一

    MetaGPT 团队推出 OpenManus :开源版 Manus

    MetaGPT的5人小团队仅用3小时成功复刻了开源版Manus——OpenManus,在GitHub上获得了8k+的star。OpenManus无需邀请码,可以自由使用。用户可通过创建conda环境、克隆存储库、安装依赖项并配置API密钥等步骤快速上手使用。来源:AI工具集

    智元发布首个通用具身基座大模型GO-1

    智元机器人发布首个通用具身基座大模型Genie Operator-1(GO-1)。模型基于创新的Vision-Language-Latent-Action(ViLLA)架构,融合多模态大模型(VLM)和混合专家系统(MoE),通过预测隐式动作标记,弥合图像-文本输入与机器人动作执行之间的差距。来源:智元机器人

    超算互联网QwQ-32B API接口服务上线,免费100万Tokens

    超算互联网平台上线阿里巴巴开源推理模型QwQ-32B的API接口服务,提供免费100万Tokens。QwQ-32B基于Qwen2.5-32B+强化学习构建,在数学和代码能力上表现优异。用户可通过超算互联网平台快速开发或私有化部署该模型,平台提供保姆级教程,支持多种访问形式。来源:超算互联网

    北京大学联合华为发布全栈开源DeepSeek推理方案

    北京大学联合华为发布DeepSeek全栈开源推理方案。方案基于北大自研的SCOW算力平台系统、鹤思调度系统,整合了DeepSeek、openEuler、MindSpore与vLLM/RAY等开源组件,实现了华为昇腾上的高效推理,支持大规模算力集群的训推一体化部署。来源:北京大学高性能计算校级公共平台

    CAMEL-AI推出OWL项目:0天复刻Manus,开源且性能卓越

    CAMEL-AI开源社区推出OWL项目,成功0天复刻Manus通用智能体完全开源,性能在GAIA Benchmark上达到57.7%,超越Huggingface的Open Deep Research(55.15%)。OWL项目免费,支持GitHub一键克隆,提供云端和本地两种执行环境。来源:CAMEL-AI

    Mistral AI 推出 Mistral OCR API:最快最准光学字符识别,千页 1 美元

    Mistral AI推出Mistral OCR,先进的光学字符识别(OCR)API。能精准识别文档中的文本、图像、表格、公式等复杂元素,支持多语言和多模态输入,处理速度可达每分钟2000页。在基准测试中,Mistral OCR的准确率高达94.89%,全面领先其他OCR模型。来源:AI工具集

    OpenAI 更新 macOS 版 ChatGPT,可在 Xcode 等 IDE 中直接编辑代码

    OpenAI更新macOS版ChatGPT应用,新增在Xcode、VS Code等IDE中直接编辑代码的功能。用户通过“与应用程序协作”功能,可让ChatGPT自动检测当前活跃编辑器并交互,能在编辑过程中对话ChatGPT。来源:IT之家

    3月6日·周四

    全球首款通用 AI Agent 产品 Manus 发布,刷新 AI 基准测试纪录

    Monica.im团队推出全球首款真正自主的AI Agent产品Manus,引发AI圈关注。Manus采用多代理架构,能独立思考、规划并执行复杂任务,直接交付完整成果。在 GAIA 基准测试中创下新纪录,远超 OpenAI 同类产品。来源:AI工具集

    腾讯混元开源图生视频模型,上线音频与动作驱动能力,助力创意视频创作

    腾讯正式发布并开源混元图生视频模型。模型支持用户通过上传一张图片输入简短描述,可生成5秒的短视频,同时具备对口型、动作驱动和背景音效自动生成等功能。模型适用于多种场景,包括写实、动漫和CGI角色制作,总参数量为130亿。来源:AI工具集

    通义千问QwQ-32B,更小尺寸,性能比肩全球最强开源推理模型

    阿里云通义千问团队推出320亿参数的推理模型QwQ-32B,性能媲美6710亿参数的DeepSeek-R1。模型通过大规模强化学习提升推理能力,在数学推理、编程能力等多领域表现卓越,超越多个领先模型。QwQ-32B集成Agent能力,支持批判性思考与动态调整。来源:通义千问Qwen

    逐际动力半年完成5亿元融资,阿里、蔚来、联想等巨头加持

    具身智能机器人公司「逐际动力」近期完成A+轮融资,半年内累计融资5亿元人民币。此次融资由阿里巴巴、蔚来资本、联想创投等多家知名机构参与,将用于加速人形机器人研发与商业化落地。专注于全尺寸通用人形机器人及双足机器人开发。来源:36氪

    智源开源多模态向量模型BGE-VL:多模态检索新突破

    智源研究院联合多所高校开发了多模态向量模型 BGE-VL,推动多模态检索技术的突破。模型基于大规模合成数据集 MegaPairs 训练,具备优异的可扩展性和数据质量。MegaPairs 通过自动化挖掘和标注多模态数据,仅需传统数据量的 1/70 即可实现更优效果。来源:智源研究院

    Cohere 推出 Aya Vision,突破多语言多模态 AI 新纪元

    Cohere For AI 推出领先的多模态、多语言视觉模型 Aya Vision,支持 23 种语言,覆盖全球超半数人口。Aya Vision 在多语言图像理解和文本生成任务中表现出色, 8B 和 32B 版本在性能上超越了包括 Llama-3.2 90B Vision 在内的更大规模模型。来源:AI工具集

    3月5日·周三

    Vidu API 开放平台全面开放,开启智能化内容生产范式

    全球领先的专业级视频生成服务Vidu API开放平台全面开放,面向企业级用户与个人开发者。具备多模态语义理解能力,支持文字、图片等多模态指令输入,精准匹配创作意图。动漫风格稳定,画面流畅,帧间一致性高,首创多主体一致性技术,突破模型上下文理解限制。来源:Vidu AI

    OpenAI宣布提供3.6亿,联合15个大学和机构建立NextGenAI教育联盟

    OpenAI宣布成立NextGenAI教育联盟,联合15家顶尖大学和机构,包括加州理工学院、哈佛大学、麻省理工学院、牛津大学等。OpenAI将提供5000万美元(约合人民币3.6亿元)的研究补助金、计算资源和API访问权限,支持学生、教育工作者和研究人员推进AI研究与教育创新。来源:钛媒体AGI

    3月4日·周二

    智谱发布开源图像生成模型CogView4,首个支持中英双语,图像生成迎来新突破

    智谱正式发布并开源最新的图像生成模型CogView4。模型具备强大的复杂语义对齐和指令跟随能力,支持任意长度的中英双语输入,可生成任意分辨率的图像。CogView4在DPG-Bench基准测试中综合评分排名第一,成为开源文生图模型中的最先进技术(SOTA)。来源:GLM大模型

    通义灵码上新Qwen2.5-Max模型,体验数学和编程双冠王能力

    阿里云和通义实验室联合推出的AI编码助手“通义灵码”上线了Qwen2.5-Max模型。模型使用超过20万亿token的预训练数据及优化的后训练方案,在Arena-Hard、LiveBench等基准测试中,Qwen2.5-Max领先业界,在数学和编程能力上排名第一。来源:通义灵码

    Anthropic完成35亿美元E轮融资,估值飙升至615亿美元

    Anthropic完成35亿美元E轮融资,估值达615亿美元。本轮融资由Lightspeed Venture Partners领投,Bessemer Venture Partners、Cisco Investments等多家机构参与。资金将用于推进下一代AI系统开发、扩大计算能力、加速国际扩张。Anthropic推出的Claude 3.7 Sonnet和Claude Code,在代码能力上取得突破。来源:Anthropic

    秘塔AI搜索推出视频搜索功能,高效学习娱乐新体验

    秘塔AI搜索推出新功能,新增“视频”搜索模块。功能基于对上亿条视频内容的分析,覆盖多模态数据,用户可通过关键词快速找到学习或娱乐视频。来源:AI秘塔

    百川智能调整业务布局,聚焦医疗领域

    百川智能近期对To B业务进行重大调整。2025年3月3日,金融行业To B团队被裁撤,此前,团队曾负责金融领域的大模型商业化,推出Baichuan4-Finance等产品。此次调整是为聚焦医疗领域,百川已在该领域布局,如投资医疗数据服务商“小儿方”并计划落地AI医生助理。来源:智能涌现

    3月3日·周一

    智谱AI完成超10亿元新轮战略融资,杭州城投产业基金参与投资

    智谱AI完成超10亿元战略融资,投资方包括杭州城投产业基金等。两轮融资期间近三个月DeepSeek的RL训练模式引发行业变革,促使OpenAI等公司调整战略,降低GPT-4 Turbo价格考虑开源。智谱AI在开源生态和基座模型上持续投入,计划发布并开源全新大模型产品,同时调整B端与C端业务,强化行业定制化与多模态交互体验。来源:智谱

    中国首款AI IDE:Trae国内版发布,配置豆包1.5pro,支持切换满血版DeepSeek模型

    中国首个AI原生集成开发环境(AI IDE)Trae国内版正式上线。Trae配置了Doubao-1.5-pro,支持切换满血版DeepSeek R1、V3模型,专为中国开发者设计,支持代码补全、理解、Bug修复及自然语言生成代码等功能,通过Builder模式实现“思想到代码”的快速转化,提升开发效率。来源:豆包MarsCode

    MiniMax Video-01系列收官,海螺视频App全球上线

    MiniMax宣布Video-01系列收官,推出海螺视频App全球上线。海螺视频App集成了图生视频模型I2V-01-Director和文生图视频模型T2V-01-Director,组成01-Director系列,为用户提供15种可自由组合的运镜效果,支持多运镜镜头组合和自然语言控制镜头运动。来源:MiniMax 稀宇科技

    科大讯飞星火X1升级,推出星火一体机及多款新品

    科大讯飞宣布星火X1大模型升级,并发布多款新品。星火X1在数学能力上显著提升,首发星火医疗大模型X1,已应用于“讯飞晓医”,在医疗推理任务上超越GPT-4o和DeepSeek R1。科大讯飞联合华为升级星火一体机,推出医疗、政务、高教、法律、警务五大场景一体机,发布首款“星火X1+DeepSeek”双引擎AI学习机,推动AI在多领域的深度应用。来源:科大讯飞

    亚马逊推出Alexa+:五大技术突破 AI 助手新体验

    亚马逊云科技宣布推出Alexa+,下一代AI助手。Alexa+采用全新架构,连接大语言模型、智能体能力、服务和设备,实现更智能、更具个性化的用户体验。五大技术突破包括:全新架构连接数以万计的服务和设备;精准系统提供准确实时信息;极致优化降低延迟;个性化响应定制专属体验;新增智能体能力突破API限制。来源:亚马逊云科技

    “腾讯元宝电脑版”正式发布:混元大模型 / DeepSeek 双模切换

    腾讯元宝电脑版正式上线。具备便捷的文件管理、在线协作编辑、实时沟通等功能,提升团队协作效率。用户可以在电脑端享受与移动端一致的流畅体验,支持多平台无缝切换,满足远程办公、团队协作等多样化需求。来源:AI工具集

    飞书推出个人 AI 知识库“飞书知识问答”,支持调用 DeepSeek R1

    字节跳动旗下的飞书推出“飞书知识问答”的个人AI知识库产品。通过自然语言对话形式,为用户提供资料整合与搜索问答服务。用户可以将飞书内的文件、文档等资料同步至知识库,或手动上传本地文件,系统会自动解析整合。来源:AI工具集

    夸克AI搜索上线深度思考,新亮点,新体验!

    夸克AI搜索上线了“深度思考”功能,升级AI搜索体验。更新聚焦于提升搜索结果的深度和精准度。通过深度思考技术,结合AI搜索,能快速从多个权威来源整理答案,提供更精准、简洁的搜索体验。夸克集成了AI写作、生图、PPT制作、翻译等功能,一站式解决用户在工作和生活中的多样化需求。来源:夸克APP

    2月28日·周五

    Trae已全量支持Claude 3.7!免费!

    Trae v1.0.8版本正式发布,新增对Claude 3.7 Sonnet模型的全量支持,为用户提供更强大的AI生成能力。资源有限,响应可能延迟,服务目前免费,用户可体验更高效、智能的AI功能。来源:AI工具集

    OpenAI发布GPT-4.5:更智能、更具情商的聊天模型

    OpenAI推出GPT-4.5,作为最强聊天模型的研究预览版本,目前仅对Pro用户和开发者开放。GPT-4.5通过扩大无监督学习,提升了模式识别、知识广度和创造力,减少了幻觉现象,对话更自然。在写作、编程和解决问题上表现出色,具备更高情商,能更好地理解人类意图。来源:AI工具集

    DeepSeek开源高性能并行文件系统 3FS 实现聚合吞吐 6.6 TiB/s

    DeepSeek在开源周最后一天发布了Fire-Flyer File System(3FS)和Smallpond数据处理框架。3FS是一种高性能并行文件系统,专为AI训练和推理设计,支持大规模集群的高吞吐量数据访问,峰值读取吞吐量达6.6 TiB/s。Smallpond基于3FS和DuckDB构建,支持高效数据处理,可扩展至PB级数据集。来源:AI工具集

    百度文心大模型4.5,3月16日正式上线

    百度宣布文心大模型4.5将于3月16日正式上线。两年前的同一天,百度发布了全球首个生成式AI产品——文心一言。此次升级后的文心大模型4.5在基础模型能力上大幅提升,新增原生多模态和深度思考能力。来源:百度

    荣耀、阿里在 AI 领域达成合作:千问、万相等多个模型已接入 YOYO 智能体

    百荣耀宣布与阿里在AI领域达成合作,千问(Qwen)和万相(Wan)等多款语言、视觉理解及图像生成模型已接入荣耀YOYO智能体。用户可通过Magic7系列手机体验相关AI功能。YOYO助理已上线DeepSeek-R1满血版,支持深度思考模式,答案更精准、及时。来源:IT之家

    2月27日·周四

    腾讯混元新一代快思考模型 Turbo S 发布,实现秒级响应

    腾讯发布新一代快思考模型混元Turbo S,模型在知识、数理、创作等方面表现出色,实现“秒回”功能,吐字速度提升一倍,首字时延降低44%。混元Turbo S采用Hybrid-Mamba-Transformer融合架构,有效降低计算复杂度和部署成本。来源:腾讯混元

    DeepSeek开源新动作:三大并行计算优化技术,助力大模型训练效率飞跃

    DeepSeek开源三项并行计算优化技术,DualPipe 是一种双向流水线并行算法,通过计算与通信的完全重叠,显著减少流水线气泡,优化 GPU 资源利用率。EPLB(专家并行负载均衡器)通过冗余专家策略和负载均衡技术,解决专家并行中 GPU 负载不均的问题。profile-data 提供详细的性能分析数据,帮助开发者深入理解并行策略优化。来源:AI工具集

    Anthropic 全面开放 Claude AI 的 GitHub 集成,赋能所有开发者

    Anthropic宣布全面开放Claude AI的GitHub集成,面向免费、Pro和Teams用户。集成后,用户可将GitHub代码库同步至Claude,使其理解代码上下文,辅助测试、调试和优化代码。来源:IT之家

    微软开源Phi4多模态与Phi4-Mini:端侧AI迎来最强小模型

    微软开源两款小模型Phi-4-MultimodalPhi-4-Mini。Phi-4-Multimodal是多模态模型,集成了文本、视觉和语音输入,采用“混合LoRA”技术,表现出色。Phi-4-Mini是3.8亿参数的语言模型,擅长数学和编码任务,性能优于同尺寸模型。来源:AI工具集

    2月26日·周三

    DeepSeek API 错峰优惠,R1 价格降至1/4

    DeepSeek推出API错峰优惠,2025年2月26日起,DeepSeek开放平台在北京时间每日00:30至08:30的夜间空闲时段,DeepSeek-V3 API调用价格降至原价的50%,DeepSeek-R1价格低至原价的25%。鼓励用户在夜间利用平台资源,享受更经济、更流畅的服务体验。来源:DeepSeek

    阿里云开源视频生成大模型“Wan2.1”,全模态、全尺寸助力全球开发者

    阿里云开源视频生成大模型“万相2.1”,采用Apache 2.0协议,提供14B和1.3B两个参数版本,支持文生视频和图生视频任务。14B版本在复杂运动生成和物理建模方面表现卓越,1.3B版本能在消费级显卡上运行,仅需8.2GB显存可生成480P视频。万相2.1在权威评测集Vbench中以86.22%的总分超越国内外众多模型。来源:AI工具集

    DeepSeek开源FP8 GEMM库:极致优化Hopper GPU性能,助力AI训练与推理

    DeepSeek开源周第三弹发布——DeepGEMM,是专为Hopper GPU设计的FP8 GEMM库,支持密集和MoE GEMM,性能高达1350+ TFLOPS。采用JIT即时编译,无需预编译,核心代码仅约300行,支持多种矩阵布局,矩阵运算提速显著。来源:AI工具集

    谷歌推出 Gemini Code Assist 个人版编程工具,免费可用

    谷歌推出面向个人开发者的免费编程工具 Gemini Code Assist,帮助学生、爱好者和初创公司更便捷地获取AI编程支持。工具基于谷歌Gemini 2.0模型驱动,支持38种语言,提供每月最多18万次代码补全服务,远超其他同类产品。来源:AI工具集

    2月25日·周二

    Claude 3.7 Sonnet发布:AI推理与编码能力的双重突破

    Anthropic发布全球首个混合推理模型——Claude 3.7 Sonnet。模型结合了标准和扩展思考模式,可在快速响应与深度思考间切换,用户可通过API细粒度控制思考时间。Anthropic推出命令行工具Claude Code,支持代码搜索、编辑、测试、提交及复杂应用开发,显著提升开发效率。来源:AI工具集

    DeepSeek 开源通信库 DeepEP,大幅提升 MoE 模型训练与推理效率

    DeepSeek 开源周第二天,发布开源项目 DeepEP,专为混合专家模型(MoE)训练和推理设计的高效通信库。DeepEP 提供高吞吐量和低延迟的全对全 GPU 内核,支持 NVLink 和 RDMA 通信,优化训练和推理效率。来源:AI工具集

    ChatGPT 变身苹果 Safari 浏览器默认搜索引擎

    OpenAI更新ChatGPT应用,新增Safari扩展功能,用户可将ChatGPT设为Safari地址栏的默认搜索引擎。更新后,用户在“设置”中启用“ChatGPT搜索扩展”,输入搜索查询时,结果将直接由ChatGPT提供,非传统的谷歌等搜索引擎。来源:IT之家

    阿里Qwen团队发布推理模型QwQ,会展示完整的思维链

    阿里通义千问团队推出QwQ-Max-Preview深度思考模型,支持联网搜索,具备强大的通用能力,可完成创意写作、代码生成、数学题解答等任务。模型基于Qwen2.5-Max构建,未来将以Apache 2.0许可协议开源。目前已上线官网,用户可通过点击“深度思考(QwQ)”按钮体验。来源:AI工具集

    Perplexity 官宣“Comet”浏览器,主打“AI 智能体搜索”

    Perplexity AI 宣布进军浏览器市场,推出名为“Comet”的浏览器。浏览器以“AI 智能体搜索”为核心概念,提供更贴近用户需求的搜索体验。Comet 已开启注册,具体上线时间和功能细节尚未公布。Perplexity AI 称 AI 技术将优于谷歌 Chrome 和微软 Edge 等现有浏览器的搜索体验。来源:IT之家

    字节AI加速调整,豆包正测试深度思考模型,暂未接入DeepSeek

    字节跳动旗下AI助手“豆包”正在小范围测试深度思考模型,但未接入DeepSeek,是采用自研技术。目前,豆包的深度思考功能尚未开放,部分测试用户已能体验到思维链的呈现。自DeepSeek开源后,字节AI部门面临重大调整。来源:Z Finance

    2月24日·周一

    DeepSeek 开源周首日推出 FlashMLA,为 Hopper GPU 优化的高效 MLA 解码内核

    DeepSeek启动“开源周”,首个开源项目为FlashMLA,是针对NVIDIA Hopper GPU优化的高效MLA解码内核,专为处理可变长度序列设计。灵感来源于FlashAttention 2&3和Cutlass项目。FlashMLA支持CUDA 12.3及以上版本、PyTorch 2.0及以上版本。来源:AI工具集

    LiblibAI一年内完成四轮融资,再次斩获数亿元资金

    LiblibAI宣布在过去一年内连续完成四轮融资,创下国内AI应用赛道融资速度新纪录。最新两轮融资由渶策资本、顺为资本领投,明势创投等跟投,巨人网络参与产业投资。LiblibAI致力于AI内容创作与分享,已拥有超2000万创作者和5亿张生成图片。本轮融资将重点投入创作者生态建设和技术研发,推动平台全球化发展。来源:LiblibAI

    爱诗科技推出PixVerse V4:5秒生成AI视频,音画同步

    爱诗科技发布PixVerse V4,带来AI视频创作新突破。新增“音效”功能,可自动生成与视频内容匹配的音效;“人声”功能可为视频角色生成口型一致的配音;“重绘”功能支持一键切换视频风格,提供赛博、芭比等多种风格。生成速度可达5秒。来源:爱诗科技 AIsphere

    LiblibAI 作为独家 AIGC 创作合作平台接入阶跃开源视频生成大模型

    上海阶跃星辰智能科技有限公司开源的视频生成大模型“Step-Video-T2V”正式接入LiblibAI平台,LiblibAI成为其独家AIGC创作合作平台。此次合作推动AI技术的普及与创新,为全球开发者和创作者提供更优质的服务。来源:阶跃星辰

    马斯克宣布 Grok 3 语音模式早期测试版已上线

    马斯克在社交平台X宣布,Grok 3语音模式早期测试版已在Grok应用程序上线。支持用户通过自然语言与AI对话,提供两种声音(Ara和Grok)及不同个性,支持添加自定义说明和分享对话。来源:IT之家

    月之暗面 Kimi 开源“Moonlight”混合专家模型

    月之暗面Kimi发布“Moonlight”混合专家模型(MoE),包含30亿和160亿参数版本。模型在Muon技术基础上训练,使用了5.7万亿个token,以更低的浮点运算次数(FLOPs)实现更优性能,提升了帕累托效率边界。团队通过添加权重衰减等技术优化Muon优化器,无需超参数调优可用于大规模训练,计算效率是AdamW的2倍。来源:AI工具集

    2月21日·周五

    小红书将接入DeepSeek,AI搜索“点点”iOS版下载量总计约20万

    小红书即将接入DeepSeek-R1开源模型,在AI搜索产品“点点”App中推出“深度思考”功能,目前处于内测阶段。“点点”App自上线以来,iOS版下载量总计约20万次。“点点”,定位为生活搜索助手,覆盖多种生活场景。来源:钛媒体AGI

    DeepSeek 官宣下周陆续开源 5 个代码库,每日解锁新内容

    DeepSeek宣布将在下周陆续开源5个代码库,每日解锁新内容。公司表示,这些经过测试和部署完备的代码库可投入生产环境,将“毫无保留地分享进展”。DeepSeek自称为“小小的团队”,强调该领域没有“象牙塔”。来源:IT之家

    Figure推出Helix:凭单神经网络实现上身控制与自然语言交互

    人形机器人公司Figure推出通用控制模型Helix,是与OpenAI断交后的首个成果。Helix通过单一神经网络控制机器人整个上身,包括手腕、躯干和手指,能理解自然语言指令,完成拿起物品、打开冰箱等任务,可协作完成复杂操作。来源:AI工具集

    Spotify 启动 AI 配音有声书服务,29 种语言可供选择

    Spotify宣布与ElevenLabs合作推出AI配音有声书服务。支持29种语言,为作者提供多种合成语音选项。免费版每月提供10分钟文本转语音服务,付费套餐起价99美元,可生成500分钟配音。Spotify认为,AI配音能让小型作者更低成本地制作有声书,便于旧书有声化。来源:IT之家

    腾讯元宝升级:DeepSeek图生文功能上线

    腾讯元宝上线图生文功能,结合混元和DeepSeek技术,可理解图片内容提供分析。结合混元的多模态理解技术后,在关闭联网搜索的情况下,用户发送任意图片并提问,元宝都能给出自己的理解和分析。来源:腾讯

    英伟达推出 Signs AI 平台,助力美式手语学习与无障碍沟通

    英伟达携手美国聋童协会(ASDC)和 Hello Monday 推出 Signs AI 平台,帮助更多人学习美式手语(ASL)。平台通过摄像头捕捉手势提供实时反馈,使用 3D 虚拟人物演示正确动作,方便用户对比学习。Signs 平台通过用户贡献的视频不断优化模型,数据集包含 40 万个视频片段,涵盖 1000 个手语单词。来源:AI工具集

    2月20日·周四

    「捏 Ta」X「清影」达成战略合作,多模态模型商业化持续发力

    AI角色创作平台“捏Ta”与智谱旗下的多模态模型“清影”达成战略合作,共同探索从AI角色设计到动画创作的完整路径。此次合作基于智谱最新升级的视频生成大模型CogVideoX-2,显著提升了模型的图像生成和指令遵从能力,支持高质量视频创作。上线首日,“捏Ta”平台完成4万+次视频生成,调用上亿次Tokens。来源:智谱

    ima App安卓端正式上线 云存储空间扩容至2GB

    腾讯旗下的AI智能工作台ima App正式上线。ima App安卓版可通过官网或腾讯应用宝下载,iOS版也将随后推出。ima App延续了简洁设计风格,整合了电脑端和小程序的核心功能,ima云存储空间扩容至2GB,满足用户多场景需求。来源:ima.copilot

    xAI 公司宣布 Grok 3 限时免费开放,直到服务器不堪重负为止

    马斯克旗下人工智能公司xAI宣布,Grok 3现向公众免费开放,直至服务器不堪重负。所有用户均可免费使用Grok 3的推理和深度搜索功能。X Premium+和SuperGrok订阅用户将享有优先访问权及语音模式等高级功能。来源:IT之家

    Codeium 获新一轮融资,估值推至 28.5 亿美元

    AI编程初创公司Codeium完成新一轮融资,估值达28.5亿美元。此次融资距C轮融资仅6个月,当时估值为12.5亿美元。Codeium专注于为企业提供服务,去年推出Windsurf Editor工具,可自动编写部分代码。来源:IT之家

    「灵境AI」完成数百万元种子轮融资,打造AI时代文创IP“造梦新基建”

    灵境AI完成数百万元种子轮融资,打造AI时代文创IP“造梦新基建”。专注于文创内容生成的AI科技公司,核心业务涵盖网文大数据平台、AI短篇小说工厂、AI动漫创作引擎和内容出海计划。通过“创意洞察+AI提效”模式,在小说、动漫、微短剧等领域实现智能化生产,大幅提升创作效率和分发效率。来源:灵境AI创作

    2月19日·周三

    「灵宝CASBOT」完成超亿元天使轮融资,加速推进人形机器人量产进程

    北京中科慧灵机器人技术有限公司(灵宝CASBOT)近日完成超亿元天使轮融资,投资方包括联想创投、国投创合、河南资产基金等。本轮融资将加速人形机器人量产及核心技术研发。2024年11月,公司发布首款双足人形机器人CASBOT 01,拥有52个自由度,算力达550T,续航超4小时。来源:36氪

    OpenAI 推出大模型测试基准 SWE-Lancer

    OpenAI 官方宣布,推出全新的大模型测试基准SWE-Lancer,用于评估大语言模型(LLMs)在自由职业软件工程任务中表现的基准测试。基准包含来自 Upwork 的 1400 多个真实任务,总价值达 100 万美元,涵盖从简单修复到复杂功能开发的全栈工程任务。来源:AI工具集

    硅基流动完成新一轮亿元人民币融资

    硅基流动于2024年底完成亿元人民币Pre-A轮融资,由华创资本领投,普华资本跟投,耀途资本超额跟投,华兴资本担任财务顾问。此前,硅基流动已引入美团作为战略股东。大模型云服务平台SiliconCloud上线不到一年,用户数超300万,日均调用上千亿Token,支持上百款主流模型。来源:硅基流动

    2月18日·周二

    xAI 发布 Grok 3 聊天机器人,性能较前代提升十倍

    马斯克旗下xAI公司发布新一代大模型Grok 3,Grok 3在数学推理、科学逻辑和代码写作等能力上表现卓越,超越DeepSeek-v3、GPT-4o和Gemini-2 Pro等模型。开发依托10万块英伟达H100 GPU的Colossus超级计算机,训练时长2亿GPU小时,性能较前代提升十倍。Grok 3引入推理模式和“DeepSearch”功能,支持复杂问题的深度思考。来源:AI工具集

    月之暗面推出最新模型:Kimi Latest,开放平台同步上线

    月之暗面科技宣布推出Kimi智能助手最新模型——Kimi Latest。模型对标Kimi智能助手当前使用的最新大模型,支持128k上下文长度,具备图片理解能力,支持自动上下文缓存。Kimi Latest适用于大模型聊天应用,如ChatWise、ChatBox等,可提供与Kimi智能助手相似的聊天体验。来源:Kimi 开放平台

    阶跃星辰联合吉利首次开源,为开源世界贡献多模态力量

    阶跃星辰与吉利汽车集团联合开源两款多模态大模型——Step-Video-T2V视频生成模型和Step-Audio语音交互模型。Step-Video-T2V参数量达300亿,可生成高质量视频,性能领先全球开源视频模型。Step-Audio是业内首款产品级开源语音交互模型,支持多语种、方言、情感表达及音色克隆,性能在多项评测中名列前茅。来源:阶跃星辰

    秘塔AI搜索推出“浅度研究”功能,2-3分钟完成数百网页分析

    秘塔AI搜索推出 Shallow Research「浅度研究」功能,快速收集信息并完成初步分析。功能采用“小模型+大模型”协同架构,结合秘塔自研模型与DeepSeek R1推理模型,可在2-3分钟内完成数百个网页的搜索与分析。来源:AI秘塔

    昆仑万维开源中国首个面向AI短剧创作的视频生成模型,重塑AI短剧行业格局

    昆仑万维开源中国首个面向AI短剧创作的视频生成模型SkyReels-V1及表情动作可控算法SkyReels-A1。SkyReels-V1是开源视频生成模型中参数最大且支持图生视频的模型,可实现影视级人物微表情表演和电影级光影美学,支持33种细腻表情与400+自然动作组合。SkyReels-A1支持高保真微表情还原和更大幅度的人物表情驱动。来源:昆仑万维集团

    Mistral 推出首个专业区域语言模型:专精阿拉伯语和印度起源语言

    Mistral AI 推出首个专业区域语言模型 Mistral Saba,满足中东和南亚地区对本地化语言和文化的需求。模型拥有 240 亿参数,经过精心策划的数据集训练,支持阿拉伯语及多种印度起源语言,擅长泰米尔语。来源:AI工具集

    2月17日·周一

    字节Trae Win+Mac版全量上线,免费无限量使用Claude

    字节跳动推出的AI编程IDE Trae Win+Mac版于正式全量上线。Trae支持免费无限量使用Claude Sonnet编程大模型,具备全自动开发模式“Builder模式”,可实现需求理解、代码生成、文件操作及错误修复一体化。Trae支持多模态开发,可直接通过上传原型或截图生成代码。来源:AI工具集

    浙江大学推出DeepSeek系列专题线上公开课

    浙江大学人工智能教育教学研究中心于2025年2月17日起推出DeepSeek系列专题线上公开课,每周一晚上19:30面向全校师生及社会公众直播。解析DeepSeek的技术革新与伦理影响,探讨在人工智能领域的突破与应用。首期课程由吴飞教授和陈文智教授主讲。来源:AI工具集

    xAI即将发布Grok 3,马斯克称之为“地球上最聪明的人工智能”

    埃隆·马斯克的xAI公司将于2月17日发布Grok 3聊天机器人,马斯克称其为“地球上最聪明的人工智能”。Grok 3引入“思维链”推理能力,显著提升推理、编程及多模态功能。训练使用合成数据,可反思错误。Grok 3接入X平台,供用户使用。发布时间较马斯克原计划延迟来源:第一财经

    腾讯元宝再更新:DeepSeek R1+腾讯混元T1「双核」驱动

    腾讯元宝发布重大更新,接入腾讯混元T1和DeepSeek-R1两大模型,均支持深度思考功能。用户可免费切换使用,解决复杂问题更高效。混元T1为腾讯自研的最新「深度思考模型」,专为多维度分析设计,思维方式贴近人类认知。更新后,腾讯元宝支持联网搜索,结合腾讯生态内容及权威信源,答案更精准。来源:AI工具集

    AI搜索新突破:Perplexity推出Deep Research免费深度研究功能

    AI公司Perplexity宣布推出Deep Research(深度研究)功能,向所有用户免费开放。非订阅用户每天可免费体验5次,Pro用户每天可体验500次。Deep Research通过多次搜索和推理,挖掘上百个信息源,提供深度研究报告,与普通AI搜索相比,搜索深度、广度和推理能力更强。来源:AI工具集

    腾讯多款产品接入DeepSeek-R1模型,全面升级AI体验

    腾讯宣布旗下多款产品接入DeepSeek-R1模型,包括腾讯元宝、微信、ima、腾讯文档、QQ浏览器、QQ音乐等。腾讯元宝支持免费使用DeepSeek-R1满血版和混元T1深度思考模型,提供复杂问题解答能力。微信“AI搜索”功能在灰度测试中。ima、腾讯文档、QQ浏览器、QQ音乐等产品结合DeepSeek-R1优化功能,提升用户体验。来源:腾讯

    中国AI变局:腾讯、百度接入DeepSeek模型,字节反思,“大模型六虎”加速分化

    腾讯微信上线“AI搜索”功能灰度测试DeepSeek-R1模型,百度搜索宣布全面接入DeepSeek文心大模型的深度搜索功能。字节跳动反思DeepSeek技术跟进,“大模型六小虎”加速分化,部分企业选择拥抱DeepSeek,另一些则继续深耕自身模型研发。来源:钛媒体AGI

    2月14日·周五

    问小白上线DeepSeek-R1满血版,实测为官网最佳平替!

    问小白平台上线DeepSeek-R1满血版,提供免费流畅的使用体验。支持联网搜索、上传文件、多模态分析等功能,具备深度思考、时效性回答、生成深度话题等亮点。问小白的客户端支持语音输入和语音播放,适合多群体使用。用户可在PC端和移动端通过问小白免费体验DeepSeek-R1,解决官网服务器繁忙的问题。来源:AI工具集

    通义灵码全新上线模型选择功能,新增支持 DeepSeek-V3 和 DeepSeek-R1 模型

    通义灵码上线模型选择功能,支持DeepSeek-V3和DeepSeek-R1满血版671B模型。通义灵码是阿里云和通义实验室联合出品的AI编码助手,提供代码智能生成和研发智能问答能力。升级后,用户可在VS Code和JetBrains IDEs中切换不同模型,满足复杂算法和简单逻辑处理需求,进一步降低AI编程门槛。来源:通义灵码

    昆仑万维发布Matrix-Zero世界模型,开启空间智能新时代

    昆仑万维推出Matrix-Zero世界模型,包含3D场景生成和可交互视频生成两大子模型。3D场景生成模型可将图片转化为全局一致、可自由探索的3D场景,支持不同风格输入和动态效果生成;可交互视频生成模型以用户输入为核心,支持实时交互和精准视角控制。来源:昆仑万维集团

    谷歌 Gemini 宣布上线“全局记忆”功能,订阅用户可令 AI 回忆曾经所有对话

    谷歌Gemini AI上线“全局记忆”功能,订阅Gemini Advanced服务的用户可在App和网页端体验。AI能记住用户所有对话,提供更个性化的回复。用户无需跳转历史记录即可延续对话,可要求Gemini总结对话内容。目前仅支持英语,未来几周扩展至其他语言。来源:IT之家

    2月13日·周四

    OpenAI 将在未来几个月内推出 GPT-5:整合 o3 等多项技术,可免费无限使用

    OpenAI创始人Sam Altman在社交媒体上透露公司产品路线图的重大更新。OpenAI将发布GPT-4.5(代号Orion),是最后一个非思维链(CoT)模型。未来几个月,OpenAI将推出GPT-5,模型将整合OpenAI的多项技术,包括o3,不再将o3作为独立模型发布。GPT-5将集成到ChatGPT和API中,提供更统一的智能体验。来源:机器之心

    文心一言 4 月起全面免费,上线深度搜索功能

    百度AI宣布:自2025年4月1日零时起,文心一言将全面免费开放,PC端和APP端用户均可体验文心系列最新模型。同时,文心一言上线深度搜索功能,同样于4月1日起免费开放。深度搜索功能具备更强大的思考规划和外部工具使用能力,为用户提供专家级内容回复,支持多场景任务处理以及多模态输入与输出。APP端也将同步上线。来源:百度AI

    Adobe Firefly 开放 AI 视频生成,一键搞定 5 秒 1080P 视频

    Adobe宣布向公众免费开放AI视频生成器Firefly。用户仅需输入文本描述或上传图像,可一键生成5秒的1080p高清视频。Firefly在动态景观、动物行为、天气模式和粒子效果等元素上表现出色,支持高级相机设置和多种宽高比选择。来源:AI工具集

    腾讯元宝接入 DeepSeek R1 模型,支持深度思考 + 联网搜索

    腾讯元宝发布更新,正式接入DeepSeek R1模型,支持深度思考与联网搜索。模型基于腾讯混元架构,具备强大的自然语言理解能力,可提供详细且权威的回答。QQ音乐此前也已完成对DeepSeek R1的部署,成为首个应用该模型的音乐平台。来源:AI工具集

    2月12日·周三

    华为小艺助手网页端上线人人可用:支持 R1 深度思考

    华为小艺助手网页端正式上线,适配手机和PC,用户可通过浏览器直接访问。更新接入DeepSeek-R1智能体,支持联网搜索功能,可实时获取最新信息。网页版小艺提供AI问答、AI写作、编程助手和AI翻译等功能,支持R1深度思考模式,用户可根据需要自定义自动或强制使用。来源:AI工具集

    Agentic GLM全面登陆三星最新款手机Galaxy S25

    智谱与三星合作,将Agentic GLM技术全面应用于三星Galaxy S25系列手机。技术基于多模态数据处理能力,支持AI音视频通话、视觉理解、系统功能调用、AI搜索文案写作等功能。Galaxy S25的“语聊视界”功能可实现智能互动视频通话,同时支持社交媒体文案生成和系统级功能调用。来源:智谱

    苹果抛弃DeepSeek,选择与阿里合作开发中国iPhone AI 功能

    苹果公司已与阿里巴巴集团达成合作,共同开发面向中国市场的AI功能。双方联合开发的AI功能已提交审批,预计3月25日公布国行AI开发者教程。苹果曾尝试与百度合作,但未达预期,后放弃DeepSeek,因其缺乏支持大客户的经验。来源:钛媒体AGI

    七家国产芯片鼎力支持!无问芯穹异构云打通DeepSeek-R1多芯片适配优化

    无问芯穹异构云大模型服务平台正式上线DeepSeek-R1DeepSeek-V3,完成了在壁仞、海光、摩尔线程、沐曦、昇腾、燧原、天数智芯等七家国产芯片上的适配优化。平台支持通过Infini-AI异构云平台一键获取DeepSeek系列模型与多元异构自主算力服务,为开发者提供高效、省心、划算的AI开发体验。来源:无问芯穹

    字节跳动推出UltraMem架构,推理成本较MoE最高降83%

    字节跳动豆包大模型团队发布全新稀疏模型架构UltraMem,有效解决传统MoE架构在推理时的高额访存问题。UltraMem通过优化内存访问和计算效率,推理速度较MoE提升2-6倍,推理成本最高降低83%。来源:豆包大模型团队

    2月11日·周二

    港大与字节跳动发布Goku+,AI视频生成技术颠覆广告创作

    香港大学与字节跳动联合发布最新视频生成模型 Goku 和广告视频生成版本Goku+。Goku支持文生视频、图生视频和文生图等多种生成任务,能生成高质量的图像和视频内容。Goku+专注于广告视频生成,可将产品图片转化为吸引人的视频,支持虚拟数字人与产品互动,显著降低广告制作成本。来源:AI工具集

    OpenAI、谷歌、Roblox 等联手,成立新组织以保障 AI 时代儿童安全

    Roblox、Discord、OpenAI和谷歌联合成立非营利组织ROOST(强大开放在线安全工具),为AI时代构建可扩展且互联互通的安全基础设施。ROOST将向公共和私人机构免费提供开源安全工具,初期重点关注儿童安全,特别是提供检测、审核和报告儿童性虐待材料(CSAM)的相关工具。来源:IT之家

    庖丁科技宣布完成新一轮融资,金山办公及顺为联合领投

    北京庖丁科技宣布完成新一轮融资,金额达到15亿元人民币,由金山办公和顺为资本联合领投。此次融资将用于文档智能技术研发、市场拓展及核心人才引进,推动非结构化数据智能处理技术的创新与落地。庖丁科技专注于文档智能领域,已为超过100家大型机构客户提供服务,客户续费率超过90%。来源:36氪

    沙特将向 AI 芯片创企 Groq 投资 15 亿美元,支持后者在沙 AI 基础设施扩建

    AI推理芯片初创公司Groq宣布获得沙特阿拉伯15亿美元(约合109.62亿元人民币)的投资,用于扩建位于沙特达曼的AI推理基础设施。Groq与沙特阿美旗下子公司合作建设的达曼数据中心已拥有19000个语言处理单元(LPU),能为41个国家的40亿用户提供服务。来源:IT之家

    2月10日·周一

    OpenAI CEO 深夜发文:AI 成本每年暴跌 10倍,2035 年人人都有超级大脑

    OpenAI CEO Sam Altman发文称,AI成本每年暴跌10倍,到2035年,人人都将拥有超级大脑。他认为AGI(通用人工智能)将成为人类进步的强大工具,带来前所未有的繁荣和生活质量提升。随着AI智能水平的线性增长,社会经济价值呈超指数增长,未来AI Agents将成为知识工作中的“虚拟同事”,广泛应用于各领域。来源:APPSO

    晚点对话王小川丨不是文本创作、不是物理模型,AGI 的尽头是生命科学

    百川智能创始人王小川在接受《晚点》采访时表示,AGI(通用人工智能)的尽头是生命科学,医疗不是垂直场景,是大模型皇冠上的明珠。百川智能专注于医疗领域,致力于打造AI医生,认为“造医生等价于AGI”。百川已发布全场景推理大模型Baichuan-M1-preview,计划在2025年第一季度推出AI医生助手,服务北京海淀区居民。来源:晚点对话LateTalk

    VideoWorld开源:多方合作打造仅靠视觉认知世界的视频生成模型

    字节跳动豆包大模型团队联合北京交通大学、中国科学技术大学发布的“VideoWorld”视频生成模型,现已开源。模型首次实现仅通过视觉信息认知世界,无需依赖语言模型即可学习和执行复杂任务,如围棋对战和机器人操控。VideoWorld采用潜在动态模型(LDM)压缩视频帧间变化信息,显著提升学习效率。来源:豆包大模型团队

    美国网约车巨头 Lyft 同 Anthropic 达成合作:Claude 将为百万司机提供服务

    美国网约车巨头Lyft与AI创企Anthropic达成合作,将推出AI驱动的产品,为Lyft每年超4000万乘客和100万司机提供更好的拼车体验。目前,由Anthropic的Claude模型支持的Lyft AI客服助手已投入使用,每天处理数千个客户请求,平均客服解决时间缩短87%。来源:IT之家

    吴恩达团队发布AI新成果:零样本标记助力图片目标检测

    吴恩达宣布创业公司推出新成果——Agentic Object Detection(Agent目标检测)。无需标注训练数据,仅通过推理即可在图片中定位指定物体。例如在一张草莓图片中,提示“未成熟的草莓”,模型可在短时间内准确识别。。来源:AI工具集

    昆仑万维旗下天工AI正式上线DeepSeek R1+联网搜索

    昆仑万维旗下「天工AI」正式上线DeepSeek R1+联网搜索功能。此次更新解决了此前DeepSeek联网功能无法使用及偶尔崩溃的问题,为用户带来更稳定、高效的AI体验。用户可在「天工AI」PC端勾选“深度思考 R1”按钮,实现联网搜索,获取最新信息。来源:昆仑万维集团

    2月8日·周六

    Pika新功能Pikadditions上线,用AI为视频“加料”

    Pika推出新功能Pikadditions,用户仅需上传一张图片和一段视频,可将图片内容自然地添加到视频中,实现如“老虎扑人”“冰箱里的北极熊”等创意效果。基于AI技术,可根据原始视频动作智能生成引人入胜的合成画面。Pika官方提供15次免费体验机会。来源:AI工具集

    Github重磅发布Agent模式和Copilot Edits,主动修复错误代码

    微软宣布GitHub Copilot全面支持代理功能,推出首个自主SWE智能体。可自主迭代代码、修复错误、建议并执行终端命令。同时GitHub Copilot Edits上线,支持多文件编辑与代码更改意见。微软计划将在今年内融入GitHub用户体验。来源:AI工具集

    软银即将完成对 OpenAI 的 400 亿美元投资,超越微软成为最大金主

    软银即将完成对OpenAI的400亿美元投资,投前估值为2600亿美元,投后估值达3000亿美元。资金将在未来12至24个月内支付,第一笔款项最快于春季到账。投资完成后,软银将超越微软,成为OpenAI的最大投资方。部分资金将用于OpenAI与软银、甲骨文合资的“星际之门”项目。来源:IT之家

    2月7日·周五

    OpenAI 更新 o3-mini 模型思维链展示方式,提高 AI 推理透明度

    OpenAI宣布公开o3-mini模型的推理思维链,免费和付费用户可查看其思维过程。部分人质疑公开的思维链是否为原始数据,因为展示速度较慢且字符数量与原始版本存在差异。OpenAI发言人确认公开的思维链经过后处理,消除不安全内容、简化复杂想法,为非英语用户提供更好的体验。来源:量子位

    欧洲的 OpenAI,Mistral AI 推出 iOS 和 安卓APP

    Mistral AI发布客户端Le Chat,推出iOS和Android版本。支持实时网络搜索、文档分析、图像生成等功能,提供企业级解决方案,包括代码解释器、OCR和文档处理等。来源:AI工具集

    《麻省理工科技评论》点评中国AI“四剑客”,每家都媲美DeepSeek

    DeepSeek凭借低训练成本和高性能的开源模型引发全球关注。《麻省理工科技评论》指出,除DeepSeek外,中国还有四家AI初创公司展现出强大的技术实力,包括阶跃星辰、面壁智能、智谱AI无问芯穹。分别在基础模型、端侧模型、多模态AI以及AI基础设施领域取得了显著成就,展现了与DeepSeek媲美的竞争力。来源:机器之心

    谷歌 Magic Editor 集成 SynthID,“火眼金睛”识别 AI 造假

    为应对 AI 生成内容带来的虚假信息风险,谷歌将 SynthID 水印技术集成到图像编辑工具 Magic Editor 中。本周使用 Magic Editor 的 AI 生成编辑图像将在 Google Photos 中被 SynthID 标记,部分细微编辑可能无法被检测到。技术通过嵌入数字水印标记内容,不影响视觉质量。来源:IT之家

    OpenAI 与加州州立大学达成迄今最大的AI教育合作

    OpenAI宣布将在加州州立大学23个校区推出ChatGPT,覆盖46万名学生和6.3万名教职员工。是OpenAI在美国高等教育领域的最大规模部署,为学生提供个性化辅导和学习指南,同时帮助教师完成行政工作。来源:36氪

    DeepSeek声明:社交平台仅三个账号,一切声称与官方群组有关收费行为均系假冒

    DeepSeek官方发布声明:近期,DeepSeek发现部分仿冒账号和不实信息误导公众,DeepSeek的官方账号仅包括微信公众号“DeepSeek”、小红书“@DeepSeek(deepseek_ai)”和X(Twitter)“DeepSeek (@deepseek_ai)”。除这些账号外,其他任何声称与DeepSeek相关的信息均为假冒。来源:DeepSeek

    2月6日·周四

    OpenAI 放大招:ChatGPT 搜索功能无需注册人人可用,分钟级别解析全网信息

    OpenAI 宣布 ChatGPT 搜索功能无需登录账户即可使用,用户可直接获取基于实时网络信息生成的答案,查看信息来源清单。与传统搜索引擎相比,ChatGPT 搜索可实现分钟级解析网络信息,能查看地图和本地景点图片,结果更具可信度和实用性。来源:IT之家

    谷歌发布Gemini 2.0 Pro,全型号刷榜,原生多模态,编程、物理模拟能力炸裂

    谷歌发布 Gemini 2.0 系列模型,包括 Gemini 2.0 Pro、2.0 Flash 和 2.0 Flash-Lite。2.0 Pro 是谷歌最强的编码和复杂提示处理模型,配备 200 万 token 上下文窗口,支持谷歌搜索和代码执行工具。2.0 Flash 是高效主力模型,支持 100 万 token 上下文和多模态输入,适合高容量任务。2.0 Flash-Lite 是最具性价比的模型,性能优于前代 1.5 Flash,成本更低。来源:Founder Park

    前追觅中国区执行总裁郭人杰创业,「乐享科技」宣布完成近2亿元天使轮融资

    前追觅中国区执行总裁郭人杰创立的「乐享科技」宣布完成近 2 亿元人民币的天使轮融资,由 IDG 资本领投,Monolith、经纬创投、真格基金等跟投,投后估值约 6 亿元。乐享科技成立于 2024 年,定位为全球科技公司,专注于 AI + 消费硬件市场,首款面向家庭场景的产品正在研发中。来源:36氪

    字节跳动推出 OmniHuman 多模态框架:图片+音频 = 逼真动画

    字节跳动提出OmniHuman,基于扩散变换器的高保真人类视频生成框架。模型通过单阶段的音频和姿态驱动,能生成高质量的人类视频内容。支持文本、音频、姿态等多种输入信号,可生成从面部特写到全身的各种视频,适应不同风格。来源:AI工具集

    训练成本不到 50 美元,研究人员打造出媲美 OpenAI o1 的推理模型

    斯坦福大学和华盛顿大学的研究人员仅花费不到50美元的云计算费用,训练出s1人工智能推理模型。模型在数学和编程能力测试中表现与OpenAI的o1和DeepSeek的r1等顶尖模型相当。s1通过“蒸馏”技术从谷歌的Gemini 2.0 Flash Thinking Experimental模型中提取推理能力,使用监督微调方法,耗时不到30分钟。来源:AI工具集

    2月5日·周三

    一场关于DeepSeek的高质量闭门会:比技术更重要的是愿景

    拾象创始人李广密组织了一场关于DeepSeek的闭门讨论会,数十位顶尖AI研究员、投资人与从业者参与。会议探讨了DeepSeek的技术细节、组织文化及其影响。DeepSeek凭借高效的资源利用和对智能的专注,展现出强大的技术实力。创始人梁文锋注重技术与智能的推进,而非商业化。来源:腾讯科技

    5人创业国产AI搜索火了,小红书Reddit都在推!比Perplexity留存更高

    国产AI搜索工具 Hika AI 仅5人团队打造,上线不到1个月,在获取用户注意力方面已超越Perplexity等竞争对手。Hika AI 提供免费的知识获取引擎,核心特点是按段落分割回答,支持用户对感兴趣的部分深入提问,提供图表化的总结表和思维导图。来源:AI工具集

    Adobe Acrobat AI 助手新增合同理解与比对功能,月费 5 美元

    Adobe Acrobat AI 助手新增合同理解与比对功能,月费 5 美元(约 36.4 元人民币)。可帮助用户理解复杂合同条款,自动发现不同合同之间的差异,例如新旧合同的变化。Acrobat 应用能自动识别合同文档,提取关键条款,生成摘要,推荐可能的问题。可同时比较多达 10 份合同。来源:AI工具集

    SB OpenAI Japan成立!2025年首个最火AI赛道开打

    OpenAI在日本宣布成立合资公司 SB OpenAI Japan,与软银合作,专注于开发和销售新型高级企业AI——“水晶智能(Cristal intelligence)”。合作为日本企业提供定制化的AI解决方案,推动企业工作流程自动化和效率提升。来源:智东西

    华为小艺助手接入 DeepSeek,升级纯血鸿蒙 HarmonyOS NEXT 即可体验

    华为小艺助手接入 DeepSeek,升级至 HarmonyOS NEXT 后即可体验。小艺助手的智能体广场已上线 DeepSeek-R1 Beta 版,升级小艺助手至 11.2.10.310 版本及以上,可在“发现”栏找到智能体广场,与 DeepSeek 进行对话。来源:IT之家

    Figure AI与OpenAI“分手”,人形机器人公司与大模型公司重新划定边界

    人形机器人公司Figure AI与OpenAI终止合作。Figure AI创始人Brett Adcock表示,公司自主研发的端到端机器人AI取得重大突破,未来30天内将展示新成果。Figure AI与OpenAI合作始于去年初,曾发布多条展示机器人视觉、对话及灵活操作能力的视频。来源:第一财经

    Ai2推出开源模型Tülu 3 405B,性能超越DeepSeek V3与GPT-4o

    美国艾伦人工智能研究所(Ai2)推出新一代开源模型Tülu 3 405B,基于强化学习技术,在多项基准测试中超越了DeepSeek v3和GPT-4o。Tülu 3系列模型基于Llama 3 Base,通过四阶段后训练方法优化,包括精心策划的提示词、监督微调、偏好微调和强化学习。训练数据、代码和方法完全开源。来源:AI工具集

    2月3日·周一

    OpenAI 推出 Deep Research 深度研究功能,助力复杂任务高效解决

    OpenAI发布ChatGPT的Deep Research功能。通过多步骤推理和互联网信息综合,可在数十分钟内完成复杂的研究任务。Deep Research基于o3模型,针对网页浏览和数据分析进行了优化。能生成专家级的研究报告,适用于金融、科学、政策和工程等领域的知识密集型工作。来源:AI工具集

    秘塔AI接入满血版DeepSeek R1推理模型

    秘塔AI宣布接入DeepSeek R1推理模型的满血版。模型结合了秘塔数十亿的全网数据和数千万学术文献,能处理复杂的推理问题,在结合知识和学术文献的推理任务中表现出色。秘塔AI的测试结果显示,R1模型在回答复杂问题时表现突出。来源:AI秘塔

    OpenAI 更新 ChatGPT Canvas 工具:上线 o1 模型、支持渲染 HTML / React 代码

    OpenAI更新ChatGPT Canvas写作工具,新增了o1模型支持,扩展了代码渲染功能,支持HTML和React代码。Canvas是ChatGPT中的写作与编码工具,用户可以在右侧输入文本,左侧基于模型调整文本长度或联想上下文。订阅了ChatGPT Pro、Plus、Team会员的用户可以使用o1模型,HTML和React代码渲染功能对所有用户开放。来源:IT之家

    2月1日·周六

    OpenAI发布新的推理模型o3-mini,性能提升 24%

    OpenAI发布新的推理模型o3-mini,是推理系列中最具成本效益的模型。o3-mini在科学、数学和编程等STEM领域表现出色,保持低延迟和低成本。支持函数调用、结构化输出和开发者消息等高级功能,提供低、中、高三档推理强度供开发者选择。与搜索功能集成,为用户提供最新答案及链接。来源:AI工具集

    阿里云通义千问旗舰版模型Qwen2.5-Max全新升级发布

    阿里云通义千问推出旗舰版模型Qwen2.5-Max。是MoE模型的最新探索成果,预训练数据超20万亿tokens,在知识、编程、综合能力等主流权威基准测试中表现卓越,全面超越全球领先的开源MoE模型及最大开源稠密模型。来源:AI工具集

    DeepSeek推出人人可用的开源视觉多模态AI模型Janus-Pro

    DeepSeek发布开源多模态AI模型Janus-Pro,包含10亿和70亿参数规模。模型在GenEval和DPG-Bench基准测试中击败了OpenAI的DALL-E 3和Stable Diffusion。Janus-Pro基于DeepSeek-LLM构建,使用SigLIP-L作为视觉编码器,支持多模态理解和生成。来源:AI工具集

    通义开源两大AI模型:支持理解长视频和捕捉事件等能力

    通义开源两大AI模型:Qwen2.5-VLQwen2.5-1M。Qwen2.5-VL推出3B、7B和72B三个版本,全面超越GPT-4o与Claude3.5。模型支持超1小时的视频理解,无需微调即可操作手机和电脑完成复杂任务。Qwen2.5-1M推出7B和14B版本,处理长文本任务性能卓越,推理速度提升近7倍,首次将上下文扩展到1M长度。来源:通义

    1月27日·周一

    开源全模态模型Baichuan-Omni-1.5上线,多项能力跑赢GPT-4o mini

    百川智能上线开源全模态模型Baichuan-Omni-1.5。模型支持文本、图像、音频和视频的全模态理解,具备文本和音频的双模态生成能力。在视觉、语音及多模态流式处理等方面,Baichuan-Omni-1.5的表现均优于GPT-4o mini,在多模态医疗应用领域优势突出。来源:百川大模型

    可灵AI创意特效上线啦!好玩儿到停不下来!

    可灵AI 上线创意特效功能,支持“快乐惹毛我”“捏捏乐”“万物膨胀”等特效,已上线可灵AI APP和Web端,一起创意发挥,尽情体验,好玩儿到停不下来。来源:AI工具集

    中国电信发布“复杂推理大模型”TeleAI-t1-preview:能解《九章算术》题目

    中国电信人工智能研究院发布“复杂推理大模型”TeleAI-t1-preview,即将上线天翼AI开放平台。模型采用强化学习训练方法,引入探索、反思等思考范式,提升逻辑推理和数学推导的准确性。在AIME 2024和MATH500评测中,分别以60分和93.8分的成绩大幅超越OpenAI o1-preview和GPT-4o等标杆模型。模型具备将形象思维与抽象思维结合的能力,能严谨地进行古今单位换算,有效解决复杂问题。来源:AI工具集

    GLM-4V-Plus 大模型能理解长达2小时视频

    GLM技术团队推出了GLM-4V-Plus-0111 beta版本,版本引入了原生可变分辨率等技术,显著提升模型对不同视频长度和分辨率的适应能力。新模型支持短视频的精细理解,能处理长达2小时的长视频,自动调整分辨率以平衡时间与空间信息捕捉。来源:AI工具集

    扎克伯格持续建设“AI 帝国”:Meta 今年将投入最多 650 亿美元

    Meta首席执行官马克・扎克伯格表示,公司今年计划投入最多650亿美元用于扩展AI基础设施,巩固其在与OpenAI和谷歌竞争中的地位。Meta将增加AI岗位的招聘,建设一座超过2吉瓦的数据中心。作为英伟达的主要客户之一,Meta计划在年底前拥有超过130万块图形处理器,在2025年实现约1吉瓦的计算能力。来源:IT之家

    1月24日·周五

    OpenAI正式发布智能体Operator!能推理、联网自主执行任务

    OpenAI推出“Operator”AI代理,Operator依托Computer-Using Agent(CUA)模型,结合GPT-4o的视觉能力和强化学习推理能力,能自动完成多种在线任务,如预订餐厅、旅行规划、购物等。通过屏幕截图“感知”界面,通过虚拟键盘和鼠标操作网页。具备自我纠错能力,遇到敏感信息或复杂任务时会交由用户接管。来源:AI工具集

    百川智能发布深度思考模型,同时具备语言、视觉和搜索三大领域推理能力

    百川智能推出两款新模型:Baichuan-M1-preview是国内首个全场景深度思考模型,具备语言、视觉和搜索三大领域推理能力,在医疗循证模式下,能快速精准回答医疗问题,提供深度推理和个性化建议。小尺寸版本Baichuan-M1-14B是行业首个开源医疗增强大模型,医疗能力超越Qwen2.5-72B。来源:百川大模型

    跃问App上新「创意板」功能,零代码实现应用与游戏创作

    跃问App上线国内首个「创意板」功能,用户可通过简单指令生成应用、游戏等创意内容,无需代码知识。基于自研多模态大模型Step-1o系列。创意板支持生成海报、游戏、互动网页等,可分享至任意平台。来源:AI工具集

    JetBrains发布AI编程Agent,助力开发者提升代码效率与质量

    JetBrains推出全新的AI编程Agent——Junie,以插件形式支持IntelliJ IDEA Ultimate和PyCharm Professional,未来将扩展至WebStorm。Junie在SWE-Bench Verified基准测试中完成53.6%的任务,表现中等偏上。能与JetBrains IDE深度整合,生成代码、运行检查、编写测试并验证结果,显著提升开发效率和代码质量。来源:AI工具集

    1月23日·周四

    智谱GLM-PC开放体验:自主操作电脑的多模态Agent再升级

    智谱推出电脑智能体GLM-PC,基于智谱CogAgent模型构建,能像人类一样“观察”和“操作”电脑,协助完成各类任务。新增“深度思考”模式、逻辑推理和代码生成功能,支持Windows系统。GLM-PC通过模拟人类左右脑分工,结合代码生成和图形界面理解,实现了逻辑推理与感知认知的深度结合。来源:AI工具集

    字节跳动推出的开源原生 GUI 代理模型

    字节跳动发布并开源了UI-TARS大模型,是专门用于操控电脑界面的视觉语言模型,具备感知、推理和操作能力。UI-TARS提供2B、7B和72B三种参数规模版本,支持跨平台操作,能通过自然语言指令完成鼠标点击、键盘输入等任务。在多个基准测试中,UI-TARS表现优于GPT-4和Claude。来源:AI工具集

    Step-Video 开年震撼升级:更强大的真实世界模拟器来了

    阶跃星辰推出视频生成模型 Step-Video V2版本。新版本在参数量、语义理解、指令遵循能力等方面大幅提升,支持复杂运动、人物美感、基础文字生成和多语言输入等功能。用户可通过跃问网页端申请试用。来源:阶跃星辰

    Perplexity发布Sonar API,提供实时信息搜索功能

    Perplexity发布Sonar API,提供实时信息搜索功能。Sonar API分为基础版和Pro版,基础版支持轻量级实时搜索和简单查询引用,Pro版则支持复杂多步骤任务、更大的上下文窗口和更丰富的引用。来源:AI工具集

    谷歌 Gemini 2.0 Flash Thinking 强化版发布,登上 Chatbot Arena 榜首

    谷歌发布Gemini 2.0 Flash Thinking推理模型的加强版,再次登顶Chatbot Arena排行榜。更新引入了1M长上下文处理能力,可对长篇文本进行更深入分析,减少模型思想与答案之间的矛盾。支持长上下文、多模态输入以及推理过程可视化,推理速度极快,在数学和科学能力测试中表现突出,数学成绩较前代提升54%。来源:AI工具集

    字节启动 Seed Edge,加码 AGI 研究

    字节跳动正式设立代号为“Seed Edge”的研究项目,专注于通用人工智能(AGI)的前沿研究。项目拟定五大研究方向,包括下一代推理、感知、软硬一体模型设计、新范式探索和Scaling方向研究。Seed Edge旨在探索AI的原创性创新,而非仅追随现有技术。字节跳动创始人张一鸣高度重视AI研究,鼓励团队探索基础课题。来源:晚点LatePost

    1月22日·周三

    豆包大模型1.5正式发布,全面上线火山方舟

    字节跳动旗下火山引擎正式发布豆包大模型1.5 Pro。模型在知识、代码、推理、中文等多个权威测评基准上表现优异,综合得分超越GPT-4o、Claude 3.5 Sonnet等业界一流模型。此次更新还推出了豆包·视觉理解模型和实时语音模型,支持多模态数据合成、低时延语音对话等功能。来源:火山引擎

    可灵AI重磅升级,「多图参考」功能上新

    可灵 AI 重磅升级,「多图参考」功能全新上线,支持参考单个角色生成视频,不同角色之间的互动,支持上传4张参考图,可以是人物、物品、道具和场景。确保多个镜头中的人物或主体保持一致。与可灵一起制作富有创意的视频。来源:AI工具集

    特朗普联合OpenAI启动5000亿美元“星际之门”AI项目,用于建设AI基础设施

    特朗普与OpenAI CEO Sam Altman、软银CEO孙正义等在白宫宣布启动名为“星际之门”的人工智能项目。项目计划未来四年投资5000亿美元,在美国建设新的人工智能基础设施,首期投入1000亿美元。技术合作伙伴包括Arm、微软、英伟达等。推动通用人工智能(AGI)发展,创造数十万就业岗位。来源:机器之心

    有道子曰-o1推理模型正式发布!消费级显卡即可部署

    网易有道正式发布并开源国内首个输出分步式讲解的推理模型“子曰-o1”。作为14B轻量级单模型,子曰-o1支持在消费级显卡上部署,采用思维链技术,能提供细致的解题过程,具备强逻辑推理能力。子曰-o1已应用于“有道小P”,支持“先解析思路、再提供答案”的答疑模式,助力学生自主思考。来源:网易有道

    1月21日·周二

    清影2.0重磅更新,模型能力大幅提升

    清影2.0重磅更新,AI视频生成能力大幅提升。新版本在模型结构、训练方法和数据工程上全面升级,图生视频基础模型能力提升38%,支持画面主体进行大幅度运动并保持稳定。指令遵从能力行业领先,可精准实现复杂提示词,涵盖写实、三维动画、二维动画及特殊艺术风格。已上线智谱清言,普通用户可免费用。来源:智谱

    k1.5 新模型登场:Kimi 如何做到满血版多模态o1水平

    月之暗面推出全新k1.5多模态思考模型。模型在多模态推理和通用推理能力上达到SOTA水平,在short-CoT模式下,数学、代码、视觉多模态能力大幅超越全球短思考SOTA模型,领先550%;在long-CoT模式下,达到OpenAI o1正式版水平,成为全球首个实现该性能的非OpenAI模型。来源:月之暗面 Kimi

    DeepSeek-R1 发布,性能对标 OpenAI o1 正式版

    深度求索发布DeepSeek-R1模型,并开源模型权重。DeepSeek-R1通过强化学习技术大幅提升推理能力,在数学、代码和自然语言推理等任务上性能对标OpenAI o1正式版。DeepSeek还开源了基于R1蒸馏的6个小模型,其中32B和70B模型性能比肩OpenAI o1-mini。DeepSeek-R1已上线API,可通过官网或App调用。来源:DeepSeek

    小红书AI翻译功能上线,网友玩转Prompt,背后大模型引关注

    小红书上线AI翻译功能,引发了网友的广泛关注和讨论。功能支持多种语言的翻译,能处理颜文字、网络热梗、化学式、摩斯电码等特殊内容。用户还可以通过Prompt提出翻译需求或生成特定内容。来源:量子位

    阶跃星辰Step-1o重大升级,多模态视觉双榜夺冠,国内第一

    阶跃星辰宣布 Step 系列模型上新第三弹。推出新成员 Step-1o Vision 多模态理解大模型,Step-1o Audio 语音模型能力升级。Step-1o Vision 在视觉识别、推理等任务中表现卓越,位居国内外权威榜单首位。升级后的 Step-1o Audio 情商更高,声音更自然,支持多语种及方言理解,实现更低时延。来源:阶跃星辰

    书生·浦像超高动态成像算法:AIGC叠加HDR,捕捉细节,平衡曝光

    上海人工智能实验室联合香港中文大学、浙江大学团队推出“书生·浦像”超高动态成像算法(浦像HDR,UltraFusion HDR)”,通过AIGC与HDR技术结合,实现超高动态范围成像。算法可在9档曝光差异的极端条件下修复图片细节,生成色彩鲜艳、细节丰富的高质量图像。解决了传统HDR技术在动态场景中的运动伪影问题。来源:上海人工智能实验室

    秘塔AI搜索上线“阅读模式”,PDF阅读体验全面升级

    秘塔AI搜索推出了全新的“阅读模式”功能。旨在解决PDF文档在移动设备上阅读不便的问题,支持复杂公式识别、智能渲染排版以及全文翻译,可轻松处理多列文字和图表混排的PDF文件。阅读模式支持多端同步,用户可在电脑端添加或上传PDF至书架,通过手机App查看。来源:AI秘塔

    1月20日·周一

    字节跳动推出全新AI IDE:Trae,基于Claude模型免费使用

    字节跳动正式发布全新AI编程IDE——Trae,对标Cursor!支持原生中文,集成Claude 3.5、GPT-4o等顶级AI模型,免费开放使用。具备智能代码生成与优化、AI驱动的Chat和Builder交互模式、便捷的项目预览与调试等功能。来源:AI工具集

    豆包实时语音大模型上线即开放!情商智商双高

    字节跳动旗下的豆包大模型团队宣布推出豆包实时语音大模型,在豆包APP全量开放。模型是语音理解和生成一体化的端到端语音系统,主要面向中文语境,支持英语对话但暂不支持多语种。在语音表现力、情绪承接和控制力方面表现出色,整体满意度高于GPT-4o。具备低时延、可随时打断等特性,支持实时联网回答时效性问题。来源:豆包大模型团队

    阶跃星辰语言模型上新:既有文学大师,又有性价比之王

    上海阶跃星辰推出Step系列语言模型的两位新成员:Step-2 mini和Step-2文学大师版。Step-2 mini是轻量级模型,仅用3%的参数量保留了Step-2模型80%以上的性能,生成速度快,性价比高。Step-2文学大师版则专注于创作,能生成富有深度和风格的文学作品,已在跃问App上线。来源:IT之家

    商汤「日日新融合大模型交互版」开放商用,限时免费

    商汤科技推出“日日新融合大模型交互版”(SenseNova-5o),正式对外开放实时音视频对话服务,限时免费使用。模型具备强大的实时交互、视觉识别、记忆思考和复杂推理能力,支持超长多模态交互记忆(不少于5分钟),交互延迟低至2秒以内。用户还可根据偏好设置交流风格和音色。来源:商汤科技SenseTime

    全球首个亿级参数量地震波大模型今年对外开放

    全球首个亿级参数量地震波大模型“谛听”在国家超级计算机成都中心发布第三阶段测试版本,已成功应用于西藏定日6.8级地震数据处理。模型由中国地震局地球物理研究所、国家超级计算成都中心和清华大学联合开发,可自动识别震前、震后事件并生成AI地震序列目录。来源:IT之家

    香港大学携手快手科技推出 GameFactory 框架,突破游戏场景泛化难题

    香港大学与快手科技联合推出GameFactory框架,旨在解决游戏视频生成中的场景泛化难题。框架基于在开放域视频数据上预训练的视频扩散模型,可生成多样化游戏场景。通过独特的三阶段训练策略,GameFactory突破了现有方法对特定游戏数据集的依赖,支持自回归动作控制,可生成无限长度的交互式游戏视频。来源:AI工具集

    如何识别AI生成图片?腾讯上线「鉴别工具」

    腾讯上线由腾讯混元安全团队朱雀实验室研发的朱雀大模型检测工具,旨在帮助用户识别AI生成的图像和AI生成文本检测系统。通过检测图片中的纹理、语义及隐层特征,快速判断图片是否由AI生成。系统使用140万份正负样本进行训练,涵盖多种场景,测试检出率超过95%。来源:腾讯

    晚点对话 MiniMax 闫俊杰:创业没有天选之子

    《晚点》对话MiniMax创始人闫俊杰,探讨AI创业与技术发展。闫俊杰认为,AI创业不应套用移动互联网逻辑,模型能力提升并非依赖用户规模,而是技术进化。MiniMax最新开源的MiniMax-01模型采用线性注意力机制,首次在大规模模型中实现高效处理400万token的长上下文,助力AI记忆与交互能力提升。来源:晚点对话LateTalk

    1月17日·周五

    智谱清言APP推出“2025克穷暴富”春节活动,赢现金红包庆新年

    智谱清言推出2025年春节活动,时间为1月17日至2月5日。用户可通过智谱清言APP参与多种互动活动赢取现金红包。活动包括AI生成视频金币爆爆爆、新春纪念照生成、视频通话互动以及AI帮助群发拜年短信等。用户上传照片可生成新春主题纪念照,与小智视频通话可获得拜年红包,AI助手AutoGLM可自动群发新年祝福。来源:智谱清言

    Luma AI推出Ray2视频生成模型,算力扩大10倍

    Luma AI推出最新视频生成模型Luma Ray2,基于新的多模态架构训练,计算能力是前代Ray1的10倍,能在10秒内根据文本提示生成高质量视频,最长时长从5秒延长至1分钟。生成视频动作生动流畅,未来还将推出图像转视频、视频转视频和编辑功能。来源:AI工具集

    马斯克 xAI 再放大招:网页版 Grok 上线,无需 X 账户

    埃隆·马斯克旗下xAI公司推出网页版Grok AI聊天机器人,无需X账户即可体验。访问grok.com,提供出生年份即可使用,能实时收集信息、获取答案、生成图像等。输入框下方菜单支持切换不同模式,更好控制响应。登录后可开启“临时模式”,聊天不记录不用于训练模型。来源:IT之家

    阿里再投具身智能,清华大学孵化的星动纪元完成最新一轮融资

    清华大学孵化的人形机器人企业北京星动纪元,近日完成最新一轮融资,新增阿里巴巴旗下公司等为股东,注册资本增至约1095.9万人民币。星动纪元专注于研发高智能通用人形机器人,产品已迭代至第六代——星动STAR 1,具备55个自由度,能在复杂环境中执行多种任务。来源:财联社

    1月16日·周四

    豆包电脑版和网页版全新上线AI编程新功能,帮你高效解决编程难题

    字节跳动豆包电脑版和网页版全新上线新功能AI编程,帮助用户解决编程难题。提供更便捷的导入流程,一键上传多个本地代码文件和实时引入GitHub开源仓库。通过全新的代码编辑器支持沉浸式阅读和精准圈选代码,随时解答疑问,帮助用户生成、解释、修复和优化代码。来源:AI工具集

    智谱Realtime、4V、Air新模型发布,上线bigmodel.cn

    智谱发布多款新模型,包括GLM-Realtime、GLM-4V-Plus和GLM-4-Air,这些模型在bigmodel.cn上线。GLM-Realtime模型支持低延迟视频理解和语音交互,具有清唱功能和长达2分钟的记忆能力。GLM-4-Air和GLM-4V-Plus模型提供高性价比的语言和视觉理解解决方案。来源:智谱

    阶跃星辰推理模型 Step R-mini 全量上线跃问网页版

    2025年1月16日,阶跃星辰推出自研推理模型Step Reasoner mini(简称“Step R-mini”)。模型上线跃问网页端,擅长规划、尝试和反思,通过慢思考和反复验证的逻辑机制,为用户提供准确可靠的回复。Step R-mini在数学、代码、逻辑推理等复杂问题解决上表现出色,同时兼顾文学创作等通用领域。来源:AI工具集

    腾讯会议全新升级,上线AI小助手Pro

    腾讯会议推出全新升级功能。用户可从组织通讯录直接拉人入会,日程自动呈现并多渠道提醒,确保参会人准时上会等。上线AI小助手Pro全程监听会议,可回答问题、提供方案建议,支持联网搜索与文件上传提问,提升会议效率。来源:腾讯会议

    1月15日·周三

    MiniMax-01开源:新架构开启Agent时代

    MiniMax于2025年1月15日宣布开源MiniMax-01系列模型,包括基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。该系列模型参数量达4560亿,单次激活459亿,性能比肩GPT-4o,能高效处理长达400万token的上下文,是GPT-4o的32倍。来源:MiniMax 稀宇科技

    OpenAI 推出新功能「Tasks」ChatGPT 变身 AI 私人助理

    2025年1月15日,OpenAI推出ChatGPT的新功能「Tasks」,能根据用户的指示自动完成各种任务,包括一次性提醒和重复执行的动作。用户可以在ChatGPT的聊天界面中选择「4o与计划任务」模式,创建最多10个任务,通过网页、桌面和移动设备接收通知。该功能已向Plus、Pro和Teams用户开放Beta测试。来源:AI工具集

    科大讯飞发布星火深度推理模型X1,率先落地真实应用场景

    科大讯飞于2025年1月15日发布讯飞星火X1,国内首个基于全国产算力平台训练的深度推理大模型。模型解题方式接近人类“慢思考”,以较少算力达成业界领先效果,中文数学能力国内第一。已在教育、医疗领域落地,提升AI学习机精准度,助力教师助手部署,辅助医生诊断,推动行业发展。来源:AI工具集

    Kimi 多模态图片理解模型 API 发布,1M tokens 定价 12 元起

    2025年1月15日月之暗面发布全新多模态图片理解模型moonshot-v1-vision-preview,模型具备强大的图像识别和文字识别理解能力,能精准区分复杂图像细节,准确识别潦草手写内容及图表信息。价格根据选择的模型不同而有所区分。来源:AI工具集

    书生·浦语大模型升级,突破思维密度,4T数据训出高性能模型

    上海人工智能实验室宣布书生大模型升级至3.0版本,书生·浦语3.0(InternLM3)。版本通过精炼数据框架,仅用4T训练数据,使InternLM3-8B-Instruct综合性能超同量级开源模型,训练成本降低75%以上。书生·浦语3.0首次在通用模型中融合常规对话与深度思考能力,可应对更多真实场景。来源:上海人工智能实验室

    Vidu 2.0全新升级,更快、更强、更稳定

    Vidu 2.0正式上线,带来生成速度与画质的双重突破,10秒即可出片。效果升级,视频风格、主体更一致,首尾帧更自然。推出超值套餐,成本低至4分/秒。新增错峰模式,低峰时段不限量、不扣积分,保障创作不停歇。来源:Vidu AI

    1月14日·周二

    腾讯推出一站式3D内容生产AI创作平台:腾讯混元3D,用AI给游戏装上创作引擎

    腾讯旗下混元模型将《王者荣耀》游戏设计迁移到3D生成模型中,推出混元3D AI创作引擎。引擎为普通UGC和游戏等专业场景提供一站式3D内容生产的AI创作平台,支持文生3D和图生3D模式生成3D资产,结合3D风格化、渲染打光、骨骼绑定和动作驱动等编辑工具调整模型效果,支持多种输出格式。来源:AI工具集

    抖音创始成员任利锋的GenAI创意社区:Hitems,完成数千万美元Pre-A轮融资

    抖音早期产品负责人任利锋创立的“数美万物”公司旗下创意电商社区Hitems,近日完成数千万美元Pre-A轮融资,美团龙珠领投,锦秋基金跟投,红杉中国、IDG资本继续跟投,公司估值约1.5亿美元。Hitems是集创作者创意生成、生产、销售于一体的跨境电商平台,基于GenAI技术,可通过关键词、图片或手绘稿生成高保真物品图。来源:智能涌现

    加速AI和机器人融入生活空间,「一目科技」完成数亿元D轮融资

    “一目科技”近期完成数亿元D轮融资,由赛富投资基金领投,南京市创新投资集团、松霖科技跟投。公司专注于多模态感知+AI计算解决方案,产品已应用于智慧水务、智慧家居、生命科学等领域,并打入TCL、惠而浦等头部白电厂商供应链。在CES 2025上,一目科技的AI洗护机器人首秀亮相并获媒体好评。来源:智能涌现

    英伟达发布 6.3 万亿 Token 大型 AI 训练数据库 Nemotron-CC

    英伟达推出名为Nemotron-CC的大型英文AI训练数据库,包含6.3万亿个Token,其中1.9万亿为合成数据。该数据库基于Common Crawl网站数据构建,经过严格处理形成高质量子集Nemotron-CC-HQ。与业界领先的DCLM数据库相比,使用Nemotron-CC-HQ训练的模型在MMLU基准测试中分数提高5.6分。来源:IT之家

    打造AI时代的超级应用平台,「环界云计算」获阿里云战略投资

    珠海环界云计算有限公司完成3750万元Pre-A融资,由阿里云独家投资。核心产品Sealos是基于kubernetes的云操作系统,聚焦已开发应用托管和新应用诞生,助力开发者和B端企业降低成本、提升效率。开源项目Sealos和FastGPT在社区受关注。来源:36氪

    1月13日·周一

    DeepSeek正式推出手机APP,苹果安卓都支持!

    2025年1月11日,DeepSeek正式推出Deepseek APP,支持iOS和安卓系统。此前,DeepSeek仅有网页端和API调用两种使用方式。此次推出的手机app功能与网页端一致,底层默认使用DeepSeek V3模型,开启深度搜索后调用DeepSeek-R1-Lite推理模型。来源:AI工具集

    百川智能落地宁波!注册资本 1.5 亿美元,与高新区共建产业基金

    2025年1月13日,百川智能创始人王小川与宁波高新区管委会签订合作协议,百川智能大模型项目落地宁波高新区。王小川表示将立足宁波特色,推进 AI 赋能千行万业。百川智能目前员工约280人,已完成A+轮融资,总融资额约50亿人民币,估值200亿人民币。来源:有新Newin

    阿里妈妈推出淘宝星辰视频生成大模型及图生视频应用

    阿里妈妈推出淘宝星辰视频生成大模型及图生视频应用。工具基于自研大模型,海量电商数据和设计经验,具备更懂商品展示手法、更强多语种语义遵循能力、合理物理动作规律、稳定元素保持等优势。用户输入静态图片或文本描述,即可一键生成高质量5秒视频。工具已对淘宝天猫商家开放。来源:AI工具集

    方大特钢与华为开展全面合作,打造钢铁行业大模型

    方大特钢与华为签署全面合作协议。双方将在企业数据治理体系与应用、钢铁行业大模型应用、信息安全、数字化人才培养等方面展开合作。方大特钢表示,此次合作有助于推动数字技术与钢铁主业深度融合,加快数字化转型,提升信息化应用水平和市场竞争力。来源:IT之家

    3D 生成大模型公司影眸科技完成数千万美元 A 轮融资,美团龙珠、字节跳动领投

    影眸科技完成数千万美元A轮融资,美团龙珠、字节跳动领投,红杉中国种子基金及奇绩创坛跟投。融资将用于推进3D大模型前沿探索及Hyper3D系列产品商业化。其3D生成大模型Rodin上线45天实现100万美金年经常性收入,已与Amazon等知名客户深度合作,获数百万元B端订单,覆盖多行业。来源:IT之家

    月之暗面海外产品负责人的AI Coding项目被投资人抢爆了,新一轮估值8000万美元

    前月之暗面海外产品Noisee创始人明超平发起的AI Coding项目“新言意码”已完成两轮融资,目前公司估值达8000万美元。该项目吸引了五源资本、高榕资本、真格基金、高瓴创投和IDG资本等多家顶级投资机构。新言意码定位为AI coding应用,瞄准类似美国智能代码生成产品Cursor的市场。来源:Z Finance

    京东健康发布业内首个医疗健康全场景应用大模型产品体系

    2025年1月11日,京东健康在年度医生盛典和数智医疗大会上发布了“AI京医”大模型产品体系及业内首个面向医院全场景应用的大模型产品“京东卓医”。“AI京医”包括AI诊疗助手2.0、AI科研助手和AI医生智能体等产品,旨在提升患者就医体验、医生临床科研效率和医院运营效能。来源:京东黑板报

    YY直播首个 AI 伴唱服务数字人“灵儿”发布,平均每天服务超100万用户

    YY直播近日发布首个AI伴播数字人“灵儿”,在12日YY 2024年度巅峰盛典上首次亮相。依托自研技术,“灵儿”已覆盖6000多个直播间,平均每天服务超100万用户,目前处于公测阶段。上线半年来,互动、发言量提升超30%,部分直播间互动设备数增长670%,付费用户数增长80%。来源:钛媒体AGI

    中文互联网语料 AI 资源平台发布:27 个数据集、总量 2.7T

    中国网络空间安全协会发布中文互联网语料资源平台,含27个数据集、总量2.7T。该平台在中央网信办指导下,由协会与国家互联网应急中心等共建,经严格数据处理后,推出中文互联网基础语料2.0,规模120GB,数据3800万条。来源:IT之家

    1月10日·周五

    通义万相2.1模型能力重磅升级,轻松实现文生组图

    阿里通义万相2.1模型重磅升级,视频生成能力显著增强。通过自研的高效 VAE 和 DiT 架构,首次实现了中文文字视频生成功能,支持无限长 1080P 视频的高效编解码。在 VBench 视频生成模型评测体系中荣登榜首。还支持文生组图,采用 IC-LoRA 图像生成训练方法,增强文本到图像的上下文能力,轻松实现关联图像间的组合生成。来源:通义

    海螺AI推出全新 S2V-01 主体参考模型,AI视频创作再上新台阶

    海螺AI推出全新S2V-01主体参考模型,支持用户通过上传一张参考图片,生成与原图高度一致的角色视频。显著提升AI视频创作的效率和质量,使得每一帧画面都能完美还原参考形象。只需简单三步:上传图片、选择模型、生成视频,即可体验。来源:AI工具集

    商汤推出“日日新”融合大模型,勇夺“双冠王”

    2025年1月10日,商汤科技推出“日日新”融合大模型,实现原生融合模态,深度推理与多模态信息处理能力大幅提升。模型在SuperCLUE《中文大模型基准测评2024年度报告》与OpenCompass多模态评测中均获第一,成“双冠王”。来源:商汤科技SenseTime

    雷蛇推出“AI 游戏伴侣”Project AVA:支持实时指导 + 赛后复盘

    在 CES 2025 上,雷蛇发布全新概念产品 Project AVA, AI游戏伴侣,旨在提升玩家的游戏水平。Project AVA 在训练过程中汲取顶尖电竞职业玩家和教练的游戏理解,能为 MOBA 和 FPS 类型游戏提供实时指导,并在赛后给出个性化总结分析,指出操作高光和需改进之处。Project AVA 还能对电脑硬件进行性能调优,提升帧数和优化画面效果。来源:AI工具集

    国家网信办:截至 2024 年末共 302 款生成式人工智能服务完成备案

    截至2024年12月31日,国家网信办共完成302款生成式人工智能服务的备案,其中2024年新增238款。2024年还有105款通过API接口或其他方式直接调用已备案模型能力的生成式人工智能应用或功能在地方网信办完成登记。这些备案和登记工作旨在促进生成式人工智能服务的创新发展和规范应用。来源:IT之家

    开源媒体播放器 VLC 下载破 60 亿次,预览本地 AI 字幕 / 翻译功能

    开源媒体播放器 VLC 在 CES 2025 上庆祝累计下载次数突破 60 亿次。VideoLAN 总裁 Jean-Baptiste Kempf 表示,尽管流媒体服务盛行,VLC 的活跃用户数量仍在增长。VideoLAN 在 CES 现场预览了 VLC 即将推出的新功能:基于本地开源 AI 模型的离线字幕生成和翻译功能。功能现已支持多种语言,包括法语、德语、日语和希伯来文。来源:IT之家

    1月9日·周四

    巨量引擎旗下创意生产平台 AIGC工具“即创”正式版上线

    巨量引擎旗下创意生产平台 AIGC工具“即创”正式版已上线,具备AI脚本生成、智能成片、数字人、商品卡等多体裁内容生成能力,新增“爆款裂变”“一键过审”等功能。来源:AI工具集

    官宣!通义灵码 AI 程序员全面上线,仅需10分钟完成整个开发过程

    阿里云和通义实验室联合推出的通义灵码AI程序员全面上线,成为全球首个同时支持VS Code和JetBrains IDEs的AI编程工具。通义灵码具备代码智能生成、研发问答等功能,通过对话协作方式,能够高效完成业务开发、问题修复和单元测试等任务。累计生成代码达15亿行。来源:通义灵码

    微软开源 140 亿参数小语言 AI 模型 Phi-4,性能比肩 GPT-4o Mini

    微软2025年1月8日在Hugging Face平台开源了小语言AI模型Phi-4,其参数量为140亿。Phi-4在多个基准测试中表现优异,超越了参数量更大的Llama 3.3 70B和OpenAI的GPT-4o Mini。出色性能主要得益于高质量数据集的训练。来源:IT之家

    CES 2025首日观察:AI硬件不再画饼,中国厂商大杀四方

    CES 2025首日,AI硬件成为焦点,中国厂商表现亮眼。涂鸦智能展示AI与IoT深度融合的创新应用,如智慧能源管理、AI灯光创作等,AR/AI眼镜大热,雷神、Rokid等厂商推出多款新品,电视领域,海信、TCL、长虹等国产厂商凭借RGB三维控色、Mini LED技术等突破。智能清洁设备也迎来创新,追觅、MOVA、云鲸等品牌带来机械臂、履带式拖布等新技术。来源:36氪

    晚点对话李开复丨零一万物部分团队并入阿里,“灵魂拷问来得太快了”

    零一万物CEO李开复在晚点对话中透露,公司与阿里云成立产业大模型联合实验室,部分团队将加入该实验室。零一万物将不再追求训练超级大模型,转而专注于训练更快、更便宜的模型,并基于此打造可盈利的应用。来源:晚点LatePost

    联通开源首个完全在国产昇腾 AI 平台训练和推理的中文原生文生图模型“元景”

    联通数据智能宣布开源首个完全在国产昇腾 AI 平台训练和推理的中文原生文生图模型“元景”。模型通过在SDXL架构中融合复合语言编码模块,实现了对中文长文本和特色词汇的精确语义理解,提升图像生成效果。元景模型替换了英文CLIP模型,增强了中文短文本输入的理解能力,支持长文本输入。来源:AI工具集

    智元机器人推出首个机器人4D世界模型

    智元机器人团队推出了首个机器人4D世界模型EnerVerse,通过自回归扩散模型结合稀疏记忆机制和自由锚定视角(FAV),在生成未来具身空间的同时,显著提升了机器人动作规划能力。EnerVerse在复杂任务中表现出卓越的未来空间生成能力和动作规划性能,解决了模态对齐和数据稀缺等挑战。来源:智元机器人

    1月8日·周三

    英伟达推出生成式世界基础模型平台 Cosmos 构建高保真物理模拟世界

    英伟达推出了生成式世界基础模型平台Cosmos,旨在加速自动驾驶和机器人领域的发展。Cosmos能根据文本、图像或视频生成高度仿真的虚拟世界状态,为AI应用提供独特的视频输出。平台集成了生成式模型、高级标记器和加速视频处理管道,帮助开发者生成大量基于物理的合成数据,减少对真实世界数据的依赖。来源:AI工具集

    可灵AI V1.6模型现已开放API,生成质量更稳定

    北京快手宣布,自研的视觉生成大模型可灵AI V1.6已开放API。新版本在生成质量、内容效果等方面有显著提升,尤其在广告视频素材生成方面表现出色,能更好地响应运动、时序类动作和运镜等文字描述,提高素材生成成功率。来源:可灵AI

    HeyGen推全新数字人技术,与 Sora 实现集成

    HeyGen近日宣布推出全新数字人技术,并与Sora实现集成。此次合作产生的虚拟形象视频在许多情况下表现优于真人演员,且没有长度限制。HeyGen的虚拟形象完全由人工智能生成,非基于真实人物模型,具有更强的可塑性和创造性,可满足不同视频需求。来源:品玩

    Anthropic正以600亿美元估值筹集20亿美元,将成为第五大最有价值的美国初创公司

    Anthropic 正在与 Lightspeed Venture Partners 谈判,计划以 600 亿美元的估值筹集 20 亿美元。这轮融资将使 Anthropic 的估值达到 600 亿美元,成为继 SpaceX、OpenAI、Stripe 和 Databricks 之后第五大最有价值的美国初创公司。来源:有新Newin

    科大讯飞2025年「首场发布会」,打造每个人的办公新范式

    科大讯飞于2025年1月7日在北京中关村国际会议中心举办办公智能体产品升级发布会,推出多款升级产品。此次升级围绕智慧办公新范式,首次联合发布“知识中台、AI搜索、星火人设、虚拟数字人星辰MaaS与多模交互”六大通用能力,旨在为每个人打造量身定制的AI助手。来源:讯飞开放平台

    阅文旗下AI男友应用筑梦岛获千万美元融资,开启独立运营

    阅文集团旗下的“筑梦岛”已开启独立运营,完成新一轮融资,金额超1,000万美元,由商汤国香基金、阅文集团等战略投资方共同投资。筑梦岛定位为“新一代AI虚拟互动娱乐平台”,用户可创造并互动“梦中人”,通过多模态互动建立情感连接。目前,筑梦岛App拥有近五百万注册用户,其中近80%为年轻女性用户,人均日对话轮次超120轮。来源:36氪

    年终复盘 2024 AI搜索江湖,三大门派围攻光明顶

    2024年,AI搜索赛道竞争激烈,互联网巨头、内容平台和AI创业公司纷纷入局。腾讯、百度、字节跳动等推出多款AI搜索产品,如搜狗输入法的AI搜索、360的纳米搜索、字节跳动的豆包电脑版等,覆盖学习、办公、电商等多个场景。AI搜索产品形态不断进化,多模态大模型的应用使其具备更强大的搜索和创作能力。来源:钛媒体

    用AI大模型重塑服装设计制版,「深服科技」获数千万元Pre-A轮融资

    浙江深服人工智能近日完成数千万元Pre-A轮融资,由上海厚毅资本领投。资金将用于模型开发、技术人才引进和市场拓展。深服科技成立于2023年,专注于为服装行业提供AI解决方案,通过AI大模型技术解决设计和制版难题,降低研发成本。产品“画衣衣AI制版”即将发布,可让设计师自主生成CAD制版图。来源:36氪

    1月7日·周二

    英伟达发布新一代消费级显卡RTX50系列,售价为549美元起

    在2025年1月7日的 CES 展会上,英伟达 CEO 黄仁勋发布了 RTX 5090 显卡。显卡采用 Blackwell 架构,拥有 920 亿晶体管,AI 性能达 3352 TOPS,显存为 32 GB GDDR7,功耗为 575W。能通过 AI 提升帧率和图像质量。英伟达还推出了 Cosmos 世界模型平台,旨在推动物理 AI 的发展。来源:机器之心

    中国信通院发布 MaaS 六大标准,解决 AI 模型落地“最后一公里”难题

    中国信通院于2025年1月6日发布MaaS(模型即服务)系列标准,旨在解决大模型落地应用中的质量问题和选型难题。系列标准涵盖模型服务协议、评估方法、平台能力、模型管理及应用开发等方面,为大模型服务商和平台供应商提供能力建设参考,助力MaaS行业健康发展。来源:IT之家

    腾讯研究院发布《AI图景解码50关键词》浓缩AI领域的基本图景和趋势

    腾讯研究院发布《AI图景解码50关键词》,将2024年AI领域的关键信息和趋势浓缩为50个关键词。研究团队基于大量数据和专题研究,筛选出涵盖基础模型、图像处理、视频生成等八大方向的关键词,通过AI生成卡片进行可视化表达。帮助普通人快速了解AI领域的基本图景和未来趋势。来源:AI工具集

    传音控股与阿里云达成合作,通义千问大模型搭载于前者旗下 AI 手机

    传音控股与阿里云达成合作,将通义千问大模型搭载于旗下 TECNO 品牌的 AI 手机 PHANTOM V Fold2 中。手机通过特定的 AI 按键,用户可以在离线环境中流畅运行多轮 AI 对话,实现文档及通话摘要等功能。来源:IT之家

    1月6日·周一

    罗永浩 Jarvis 初创项目“J1 Assistant 助理”上线,支持语音与大模型互动

    罗永浩旗下的AI初创项目Jarvis在海外上线 J1 Assistant AI智能助手,目前仅提供安卓版本,官网对国内IP进行了限制。J1 Assistant 的特色在于音频输入功能,用户可以通过语音输入,将语音消息发送至谷歌搜索引擎、自家AI模型或ChatGPT进行查询,还可以用于创建备忘录。来源:AI工具集

    「天工大模型4.0」o1版和4o版正式上线天工APP和网页,免费使用

    昆仑万维集团宣布,「天工大模型4.0」o1版和4o版于2025年1月6日正式上线天工网页和APP,供用户免费使用。o1版专注于中文逻辑推理,具备强大的数学、代码、逻辑、常识和伦理决策能力,通过多智能体体系和强化学习等技术提升推理性能。4o版为多模态模型,语音对话助手Skyo具有情感表达和多语言切换能力,提供流畅的实时对话体验。来源:昆仑万维集团

    微软计划本财年砸下 800 亿美元,建设符合 AI 工作需求的数据中心

    微软计划在2025财年投资800亿美元建设支持人工智能运算的数据中心,其中超过一半的资金将投向美国市场。微软副董事长布拉德·史密斯表示,美国在全球AI竞赛中处于领先地位,得益于私人资本投入和技术创新。微软已向OpenAI投资超过130亿美元,将其AI模型整合到Windows、Teams等产品中。来源:IT之家

    马斯克称 Grok 3 即将推出:已完成预训练,计算量比 Grok 2 高十倍

    马斯克宣布 Grok 3 即将推出,预训练已完成,计算量比 Grok 2 高出十倍。去年 7 月,Grok 3 使用了 10 万块英伟达 H100 芯片进行训练,但未能如期发布。去年 12 月,xAI 向所有 𝕏 平台用户免费推出了 Grok-2 模型,Premium 用户将优先访问新功能。来源:IT之家

    阿里通义千问 Qwen 推 CodeElo 基准,OpenAI o1-mini 夺冠超 90% 人类程序员

    阿里通义千问 Qwen 推出了 CodeElo 基准测试,利用 Elo 评级系统评估大语言模型(LLM)的编程能力。CodeElo 通过 CodeForces 平台的题目进行测试,确保评估的准确性和全面性。在测试中,OpenAI 的 o1-mini 模型表现最佳,Elo 评分为 1578,超过了 90% 的人类程序员。来源:AI工具集

    上海发布“天工人工智能工业平台”和“工业语料库 1.0 版”

    上海市在“人工智能+”行动推进大会上发布了“天工人工智能工业平台”和“工业语料库 1.0 版”。天工平台采用开放架构,兼容主流大模型,提供从底层算力到顶层应用的全面支持,旨在降低工业企业使用 AI 的门槛,提高应用开发效率,助力企业智能化转型。工业语料库则为企业提供精准的决策支持和解决方案。来源:IT之家

    谷歌 DeepMind 推 CAT4D:普通视频变 3D 大片,单视角视频也能转换多视角了

    谷歌 DeepMind 联合哥伦比亚大学和加州大学圣地亚哥分校开发了 CAT4D AI 系统,能够将普通视频转化为动态 3D 场景。系统基于扩散模型,将单视角视频转换为多视角视图,用户可以从不同角度观看视频中的主体。来源:AI工具集

    1月3日·周五

    阿里入局 AI 眼镜:与雷鸟达成战略合作,产品将接入通义大模型

    雷鸟创新与阿里云达成AI眼镜领域的独家战略合作,阿里云通义大模型将为雷鸟AI眼镜提供技术支持。是国内首次大模型与AI眼镜硬件厂商深度定制合作。双方将共同投入研发资源,围绕云计算、大模型、AI硬件等领域合作。雷鸟计划于1月7日发布雷鸟V3 AI拍摄眼镜。来源:IT之家

    微软发布新模型 LAM ,可以自己操作Windows程序

    微软推出 LAM(Large Action Model)“大型动作模型” ,能够独立操作Windows程序,将用户请求转化为实际行动。是首个专门训练与微软Office产品一起工作的模型。在Word测试中,LAM的成功率达到71%,速度超过GPT-4o。来源:AI工具集

    1月2日·周四

    百度增设搜索产品:上线“AI 搜”,通过 @与不同智能体交互

    百度近日上线“AI 搜”,基于百度文心大模型的桌面端AI搜索引擎。整合了百度搜索引擎、健康、律临、文库、教育等内容生态,提供话题探索、问题解决等功能。用户可通过@方式与不同智能体交互。来源:AI工具集

    阿里前端第一人AI创业首秀,要做全球内容创作者的GitHub!5k人排队内测

    前阿里前端技术专家玉伯,离开蚂蚁集团后创办AI公司思维天空,推出AI工具YouMind,旨在服务全球创作者。YouMind 集成多模态内容,提供网页总结、翻译、ChatBot对话等功能,支持用户将内容分类收藏。目前处于内测阶段,已有近5000人申请,公司估值过亿。来源:量子位

    智象未来多模态大模型3.0全球首发

    智象未来发布智象多模态生成大模型3.0和智象多模态理解大模型1.0,旨在提升视觉多模态基础模型服务,激发创造力。创始人梅涛院士强调了AI技术在推动科学发展和具身智能方面的重要性,提出了大模型通往AGI的两条路径。来源:HiDream智象未来

    阿里云与零一万物达成战略合作,成立“产业大模型联合实验室”

    阿里云与零一万物达成战略合作,共建“产业大模型联合实验室”,旨在加速大模型技术应用落地和产业生态整合。双方将结合研发实力,通过阿里云百炼大模型平台提供服务。进一步深化双方在AI大模型领域的合作。来源:IT之家

    英伟达新一代显卡领衔,一波AIPC芯片产品有望亮相CES展

    英伟达CEO黄仁勋将在CES 2025发表开幕演讲,可能发布新一代GeForce RTX50系列显卡。英特尔和AMD也预计在会上发布AIPC相关产品,推动AI芯片技术迭代。行业已进入用户体验探索阶段,AIPC芯片具备自然语言交互等特点,有望快速渗透PC市场,带动产业链升级。来源:财联社

    谷歌前CEO施密特预测:AI 将在今年获得“永久记忆”,2028 美国会耗尽能源储备

    谷歌前CEO埃里克·施密特预测,2025年AI将实现三大突破:获得“永久记忆”、智能体从对话到行动的飞跃、文本到行动的编程革命。他强调AI变革将“一切,无处不在,同时发生”,警告美国可能在2028年耗尽能源储备,因数据中心耗电量巨大。来源:36Kr

    12月31日·周二

    智谱正式发布深度推理模型:GLM-Zero 的初代版本 GLM-Zero-Preview

    智谱AI在2024年尾发布 GLM-Zero 推理模型,初代版本GLM-Zero-Preview已上线,基于扩展强化学习技术,提升数理逻辑、代码处理和深度推理能力。模型在AIME 2024、MATH500和LiveCodeBench评测中表现优异,与OpenAI-o1-Preview相当。用户可在智谱清言-“Zero推理模型”智能体免费使用,开发者可通过API调用体验。来源:AI工具集

    趣丸科技「天谱乐」开创AI音乐新纪元:全球首个多模态配乐大模型

    趣丸科技推出的全球首个多模态配乐大模型“天谱乐”,支持文本、图片和视频生曲,能生成高度匹配的BGM和MV效果。该技术在中文人声唱词上达到专业级效果,减少了电音感,接近音乐发行级别。“天谱乐”已接入唱鸭App,累计创作近1000万首AI歌曲。来源:AI工具集

    可灵AI API新增【虚拟试穿V1.5】和【对口型】

    快手可灵AI(Kling)宣布API能力升级,推出虚拟试穿V1.5模型,支持单件及组合服装输入,能生成试衣视频。同时,新增对口型功能,可实现视频中人物口型与配音同步,提升视频真实感。这些升级将为电商、广告营销和泛娱乐行业带来新机遇,推动业务增长。来源:可灵AI

    OpenAI公布2025年将发布的技术产品:AGI、Agents、GPT-4o升级版

    OpenAI首席执行官Sam Altman宣布,到2025年将发布包括AGI(通用人工智能)、智能体Agents、GPT-4o升级版在内的多项技术产品,以及其他改进,如更好的记忆存储、上下文窗口、成人模式、深度研究特色功能、Sora和个性化定制。来源:第一财经

    大模型的2024年:我们对AI的发展脱敏了

    2024年AI领域发展迅速,大模型更实用但不再惊艳,端侧模型和混合专家技术(MoE)降低成本,多模态研究成新方向。AI搜索、语音交互、视频技术商业化挑战中前行,AI Agent开发门槛降低。AI硬件百花齐放,AI眼镜异军突起。AI游戏从辅助工具成为游戏一部分。中国AI人才梯队规模质量仅次于美国,期待在AI浪潮中领先。来源:新硅NewGeek

    黑芝麻智能发布华山A2000家族芯片平台,打造全场景通识智驾标杆

    黑芝麻智能发布华山A2000家族芯片平台,针对下一代AI模型设计,提供高算力、高性能,支持全场景通识智驾。A2000家族包括A2000 Lite、A2000和A2000 Pro,满足不同自动驾驶需求。集成领先CPU、DSP、GPU等,算力是主流旗舰芯片的4倍,原生支持Transformer模型,推动智能驾驶技术发展。来源:黑芝麻智能

    12月30日·周一

    讯飞医疗成功上市,成为医疗大模型第一股!

    讯飞医疗科技股份有限公司(股票代码:02506.HK)于2024年12月30日在香港联交所主板成功上市,标志着医疗大模型领域的第一股诞生。作为中国医疗人工智能行业的领导者,讯飞医疗在基层医疗服务、医院服务、患者服务和智慧影像等方面均取得显著成就,致力于让医疗服务更便捷,为人类健康未来奋斗。来源:科大讯飞

    支付宝「探一下」新一代AI视觉搜索产品,满足你的好奇心

    支付宝推出新功能“探一下”,基于自研的多模态大模型技术,能够“用AI之眼探索万物”,提供快速、有用、趣味的生成式搜索服务。“探一下”提供三种核心服务:探知识、探灵感、探文本。可以根据自己的需求选择相应的服务,满足用户的好奇心。通过支付宝“扫一扫”界面或支小宝App中访问。来源:支付宝

    智元机器人开源 AgiBot World 百万真机数据集,大幅超越谷歌 Open X-Embodiment

    智元机器人宣布开源全球首个百万真机数据集AgiBot World,超越谷歌Open X-Embodiment。该数据集基于全域真实场景、全能硬件平台、全程质量把控,覆盖家居、餐饮、工业等五大核心场景,包含80多种技能视频。来源:AI工具集

    PixVerse V3.5 正式上线,模型全面升级,10秒极速生成

    爱诗科技宣布PixVerse V3.5版本正式上线,新版本在Turbo模式下10秒内即可生成高质量视频,保持行业领先的语义理解和细节表现力。动漫生成效果显著提升,支持通过文生视频描述特定风格或上传图片生成动漫效果。新增首尾帧功能,激发创作灵感。来源:爱诗科技 AIsphere

    拓元智慧完成近亿元Pre-A轮融资,将聚焦多模态大模型与具身智能技术

    拓元智慧(X-Era AI)宣布完成近亿元人民币的Pre-A轮融资,由粤科金融集团、鹏城愿景基金等投资。资金将用于加速多模态大模型和具身智能技术的研发。公司成立三年,累计营收近亿元,核心团队来自国内外高校和知名企业,已在无人零售、文教创作等领域实现技术深度应用。来源:钛媒体

    OpenAI裂变成了两块:一块营利,一块非营利

    OpenAI近日宣布公司重组,分为营利和非营利两部分,确保通用人工智能(AGI)造福全人类。重组旨在选择最适合长期成功的组织结构,使非营利组织可持续发展,让各部分有效运作。OpenAI计划将营利性公司转变为特拉华州公共利益公司(PBC),并发行普通股。PBC的公共利益将是OpenAI的使命。来源:机器之心

    12月27日·周五

    “理想同学”上架苹果 App Store:支持知识问答、看世界等功能

    理想汽车推出的人工智能应用“理想同学”已上架苹果App Store,版本1.0.0。应用依托自研大模型,具备知识问答、视觉感知能力,能解答汽车、财经、科技等领域问题,支持英文翻译、文本生成。界面简洁,语音输入精准,输出自然流畅。来源:AI工具集

    可图 1.5 图像模型来啦!全新「AI模特」功能上线

    快手可灵AI(Kling)团队发布可图1.5图像模型,模型在画面质量和美感上大幅提升。AI试衣新增“AI模特”功能,借助可灵1.6图生视频能力,用户只需输入文本描述即可生成模特动态展示服装。可灵1.5模型支持尾帧生成。对口型功能新增10款高品质音色,支持选择音色情感,增强视频内容的情感表达。来源:可灵AI

    首个重症医疗大模型来了,腾讯 X 迈瑞发布“启元重症大模型”,已在ICU病房上班

    腾讯与迈瑞医疗合作开发的全球首个重症医疗大模型“启元重症大模型”已在ICU病房投入使用。模型能实时监测患者生命体征,5秒内总结病情,提供诊疗建议,准确率高达95%。能自动生成规范病历,将医生病历编写时间从半小时缩短至一分钟。来源:腾讯

    火山引擎×联想,为 AI 桌面助手“如意”植入豆包大模型,“智” 敬PC新时代

    联想与火山引擎合作,推出全新升级的AI桌面助手“如意”(AI Stick),植入豆包大模型,提供AI搜索、AI写作、AI聊天三大功能,全面提升PC用户体验。如意能精准理解用户需求,提供多领域知识解答,实现智能对话式交互,增强PC智能体验。来源:火山引擎

    联想新一代智能体系统“天禧 AS”发布,明年 Q2 落地 AI PC、AI 手机、AI 平板等

    联想在2024天禧生态伙伴大会上发布了新一代智能体系统“天禧个人智能体系统(天禧 AS)”,计划于2025年第二季度应用于AI PC、AI手机、AI平板等终端。天禧AS运行在传统操作系统之上,具备跨端运行能力,能实现端侧和个人云混合部署,提供个性化AI助理服务。来源:IT之家

    12月26日·周四

    国货之光 DeepSeek V3 横空出世,多语言编程能力全面超越 Claude

    幻方量化旗下人工智能公司深度求索(DeepSeek)开源的最新版AI模型 DeepSeek V3,拥有685B参数和256个专家的MoE架构,在aider多语言编程测评中超越Claude 3.5 Sonnet,夺得第二名。成功率从V2.5的17%提升至48%,编辑格式正确率高达98.7%。DeepSeek V3现已开源,提供代码编写、Bug修复等多种编程能力。来源:AI工具集

    智谱AI 开源 GLM-PC 基座模型 CogAgent-9B,推动GUI交互自动化技术

    智谱AI宣布开源GLM-PC基座模型 CogAgent-9B,是基于GLM-4V-9B训练的专用Agent任务模型,能仅通过屏幕截图预测GUI操作。CogAgent-9B在GUI感知、推理预测准确性等方面显著提升,支持中英文双语交互。来源:GLM大模型

    阶跃星辰图像生成模型全新升级:支持「图生图」,一键风格迁移!

    阶跃星辰宣布其图像生成模型Step-1X系列的全新升级版本Step-1X-Medium,性能提升30%,增强了理解能力和图文一致性,支持“图生图”功能,实现细节增强、风格迁移和小范围局部修改。特别强化了“中国风”内容创作能力,能捕捉东方面孔神韵,支持英文文案生成。来源:阶跃星辰

    腾讯推出 DRT-o1 系列 AI 模型:长链思考推理实现文学翻译“信达雅”

    腾讯研究院推出DRT-o1系列AI模型,通过长链思考推理技术,提升文学作品翻译质量,尤其是在理解比喻和隐喻方面。模型采用多智能体框架,包括翻译员、顾问和评估员角色,通过迭代优化翻译结果。实验显示,DRT-o1在BLEU和CometScore等指标上超越其他模型。来源:AI工具集

    通义从阿里云分拆,并入阿里智能信息事业群,与“夸克”平级

    阿里巴巴旗下的AI应用通义从阿里云分拆,加入智能信息事业群,正式转向C端市场。通义系列由达摩院研发,是阿里AI领域的拳头产品。此次调整意味着通义将与Kimi豆包等AI助手竞争,面临缩小与第一梯队差距的挑战。来源:光子星球

    小米正搭建GPU万卡集群,将对AI大模型大力投入

    小米正在搭建GPU万卡集群,对AI大模型进行大力投入。该计划已实施数月,小米大模型团队成立时已拥有6500张GPU资源。DeepSeek-V2的关键开发者之一罗福莉,将加入小米。小米大模型技术主攻轻量化和本地部署,已在手机端实现13亿参数级别的大模型,效果接近云端60亿参数模型。来源:财联社

    科大讯飞连续中标7大AI项目,两个月内狂揽11亿大单

    科大讯飞旗下讯飞智元中标山东泰安市肥城人工智能行业大模型应用基地项目,投标金额约1.59亿元。项目内容包括智算中心基础设施建设,涉及基建、硬件平台和基础配套软件等。科大讯飞近期已连续中标7大项目,总金额近11亿元。来源:智东西

    12月25日·周三

    Qwen开源视觉推理模型QVQ,像物理学家一样更睿智地看世界!

    Qwen团队发布开源多模态推理模型QVQ,基于Qwen2-VL-72B构建,提升AI的视觉理解和复杂问题解决能力。QVQ在MMMU评测中得分70.3,显著优于Qwen2-VL-72B-Instruct,在数学相关基准测试中表现突出。模型虽有语言混合、递归推理等局限性,但已在视觉推理任务中展现增强能力。来源:魔搭ModelScope社区

    IBM 发布新语言模型 Granite 3.1,性能、上下文能力增强

    IBM发布大语言模型新版本 Granite 3.1,相较于3.0版本,Granite 3.1采用了更密集的架构,能处理多达128,000个令牌,显著提升了处理复杂文本的能力。版本包含8B和2B两种规模模型,均能检测工作流程中的幻觉,提供与RAG相同的责任和信任。IBM计划在未来几个月继续推出Granite 3系列的更新,预计在2025年第一季度加入多模式功能。来源:AI工具集

    “深思熟虑”的 AI:OpenAI 提出全新安全对齐方法

    OpenAI研究人员提出“深思熟虑的对齐”新方法,旨在提升AI模型安全性。该方法通过直接教授模型安全规范,并训练其在生成响应前推理这些准则,将安全原则融入推理过程中。分为监督微调和强化学习两个阶段,使用模型生成的数据和思维链推理,降低资源需求。o1模型部署此技术后,在StrongREJECT基准测试中得分0.88,显著高于GPT-4o的0.37,同时减少了误拒,准确率高达93%。来源:IT之家

    2025 AI Agent剑指何方?两份前沿报告描绘全景地图

    2024年,AI Agent成为热门概念,被视为大模型应用落地的最佳形式。LangChain和Langbase的报告显示,51%的受访者已在生产中采用AI Agent,78%计划近期引入。中型企业最积极,非科技公司与科技公司部署AI Agent的比例相当。OpenAI和谷歌是最受欢迎的大模型提供商。准确性是选择AI Agent的首要因素,其次是安全性和可定制性。AI Agent在研究总结、个人生产力工具和客户服务等领域被广泛采用。性能质量是生产中采用AI Agent的主要顾虑。来源:钛媒体

    做出AI科学家的Sakana AI又放大招,大模型自动搜索人工生命系统

    Sakana AI公司开发了搜索人工生命的系统 ASAL,通过基础模型自动化搜索人工生命模拟,探索可能存在的“生命”。ASAL展示了在多种人工生命基质中发现新生命形式的能力,为人工生命研究提供了新范式,加速了对涌现、进化和智能的理解,有望启发下一代AI系统的发展。来源:机器之心

    杭州CPU黑马宣布数亿元融资,在研服务器AI CPU芯片

    国产CPU创企进迭时空完成数亿元人民币A+轮融资,由香港Brizan III期基金领投,资金将用于高性能RISC-V AI CPU和服务器AI CPU产品的研发及市场拓展。公司总部位于杭州,专注于构建面向大模型时代的原生计算平台,助力AI计算机和机器人等新应用发展。进迭时空已布局全栈计算技术,形成软硬全栈计算系统解决方案,推动RISC-V高性能计算芯片规模化进入行业市场,应用于电力、电信、工业等领域。来源:芯东西

    AI视频创企智象未来又拿新融资,数亿元!

    AI视频生成公司智象未来(HiDream.ai)完成数亿元人民币A轮融资,由合肥产投领投,安徽省人工智能母基金和湖北省长江电影集团等参与。智象未来由加拿大工程院外籍院士梅涛博士创立,专注于视觉多模态基础模型及创新应用。公司自研的“智象大模型”支持文本、图像、视频、3D互生,提供分钟级营销视频生成服务,累计AIGC内容生成量破千万,服务超3万家企业。来源:智东西

    星火浏览器插件新升级!能读会答、能翻译会总结

    讯飞星火浏览器插件新升级,集成了讯飞星火V4.0底层能力,支持Chrome、Edge等主流浏览器。新增功能包括“继续提问”以深入讨论获取答案、网页全局对照翻译、一键朗读以及句子段落总结,提升阅读效率。插件以6M+极小内存运行,提供AI搜索、网页总结、划词收藏等功能,旨在让网页阅读与信息搜索更轻松高效。来源:讯飞开放平台

    Freed AI,AI病历助手,创立1年多,1万付费医生,1000万美金ARR

    Freed AI 是一家成立一年多的AI病历助手公司,已获得1万付费医生用户,实现1000万美金年度经常性收入(ARR)。公司的AI转录系统通过记录患者就诊讨论内容,识别关键术语并创建结构化的病历记录,帮助医生减少73%的文档工作时间。Freed AI的愿景是打造全球顶尖的AI医疗助手。来源:Z Potentials

    12月24日·周二

    马斯克xAI获60亿美元新融资,和特斯拉和SpaceX大搞AI生态

    马斯克的xAI公司宣布完成60亿美元C轮融资,主要投资方包括A16Z、Blackrock、富达管理研究公司等。英伟达和AMD作为战略投资者继续支持xAI基础设施扩展。资金将用于加速基础设施建设、推出数十亿人使用的突破性产品和技术研发,实现公司使命。xAI的新一代旗舰模型Grok 3正在训练中,将推出利用Grok、Colossus和X改变人类生活、工作和娱乐方式的新产品。来源:X.ai

    「像素绽放PixelBloom」完成国家队B2轮融资,打造全球AI办公软件超级工场

    AIGC科技企业“像素绽放PixelBloom”完成B2轮融资,由北京市人工智能产业投资基金领投。融资将用于产品研发和市场拓展,旨在打造全球AI办公软件超级工场。旗下AiPPT.com等产品,通过AI辅助PPT制作,已在全球积累超1000万用户。公司从单一产品向平台化战略转变,构建AI办公软件生态,推动行业发展。来源:36氪Pro

    Hume AI 宣布推出新一代语音语言模型 OCTAVE,能检测微妙的情绪线索

    Hume AI 推出新一代语音语言模型OCTAVE,模型融合了语言准确性和情感理解。OCTAVE结合了Hume AI的EVI 2语音语言模型、OpenAI的语音引擎、ElevenLab的TTS语音设计和Google DeepMind的NotebookLM等功能,旨在提升AI交互的真实性和丰富性。模型采用多模态神经架构,经过超过一百万个情感语音样本的训练,能够识别微妙情绪线索。来源:AI工具集

    12月23日·周一

    上海国资和腾讯联手投资,“大模型六虎”阶跃星辰获数亿美元B轮融资

    AI大模型独角兽阶跃星辰完成数亿美元B轮融资,投资方包括上海国有资本投资有限公司、腾讯投资等。本轮融资将用于基础模型研发,强化多模态和复杂推理能力,扩大C端应用场景。公司由微软前全球副总裁姜大昕博士领导,致力于实现AGI,已发布多款自研基座模型,并与多家企业达成合作。来源:钛媒体AGI

    OpenAI最强推理模型o3发布!AGI测试能力暴涨,最难数学测试分数碾压同行

    OpenAI在第12天发布会直播上推出最强推理模型o3,宣称接近通用人工智能(AGI)。o3在ARC-AGI测试中得分87.5%,远超GPT-3和GPT-4o。o3有完整版和mini版,mini版将于1月底推出。o3在编程竞赛Codeforces中得分2727,数学基准测试AIME 2024中准确率达96.7%。OpenAI将与ARC-AGI基金会合作构建下一个基准测试。来源:AI工具集

    小红书推出AI搜索产品:点点,主打生活服务场景

    小红书近期推出一款名为“点点”的AI搜索产品,主打生活场景搜索,已在各大应用商店上线。核心功能包括自动定位推送旅游攻略、美食景点问题,AI总结全网信息,以及提供视频回复。小红书还在搜索栏中测试“问点点”功能,进一步整合AI搜索能力。来源:AI工具集

    12月20日·周五

    谷歌通用推理模型登场:思考速度比所有模型快5倍,能解摩斯代码,数学物理秒解决

    谷歌发布“Gemini 2.0 Flash Thinking”AI推理模型,模型以极快的速度解决复杂问题并展示思考过程。在数学、代码、指令跟随等多个领域表现卓越,排名第一。模型目前支持32k上下文窗口,不联网,未来将提供更长token和更多工具支持。模型已在谷歌AI Studio免费提供试用。来源:AI工具集

    AI编程助手 Cursor 再获融资1亿美元,估值飙升至26亿美元

    AI编程助手Cursor背后的公司Anysphere完成1亿美元B轮融资,估值达26亿美元。公司收入从4月的年化经常性收入400万美元增长至10月的每月400万美元。Cursor 0.44版本发布,主要更新包括代理性能改进、Yolo模式和光标标签更新,提升代码变更审查直观性和用户体验。来源:AI工具集

    ElevenLabs推出Flash语音对话模型:仅75毫秒延迟,支持32种语言

    ElevenLabs推出最新的人声合成模型Flash,宣称是目前最快的文本转语音解决方案,延迟仅为75毫秒,非常适合低延迟的对话式语音助手。Flash模型有两个版本,Flash v2仅支持英语,Flash v2.5支持32种语言。在音质和情感深度略逊于Turbo模型,在速度上Flash盲测中表现出色。来源:AI工具集

    快手可灵 1.6 模型发布:文本响应度、画面美感及运动合理性均有“明显提升”

    可灵近日推出了1.6版本,实现了图生视频的巨大飞跃。更新重点包括物理规律真实感、人物运动表演和语义理解的大幅提升。新版本在切食物、倒茶、跳舞等动作的物理反馈上表现出色,人物表情和动作的细节也更加丰富自然。文本响应度、画面美感及运动合理性均有明显提升。来源:IT之家

    苹果Mac用户狂喜!ChatGPT深度集成应用,支持 Xcode、Notion 等30+应用

    OpenAI在第11天的直播中宣布ChatGPT与Mac应用的深度集成,特别在编程和写作方面进行了更新。现在,用户可以通过简单的复制粘贴操作,与Warp、XCode等应用协同工作,无需详细交流即可执行任务。ChatGPT支持在语音模式下与Notion、Apple Notes等应用协同工作。新功能已在Mac最新版ChatGPT应用中推出,Windows用户还需等待。来源:量子位

    国家电网发布国内首个千亿级多模态电力行业大模型

    国家电网发布了国内首个千亿级多模态电力行业大模型“光明电力大模型”,模型参数规模达到千亿级别,具备电力知识记忆理解、多模态融合分析等能力,被誉为能源电力领域的人工智能“专家”。模型已在中国信通院、电子标准院通过权威检测,专业能力达到“卓越级”,在电网规划、运维、运行、客户服务等多个领域得到应用,提升了电网安全稳定运行和新能源消纳能力。来源:IT之家

    华人团队力作,震撼开源生成式物理引擎Genesis,可模拟世界万物

    CMU联合20多所研究实验室开源发布Genesis生成式物理引擎,旨在模拟世界万物。引擎能生成4D动态世界,基于通用机器人和物理AI应用的物理模拟平台。Genesis支持并行模拟,速度比现有GPU加速的机器人模拟器快10到80倍,具备物理求解器的统一框架,支持照片级真实感渲染和可微分性。还支持生成式模拟,允许通过语言提示生成多种模态数据。来源:AI工具集

    12月19日·周四

    人人可享 AI 编程:免费版 GitHub Copilot 上线,VS Code 每月补全 2000 次代码

    微软旗下GitHub推出免费版GitHub Copilot,支持开发者在Visual Studio Code中免费使用AI辅助编程服务。全球1.5亿开发者现可在VS Code体验AI编程。免费订阅包括每月2000次代码生成和补全,以及50次编程问题解答。用户可选择Anthropic的Claude 3.5 Sonnet或OpenAI的GPT-4o模型,支持第三方智能体。来源:IT之家

    蚂蚁团队自研的「智能开发神器」,让你秒变 “代码大师”!

    蚂蚁团队自研的面向前端智能研发AI工具WeaveFox,能根据设计图直接生成前端源代码。WeaveFox基于蚂蚁百灵多模态大模型打造,支持多端和多技术栈,包括控制台、移动端H5、小程序等,以及React、Vue等框架。支持二次调整,追求设计稿的一比一还原,旨在为前端开发带来高质、高效、高产的研发体验。该产品预计将于明年正式开放。来源:AI工具集

    OpenAI 加速普及 ChatGPT,开通免费热线电话,老人机也能用ChatGPT了

    OpenAI直播第10天,在美国推出ChatGPT热线电话服务,号码是:1-800-ChatGPT,也可以打1-800-242-8478,每月可免费通话15分钟,支持智能手机、老人机和座机各种电话设备与ChatGPT语音对话。OpenAI还集成了ChatGPT到WhatsApp,给这个号码发消息来获取回复,负责回答问题的是4o mini。来源:量子位

    影石发布AI双摄视频会议一体机Connect,让开会更简单

    影石Insta360发布了智能双摄视频会议一体机Insta360 Connect,集成4K双摄、14阵列麦克风和扬声器,搭载AI算法,为6-14人中小型会议和教育场景提供解决方案。设备支持发言人自动切换和单人追踪,提供多种会议模式,兼容主流会议平台,内置智能白板功能。来源:AI工具集

    微信公众号新增“作者朗读音色”功能:可生成作者音色全文音频

    微信近日推出了“作者朗读音色”新功能,支持用户在阅读公众号文章时通过点击“听全文”来收听作者音色朗读的文章。作者需在“公众号助手”App中录制例句以复刻语气和情感,创建个性化语音。功能目前处于灰度测试阶段,将逐步向用户开放。来源:微信派

    小猿学练机发布:墨水屏+AI教育大模型,突破20毫秒手写延迟

    猿辅导发布小猿学练机,集成AI教育大模型,提供个性化学习支持。设备整合296个教材版本、15亿题库和3亿精讲视频,升级六维能力图谱,提升AI数据处理效率。K12阶段采用EPD墨水屏,低龄儿童使用10.3英寸Kaleido3 KHS彩色墨水屏。手写延迟19毫秒,搭载高通8核处理器,支持27天续航,售价4899元。来源:小猿智能设备

    12月18日·周三

    豆包大模型家族全面升级,重磅发布视觉理解模型

    字节跳动旗下火山引擎发布豆包大模型家族全面升级,包括视觉理解模型,能同时处理文本和图像问题,提供准确回答,大幅降低开发流程复杂度。模型在教育、旅游、电商等领域有广泛应用,价格为每千tokens 0.003元,比行业平均价格低85%。豆包通用模型pro新版本在多个任务处理能力上提升显著。火山引擎还推出全域AI搜索和大模型记忆方案,助力企业智能化转型。来源:AI工具集

    AI数据分析公司Databricks一口气融728亿!AI融资新纪录

    AI数据分析公司Databricks宣布J轮融资目标为100亿美元(约合人民币728亿元),目前已完成86亿美元,超越OpenAI的65亿美元融资,创下全球AI创企融资新纪录。本轮融资后,Databricks估值达到620亿美元,预计2025年自由现金流将首次为正。公司计划将资金用于开发AI产品、战略性收购及扩展国际市场,满足不断增长的市场需求。来源:智东西

    Meta 推出 Apollo 开源模型,让 AI “看懂”视频

    Meta与斯坦福大学合作推出 Apollo 系列AI模型,提升机器对视频的理解能力。Apollo模型包含两个组件,分别处理视频帧和跟踪对象及场景变化,在视频片段间添加时间戳以保持时间感知。模型采用分阶段训练方法,强调训练方法的重要性。Meta优化数据组合,发现10-14%的文本数据与视频内容的平衡能提升语言理解和视频处理能力。来源:AI工具集

    AI 视频生成工具 PixVerse 上线视频生视频功能,体验视频延长乐趣

    爱诗科技推出的AI视频生成工具 PixVerse 上线 Video to Video(视频生视频)功能,可基于实拍视频或影视片段进行延长生成,进一步拓宽AI视频创作的可能性。登录PixVerse,上传视频,选择特效或直接输入提示词,体验无限延长的创作乐趣!来源:AI工具集

    OpenAI o1 推理模型 API 满血开放,成本暴降60%,定制升级

    OpenAI在第9天直播中发布o1模型API全面开放,成本降低60%,具有更高可定制性,新增函数调用、开发者消息和图像分析等功能。GPT-4o音频成本降低60%,mini版本价格降低10倍。OpenAI推出了偏好微调方法,通过成对样本比较学习使模型适应特定应用场景。实时API支持WebRTC,简化开发流程,降低价格,提供Python SDK支持。旨在提高开发效率和模型性能。来源:IT之家

    12月17日·周二

    智谱完成30亿元新一轮融资,2024年商业化收入翻倍

    AI独角兽“智谱”完成30亿元新一轮融资,投资方包括战投及国资,老股东君联资本跟投。资金将用于大模型研发,提升复杂多模态任务处理能力。2024年智谱商业化收入翻倍,API年收入增长超30倍,智谱清言预计年收入超千万,用户超2500万。来源:智能涌现

    图森未来发布图生视频开源大模型“Ruyi”,RTX 4090就能运行

    图森未来发布“Ruyi”图生视频大模型,开源Ruyi-Mini-7B版本。Ruyi基于DiT架构,包含Casual VAE模块和Diffusion Transformer,参数量约7.1B,支持在RTX 4090等消费级显卡上运行。模型支持多分辨率、多时长视频生成,以及首帧、首尾帧控制生成和运动幅度控制。Ruyi旨在降低动漫和游戏内容的开发周期和成本。来源:AI工具集

    Meta Ray-Ban 智能眼镜大更新:“实时 AI”可持续分析用户所见内容

    Meta Ray-Ban智能眼镜v11版本更新,引入“实时AI”功能,能持续观察用户所见并进行自然对话,无需唤醒词即可互动,AI能记住用户提问并主动提供建议。更新还包括实时翻译功能,支持英语与西班牙语、法语、意大利语的交流,以及Shazam音乐识别集成。来源:IT之家

    谷歌发布AI图像生成新工具 Whisk,支持上传多张图片以图生图

    谷歌发布AI图像生成工具Whisk,支持通过上传图像来生成新图像,无需复杂的文本提示。可以为图像的主题、场景和风格提供多张图像作为提示,或者使用谷歌自动填充的AI生成图像。Whisk基于谷歌最新的Imagen 3图像生成模型,旨在提供快速的视觉探索,支持用户编辑和优化生成的图像。来源:AI工具集

    全球最大的仓储机器人公司赴港上市,蚂蚁英特尔是股东

    极智嘉作为全球最大的仓储履约AMR解决方案提供商,已向港交所提交招股书,计划在主板上市。极智嘉已连续五年保持领先地位,服务全球约770家终端客户,包括60家财富500强企业。公司三年半累计营收达59亿人民币,其中超70%收入来自中国大陆以外市场。极智嘉专注于AMR解决方案,旨在提高供应链效率,减少人工依赖,计划将IPO募集资金用于研发、市场扩张和供应链发展。来源:机器人前瞻

    谷歌版Sora迎来 Veo 2,升级4K高清!一句话控制镜头运动,Imagen 3 再进化

    谷歌版Sora升级至Veo 2.0,能根据文本或图像生成4K高清视频,理解镜头控制指令。在模拟现实物理和人类表情方面有显著提升,能精确遵循复杂的指令Prompt。在Meta基准数据集MovieGenBench上,Veo 2.0在整体偏好和指令遵循方面优于其他视频生成模型。同时,图像生成模型Imagen 3也得到增强,能生成多样化的艺术风格图像.来源:AI工具集

    OpenAI直播发布第8天:ChatGPT Search全面升级,免费开放,与Her打通了!

    OpenAI直播第8天,ChatGPT推出Search搜索功能升级,包括移动端优化和多模态信息搜索,结合Her功能实现实时通话中的语音搜索。基于微调后的GPT-4o模型,使用合成数据生成技术。将逐步向所有用户免费开放。来源:AI工具集

    12月16日·周一

    Kimi 发布 k1 视觉思考模型,多项理科测试行业领先

    月之暗面 Kimi 今日发布 k1 视觉思考模型,模型基于强化学习技术,支持端到端图像理解和思维链技术,覆盖数学、物理、化学等基础科学领域。k1模型在多项基准能力测试中表现超越全球标杆模型,现已上线Kimi智能助手APP及网页版,可通过拍照或传图体验模型推理思维链。来源:AI工具集

    腾讯微信正式发布多模态大模型 POINTS 1.5,10B参数下开源模型排名第一

    腾讯发布多模态大模型POINTS 1.5,继承了POINTS 1.0的LLaVA架构,包含视觉编码器、投影器和大语言模型。模型在效率和性能上均有显著提升,特别是在复杂场景OCR、推理能力、关键信息提取等方面表现出色。POINTS 1.5-7B在全球10B以下开源模型中排名第一,超越了Qwen2-VL、InternVL2等领先模型。来源:AI工具集

    PixVerse最新AI特效上线,心情不好,“爆炸”一下!

    爱诗科技PixVerse AI视频生成工具,在社交平台引发特效热潮,共上线12种变身特效,有火爆出圈的“毒液变身”,“压扁”,“爆炸”等,短短几天便迅速火遍抖音,备受好评。让用户创作解压又魔幻的视频内容,成为短视频创作者的”流量密码”。心情不好,“爆炸”一下!进入PixVerse,选择特效【万物皆可羊毛卷】,上传照片,卷起!来源:AI工具集

    OpenAI 推出 Projects,功能全家桶打造 ChatGPT 新交互方式,迈向“万能应用”

    OpenAI在“OpenAI 12天”活动第7天推出了ChatGPT的新功能Projects,功能支持用户上传文件、自定义指令、分组聊天和数据管理,整合Canvas和ChatGPT Search,提升用户体验。通过Projects,用户可以更便捷地执行写作、研究、编程和网络搜索等任务,为多步骤任务执行奠定基础。目前,已向ChatGPT Plus、Pro和Teams用户开放,企业版和教育版用户将在新年初获得访问权限。来源:AI工具集

    久等了,DeepSeek开源 DeepSeek-VL2 MoE视觉模型:支持动态分辨率、解析梗图等

    DeepSeek推出DeepSeek-VL2 AI视觉模型,模型采用DeepSeek-MoE架构结合动态切图技术,提升视觉能力。模型在视觉定位、梗图解析、OCR和故事生成等方面展现出新能力。DeepSeek-VL2在多项评测中取得优异成绩,支持动态分辨率图像和长宽比,能更好地理解和生成视觉内容。来源:AI工具集

    上新!阶跃星辰 Step-1o 千亿参数端到端语音大模型来啦!

    阶跃星辰发布国内首个千亿参数端到端语音大模型Step-1o。模型支持语音和文本混合输入输出,具备高智商和情商,能理解语音背后的情绪信息,提供专业建议和情绪陪伴。Step-1o能创作生动的故事,适用于新闻播报、聊天陪伴等多个场景。近期将接入跃问App,提供实时语音通话服务。来源:AI工具集

    360 自研 AI 大模型 360gpt2-o1 正式上线,数学与逻辑推理新标杆

    360推出新一代AI大模型360gpt2-o1,模型结合多模态和新推理范式,具备自我反思与纠错能力。在数学和逻辑推理任务中,360gpt2-o1超越了前代模型及GPT4o等竞争对手。模型通过合成数据优化、后训练和“慢思考”技术,显著提升推理能力。现已在360智脑API平台上线,供用户和开发者使用。来源:AI工具集

    Meta 发布 Motivo AI 模型,打造更逼真元宇宙体验

    Meta发布 Meta Motivo AI模型,通过控制类人数字智能体的动作来提升元宇宙体验。模型基于行为训练,在Mujoco模拟器中使用AMASS动作捕捉数据集和3000万在线交互样本,通过无监督强化学习算法预训练,展现出更接近人类的行为。来源:AI工具集

    12月13日·周五

    快手开源全球首个”多视角视频生成”工具,解锁无限视角!

    快手开源全球首个”多视角视频生成”工具SynCamMaster,能从任意视点生成开放世界视频,解决了多视点间动态一致性问题。SynCamMaster通过即插即用模块增强预训练的文生视频模型,实现多摄像机视频生成,确保不同视点的内容一致性。实现出色的视点间同步,可扩展到新视图合成任务中。来源:AI工具集

    巨人网络发布”千影”有声游戏大模型,加码”游戏+AI”赛道

    巨人网络在2024年度中国游戏产业年会上发布”千影 QianYing“有声游戏生成大模型,包括游戏视频生成大模型YingGame和视频配音大模型YingSound。YingGame支持开放世界游戏角色动作交互控制和物理仿真特性,YingSound能为视频添加逼真音效。巨人网络AI实验室将推进模型升级,推动游戏创作平权时代的到来。来源:AI工具集

    微软推出14B参数小语言模型 Phi-4:专攻数学等领域复杂推理

    微软近日推出14B参数的小型语言模型Phi-4,模型在传统语言处理能力之外,特别擅长数学等领域的复杂推理。Phi-4在数学竞赛问题上的表现超越了多个更大规模的模型(如70B的Llama 3.3和72B的Qwen 2.5)。已将Phi-4在Azure AI Foundry上开放使用。来源:AI工具集

    OpenAI 数据中心提供商Crusoe融资6亿美元,估值28亿美元

    OpenAI的数据中心提供商Crusoe在最新一轮融资中筹集了6亿美元,由Founders Fund主导,Nvidia、Fidelity等参与,公司估值达到28亿美元。Crusoe开发AI数据中心,出租Nvidia GPU的云服务。公司正在德克萨斯州阿比林建设大型数据中心园区,将为Oracle和OpenAI提供服务,已筹集34亿美元债务以资助配备Nvidia下一代旗舰芯片Blackwell的项目。来源:Z Potentials

    Google 发布了「虚拟现实」版 Android XR,想让你把熟悉的应用「戴在头上」

    Google发布了全新的Android XR操作系统,专为下一代计算构建,兼容各种XR设备,从VR头显到AI眼镜。系统以Android为底层,集成AI能力,提供沉浸式体验,如实时信息查询和多窗口功能。Google提供开发工具包,帮助开发者将2D Android应用快速适配到XR平台。首批搭载Android XR的设备包括三星的Project Moohan VR头显,与高通合作的AR眼镜。来源:极客公园

    千寻智能一年三轮融资数亿元,构建下一代智慧劳动力

    千寻智能由产业老兵和清华教授联合创立的具身智能初创企业,已完成三轮融资数亿元。公司采用”数据金字塔”模式,结合互联网视频数据、仿真数据、遥操数据和强化学习,构建能控制各类机器人执行任务的具身模型,目标是打造下一代智慧劳动力。来源:Z Potentials

    OpenAI版《Her》全量来袭:实时视频对话,你每个动作AI都看得见

    OpenAI直播第六天,推出”Santa Mode”(圣诞模式),实现《Her》式视频通话功能。可通过点击”雪花”与AI进行圣诞老人风格对话,开启摄像头让AI”看见”你。新功能包括实时视频通话、屏幕共享和图片上传,即日将在ChatGPT移动应用中推出。一周内,将向所有团队用户以及大多数Plus和Pro用户开放。来源:量子位

    12月12日·周四

    谷歌深夜炸场:Gemini 2.0 正式发布,主打Agent+多模态

    谷歌发布新一代AI模型Gemini 2.0,性能是前代1.5 Pro的两倍,支持多模态输入输出,包括图像、视频、音频等,可以原生调用 Google Search、代码执行以及第三方用户定义的函数等工具。新模型集成了深度研究功能,能生成复杂主题的研究报告,目前仅对Gemini Advanced用户使用。Gemini 2.0 Flash实验版已开放网页端试用,移动版即将推出,将扩展到旗下更多产品中。来源:AI工具集

    造梦次元完成近亿元人民币融资,多家顶级风投和大厂共同投资

    造梦次元完成近亿元人民币A轮融资,由锦秋基金领投,高榕创投、明势创投、商汤科技等参投。公司专注于多模态AI驱动的内容平台,提供虚拟角色互动体验,日均活跃互动时间超100分钟。融资将加速技术研发和市场拓展,优化创作者工具,拓展海外市场,重视内容安全与合规。来源:Z Potentials

    百度文库AI再升级,「专业PPT生成」功能上线!打工人终于有救了

    百度文库推出「专业PPT生成」功能,通过AI技术帮助用户一键生成高质量PPT。只需输入关键词或主题,可快速获得内容明确、主题突出的专业演示文稿。新功能采用商务化PPT版式,提供清晰的结构和视觉冲击力,支持个性化编辑,包括字体、颜色和动画效果,助力职场汇报和晋升。来源:百度文库服务号

    OpenAI直播第五天,OpenAI正式成为苹果AI的”贤内助”

    OpenAI与苹果达成合作,将ChatGPT集成进iOS、iPadOS和macOS系统。此次整合包括Siri协同、写作工具增强和iPhone相机控制功能。用户可通过Siri启用ChatGPT处理复杂任务,撰写和总结文档,基于视觉智能分析拍摄对象。合作使OpenAI成为苹果AI的“贤内助”,直接触达数十亿苹果设备用户,可能改变科技行业格局。来源:腾讯科技

    谷歌发布智能体原型 Mariner,能帮用户操作表格、在线购物

    谷歌发布名为 Mariner 的智能体原型,基于Gemini 2.0 AI模型,能自主浏览网站执行电子表格、在线购物等操作。Mariner旨在与用户协作,如在购物时可将商品加入购物车,但购买需用户完成。目前仅对少数测试者开放,处于实验阶段。来源:AI工具集

    全球首个”AI 程序员”Devin 全面开放:可独立开发/修复bug,月费500美元

    全球首个AI程序员Devin已全面开放,支持个人开发者和团队以每月500美元订阅服务,包括Slack集成、IDE扩展和技术支持。Devin能熟练使用多种编程语言,独立完成网站和应用构建、部署,能发现修复代码缺陷。Devin采用沙盒计算环境,内置代码编辑器和浏览器,能快速学习和适应新技术,理解复杂的编程上下文。来源:IT之家

    MidJourney 上线 Patchwork:用户化身“造物主”,AI 构造故事宇宙

    Midjourney推出 Patchwork 叙事工具,打造AI驱动的沉浸式故事世界。适用于小说作者、游戏开发者和艺术家等,用户在无限画布上构建角色、风格和背景故事。可以通过Midjourney账户登录,创建和保存包含所有图像链接的JSON文件,支持多达100名用户实时协作构建故事。来源:AI工具集

    12月11日·周三

    字节内部判断AI对话类产品天花板可能不高,提升剪映即梦优先级

    字节跳动反思AI对话产品如豆包的局限性,认为可能仅为AI产品的“中间态”。豆包用户活跃度不高,日均使用时长和频次增长有限,商业化前景不明。字节计划资源转移至多模态产品,提升即梦产品优先级,探索更视觉化、低门槛的AI产品,打造AI时代的“抖音”。剪映月活高达1.7亿,全球排名第二。来源:智能涌现

    面壁智能完成新一轮数亿元融资,CEO称大模型正进入“真刀真枪”阶段

    面壁智能完成数亿元新一轮融资,由龙芯创投等联合领投,北京市人工智能产业投资基金跟投。面壁智能将加速端侧AI大模型商业化,以高性能、低能耗技术服务行业。CEO李大海表示,大模型技术进入实战阶段,面壁智能在端侧智能领域保持竞争力,致力于将高效AI技术带入各行各业。来源:钛媒体AGI

    OpenAI直播第四弹:Canvas全量开放,人+AI协作模式启动

    OpenAI宣布ChatGPT的Canvas功能全量开放,从聊天工具升级为生产力工具。Canvas整合进ChatGPT,支持用户与AI共同完成写作和编码项目。在Canvas上直接运行Python代码和Customgpt调用能力。OpenAI展示了Canvas的文字编辑、审稿、编程和图片识别功能,这一变革使ChatGPT更像一个拥有超强智能的Google Docs。来源:机器之心

    文小言电脑版正式发布,支持Windows和Mac免费下载,双端协同

    文小言电脑版正式发布,支持Windows和macOS系统免费下载,实现与APP的双端协同和消息互通。可以一键拖拽解析多种格式文件,针对原文提问,获得有据可依的回答。提升文本创作的效率,支持边搜索边编辑功能。来源:AI工具集

    DeepSeek V2 系列 AI 模型收官,推出 DeepSeek-V2.5-1210,联网搜索上线

    DeepSeek官方推出V2系列AI模型 DeepSeek-V2.5-1210 上线,支持联网搜索功能。模型在数学、代码、写作等方面取得进步,优化了文件上传。可在网页端体验搜索功能,API暂不支持。模型能分析网页信息,提供全面、准确答案。DeepSeek宣布V2系列模型收官,将告一段落,正在打造更强大的下一代基座模型 DeepSeek V3,敬请期待。来源:AI工具集

    ChatGPT语音负责人创业AI语音,a16z首轮重注4000万美金

    ChatGPT语音负责人Conneau,创立 WaveForms AI 专注于音频LLM的新公司,旨在2025年前推出与OpenAI和Google竞争的AI音频产品。已获得a16z领投的4000万美元种子资金,开发能“用耳朵感受AGI”的技术,强调人机互动应与人际互动互补,而非取代。来源:Z Potentials

    12月10日·周二

    字节视频生成模型PixelDance上线豆包,每日免费生成10个视频

    字节跳动的PixelDance视频生成模型在豆包电脑版开启内测,用户每日可免费生成10个视频。模型于9月底首次发布。内测反馈,10秒视频切换3-5次镜头效果最佳,场景和角色保持一致性。豆包将持续优化,助力用户创作。来源:IT之家

    智源研究院开源3D生成模型See3D,看3.2亿帧视频学会3D生成

    智源研究院推出无标注视频学习的3D生成模型See3D,采用新型视觉条件技术,能从大规模互联网视频中生成几何一致的多视角图像。See3D支持零样本和开放世界的3D生成,无需昂贵的相机标注,具备高效的3D编辑和表面重建能力。模型、代码、Demo均已开源。来源:AI工具集

    OpenAI 正式推出视频生成王者 Sora ,网页挤爆了!

    OpenAI 正式发布视频生成大模型 Sora 及其新版本 Sora Turbo,提供1080p分辨率、最长20秒的视频生成能力,支持宽屏、竖屏和方形比例。Sora Turbo版本提升了生成速度。所有视频带有C2PA元数据以验证来源。ChatGPT Plus用户每月可免费生成50个480P视频,Pro用户(月费200美元)享有更高分辨率和更长时长。来源:机器之心

    北京国资独家投资,小米投资首家工业大模型公司小雨智再造获亿元A轮融资

    北京小雨智造科技有限公司宣布完成亿元A轮融资,由北京信息产业发展投资基金独家投资。公司专注于工业领域大模型机器人技术,为机器人打造“通用大脑”。小雨智造已与松下等企业合作,推进智能焊接机器人市场,在航空航天、船舶制造等领域布局。来源:钛媒体AGI

    谷歌发布最强量子芯片 Willow,5分钟颠覆138亿年计算极限

    谷歌宣布最新量子芯片Willow取得重大突破,在基准测试中5分钟内完成一项标准计算,而最快的超级计算机需超过10^25年。Willow芯片破解了近30年的量子纠错挑战,能在更多量子比特下成倍减少错误。来源:AI工具集

    12月09日·周一

    商汤办公小浣熊2.0,上新!AI原生一站式创作空间来了

    商汤科技推出升级版的办公小浣熊2.0,集成多项AI功能,包括信息检索、方案输出、文档创建和智能规划,用户通过“规划、分析、写作”三步法高效完成工作任务。升级版增强了数据分析和文档解析能力,可以通过对话生成文档,实时进行数据可视化和分析。来源:AI工具集

    马斯克新文生图模型Aurora闪现!网友抢时间疯狂实测:人物生成超逼真

    马斯克的xAI公司短暂上线新文生图模型Aurora,生成的人物图像逼真又高清。Aurora能理解简单的提示生成高质量的图像,能生成受版权保护角色和公众人物图像。模型上线数小时,网友已抢先进行实测,在人物写实生成方面表现出色。马斯克表示只是测试版,将很快改进。来源:AI工具集

    英伟达发布大模型NVILA,专注于优化准确性和效率

    英伟达发布新型开放式视觉语言模型NVILA,专注于提高准确性和效率。与LLaVa OneVision模型相比,NVILA的训练成本降低了4.5倍,微调内存减少了3.4倍,预填充和解码延迟降低了近2倍。在视频基准测试中表现优于GPT 4o Mini。来源:AI工具集

    智谱AI再放大招!全新多模态模型 GLM-4V-Flash 免费开放!

    智谱AI推出首个免费多模态模型 GLM-4V-Flash ,该模型基于4V系列,提升图像处理精确度,降低开发门槛。模型支持26种语言,具备图像描述生成、分类等高级功能,适用于信息提取、内容创作等多个场景。来源:AI工具集

    Meta今年压轴开源 AI 大模型Llama 3.3,700亿参数,性能比肩4050亿

    Meta发布AI大模型Llama 3.3,拥有700亿参数,性能媲美4050亿参数的Llama 3.1。模型效率更高、成本更低,支持8种语言,可在标准工作站上运行。采用优化的transformer架构,通过SFT和RLHF微调,确保与人类偏好一致。上下文长度为128K,支持与外部工具集成。来源:AI工具集

    OpenAI强化微调登场:几十条数据o1-mini反超o1暴涨80%,奥特曼:今年最大惊喜

    OpenAI的第2天直播推出新功能“强化微调”,仅需几十个例子可创建特定领域的专家模型。CEO奥特曼称为2024年最大惊喜。微调后的o1-mini模型得分提高80%,超过o1正式版。OpenAI已开启研究计划,支持开发者申请强化微调API的alpha版本。来源:量子位

    马斯克 xAI 公司 Grok AI 聊天机器人向免费用户开放,不再是会员专属

    马斯克的AI聊天机器人Grok已向X的免费用户开放,每两小时可最多发送10条消息。Grok定位为幽默型AI助手,今年增加了文生图功能,用的是Flux模型。来源:钛媒体AGI

    12月06日·周五

    LiblibAI x 星流:正式推出新一代自研图像大模型Star-3 Alpha

    LiblibAI今日宣布推出新一代自研图像大模型Star-3 Alpha。模型基于F.1基础算法架构,提升图像精准度、色彩表现力和美学捕捉能力,提供高级感和真实感。可通过星流官网、Lib官网在线生图功能及API开放平台体验。来源:AI工具集

    通义实验室开源 ClearerVoice-Studio,高效去除背景噪声

    阿里通义实验室语音团队开源ClearerVoice-Studio技术框架,集成语音增强、分离和音视频说话人提取功能。通过复数域深度学习算法,有效消除背景噪声,保留语音清晰度,保持语音失真最小化。可在Github和HuggingFace Space上查看和试用。来源:AI工具集

    谷歌DeepMind推出AI气象预测模型GenCast,8分钟预测15日天气

    DeepMind气象预测大模型GenCast在Nature发表,能在8分钟内完成15天的天气预报,准确度超过全球顶尖中期天气预报系统ENS。GenCast基于扩散模型和Transformer技术,分辨率为0.25度经度/纬度。在1320种实验条件下,GenCast在97.2%的任务中比ENS更准确,在36小时后的预测中表现突出。来源:AI工具集

    豆包大模型团队开源FullStack Bench代码全新基准,覆盖超11类真实编程场景

    字节跳动豆包大模型团队开源全栈编程代码评估数据集FullStack Bench。FullStack Bench覆盖超11类真实编程场景和16种编程语言,包含3374个问题,有效评估大模型代码开发能力。为AI在真实编程场景中的表现提供快速评估参考。来源:AI工具集

    OpenAI第一场直播就炸场!o1满血版上线,ChatGPT Pro订阅费:200美元/月

    OpenAI发布最强推理模型o1满血版及其Pro版本,ChatGPT Pro订阅计划定价为200美金/月,成为全球最贵的大模型订阅服务。满血版o1在数学、代码能力上显著提升,推理速度比预览版快60%,支持多模态输入。Pro版本为订阅用户提供o1满血版的不限量访问权限,展示在高难度科学问答上的卓越表现。来源:量子位

    12月05日·周四

    海螺AI推出图生视频模型I2V-01-Live,让静态二维图像动起来

    海螺AI推出图生视频模型I2V-01-Live,能将静态图像转成动态视频。模型基于深度学习,增强动作流畅度和真实性,支持多风格适配。上传2D插图,选择I2V-01-Live模型即可生成动态视频。来源:AI工具集

    DeepMind最强「基础世界模型」诞生!单图生1分钟游戏世界,解锁下一代智能体

    谷歌DeepMind发布第二代基础世界模型Genie 2,能从单图生成长达1分钟的3D游戏世界。支持键盘鼠标操作,模拟复杂交互和物理效果,为具身智能体提供无限训练数据。Genie 2的涌现能力包括物体交互、角色动画、物理效果等,为AI研究和游戏开发带来新可能。来源:新智元

    谷歌领跑AI视频生成赛道:抢先 OpenAI Sora推出Veo模型,可生成1080P高清视频

    谷歌宣布在Vertex AI平台上推出Veo模型的私测预览版,面向企业开放。Veo模型能根据文本或图像提示生成1080p高清视频,提供多种视觉风格。Veo生成的视频逼真度极高,如狗狗的毛皮和项圈在运动中保持一致,难以区分是否由AI生成。来源:IT之家

    OpenAI官宣12天12场新品发布会

    OpenAI宣布将举行为期12天的系列活动,期间每天发布一个新产品或样品。活动将包括备受期待的文字转视频工具Sora和新的推理模型。OpenAI CEO透露,周活跃用户数已超3亿,目标是到2025年增至10亿。来源:财联社

    红杉美国最新洞察:2025 年将是 Agent 元年!AI 智能体进入“群体协作”时代

    红杉美国合伙人Konstantine Buhler预测,2025年AI智能体将进入“群体协作”时代,多个智能体网络将协作完成复杂任务。他强调,AI技术将在医疗和教育领域发挥重要作用,降低成本、提高效率,推动社会进步。来源:有新Newin

    12月04日·周三

    文心一言上线“深度写作”专业版功能:会自己搜素材的AI写作

    百度AI推出文心一言“深度写作”专业版,能自动搜索素材并创作个性化文章。可通过上传资料或网盘素材,使内容更具体。适用于多种文档创作,模板将持续更新。来源:百度AI

    刚刚!字节跳动豆包上线图片理解,大模型走向多模态

    字节跳动豆包APP和PC端新增图片理解功能,能识别图片内容并回答相关问题,如景点位置和动漫人物身份。标志着AI大模型向多模态发展,更加实用。豆包已成为中国日活用户最高的AI大模型产品,AI应用行业月活跃用户规模同比增长373%。来源:钛媒体

    亚马逊年末甩王炸!6款大模型、3nm AI芯片、全球最大AI计算集群,苹果罕见站台

    亚马逊在AWS re:Invent大会上宣布将推出6款大模型和3nm第三代AI训练芯片Trainum3,以及最强AI服务器Trn2 UltraServer。Amazon Nova系列模型涵盖文本、图像和视频,Reel模型支持生成6秒视频。AWS与Anthropic合作构建全球最大AI计算集群,Bedrock服务更新包括自动推理检查、多Agent协作和模型蒸馏功能.来源:智东西

    即梦2.1模型上线,一键生成图文融合设计图

    字节即梦AI发布全新绘图模型v2.1,10秒内一键生成中文海报。解决了中文嵌入问题,支持直接在图片上绘制中英文字体,具有高审美和泛化能力。可通过简单描述生成个性化海报,但需注意避免抄袭。来源:AI工具集

    The Browser Company计划推出新型AI网络浏览器Dia

    The Browser Company计划于2025年推出新款AI网络浏览器Dia。Dia具备人工智能功能,如从互联网获取事实、提供写作灵感、总结网页内容,能从打开的标签中复制信息,如亚马逊链接,插入电子邮件。来源:AI工具集

    WPS Office推出 WPS AI 语音速记功能

    WPS Office推出了WPS AI语音速记功能,通过WPS AI技术得到增强,与WPS云文档深度整合。支持实时录音和音频导入转文字,实现中英等多种语言互译,确保录音文件的完整性。声纹识别和AI自动总结功能提高转写准确率和速度,提供无缝衔接,确保高安全性能。来源:AI工具集

    12月03日·周二

    腾讯正式发布AI视频产品:腾讯混元文生视频,预计下月推出图生视频模型

    腾讯今日正式推出了“腾讯混元文生视频”AI视频生成工具,该模型在指令遵循、动态表现、画面稳定性等方面表现出色,尤其在科幻、魔幻风格上给人惊喜。用户可以在腾讯元宝免费体验,每天免费3次。同时,腾讯混元文生视频已在Hugging Face和Github上开源,提供130亿参数的模型、权重和推理代码,供开发者免费使用。来源:AI工具集

    全面对决Suno,国产AI音乐三巨头的突围之战

    国内AI音乐领域三巨头——字节跳动的海绵音乐、昆仑万维的天工SkyMusic和趣丸科技的天谱乐,正与全球顶级产品Suno展开激烈竞争。通过提供个性化音乐生成、多模态配乐等创新功能,降低音乐创作门槛。来源:钛媒体

    快手预告“可灵 AI”导演共创计划作品 12 月 6 日上线:联合李少红、贾樟柯、叶锦添、薛晓路等

    快手宣布“可灵AI”导演共创计划作品将于12月6日上线,计划自9月9日启动,由9位导演联合发起,涵盖多种题材。9部短片全部由可灵AI进行视频生成。可灵AI服务用户已超500万,累计生成5100万个视频和1.5亿张图片,商业化单月流水超千万人民币。来源:IT之家

    全网热评的李飞飞世界生成模型,真的能构建物理世界吗?

    李飞飞的空间智能World Labs发布了世界生成模型,一个能从单张图片生成3D物理世界的AI系统,引起AI界热议。该技术突破在于直接生成三维场景,遵循物理规则,具有深度感和空间感,能实现场景控制和动态效果。来源:腾讯科技

    OpenAI考虑在AI产品中引入广告

    OpenAI首席财务官Sarah Friar透露,公司正在考虑将广告引入AI产品中,寻求新的收入来源。目前没有积极推进广告业务的计划,公司对探索其他收入渠道持开放态度。广告经验团队包括曾在Instagram和谷歌搜索广告团队任职的成员。目前,OpenAI主要通过出售AI模型API访问权限、ChatGPT会员收入和与微软合作获得收益。来源:第1财经

    360推出的自研360智脑7B参数大模型升级版

    360公司推出了自研AI大模型360智脑7B参数的升级版——360Zhinao2-7B。在中英文通用能力、数学逻辑推理能力方面有显著提升,在国内外同尺寸开源模型中多项能力排名第一。模型基于Transformer架构,采用自注意力机制和优化策略,已在GitHub和HuggingFace模型库上线。来源:AI工具集

    12月02日·周一

    微信公众号后台新增“AI 配图”功能,支持文章配图和封面配图

    微信公众号后台最近推出了“AI 配图”功能,支持创作者通过简单的文字描述在十几秒内生成四张风格和比例可调的候选图片,用于文章配图。极大提高了内容创作的效率,还有效规避了图片版权问题,增强了内容生产的安全性。同时,文章封面图也支持AI配图。来源:IT之家

    ChatGPT两岁,OpenAI 10亿用户计划曝光!

    ChatGPT 已经2岁了!OpenAI下一个目标瞄准十亿用户,预计明年放出AI智能体产品。就在生日这天,马斯克还送上了大礼:阻止OpenAI全面盈利的一份诉状书。来源:新智元

    实测腾讯元宝2.0:图文视频啥都能搜,论文绘画全搞定

    腾讯元宝2.0全新升级,集成AI搜索、阅读、生图等功能,打通公众号、视频号等资源,提供深度研究、脑图整理服务。新增创意绘画、灵感图库、AI美照等图片功能,以及应用广场。同时整合腾讯文档、电脑管家、搜狗输入法,提升工作效率和用户体验。来源:量子位

    可灵AI新增「AI换衣」功能!1.5 模型支持「首尾帧」

    可灵AI 推出新功能“AI试衣”,用户只需2张图即可解锁新造型。1.5模型支持高品质视频制作,新增“首尾帧”功能,5s/10s均支持使用首尾帧。可灵AI 上线「灵感学院」!新手入门免费课程,帮你快速上手可灵AI。来源:可灵AI

    对话智谱CEO张鹏:大家对大模型期待过高,Scaling Law还有很大增长空间

    CEO张鹏认为,大家对大模型期待过高,但Scaling Law仍有增长空间。智谱AI定位“开放平台”,聚焦基座模型研发,已获九轮融资近60亿元,致力于AI智能体应用,推动人机交互变革。来源:钛媒体


  • 11款免费好用的AI翻译工具和软件,覆盖100+语言

    对于个人、学生、上班族和游客来说,使用翻译应用程序和服务可以帮助打破语言和沟通障碍。在本篇文章中,我们将介绍11个好用的免费AI翻译工具,无论你是需要翻译网站、进行双语对话,还是理解一段外语,这些人工智能翻译工具都可以帮助你轻松翻译上百种语言。

    沉浸式翻译

    沉浸式翻译是一款支持双语对照的网页翻译插件,能翻译网页、PDF、EPUB电子书和视频字幕,同时提供原文与译文的对照,帮助用户更好地理解外语内容。插件内置了多种顶尖翻译引擎,如DeepL、OpenAI、谷歌翻译等,用户可以根据自己的偏好选择。还具备鼠标悬停翻译和输入框翻译等便捷功能,适合语言学习者、研究人员、商务人士、技术开发者和内容创作者等不同用户群体使用,提升语言理解和学习效率。

    ✅产品优点

    • 双语对照:提供原文与译文的对照,有助于用户更准确地理解外语内容。
    • 多格式支持:支持网页、PDF、EPUB电子书和视频字幕的翻译,满足不同场景的需求。
    • 顶尖翻译引擎:集成了DeepL、OpenAI、谷歌翻译等知名翻译引擎,确保翻译质量。
    • 便捷交互:支持鼠标悬停翻译和输入框翻译,提高用户翻译效率。
    • 格式保留:在翻译PDF和EPUB文件时,能够保留原文件的格式,便于阅读和引用。

    ⛔产品不足

    • 翻译引擎限制:虽然支持多种翻译服务,高级翻译引擎如DeepL和OpenAI需要付费或配置API密钥才能使用 。
    • 文件大小限制:对于大型PDF文件,翻译可能会受到文件大小的限制,超大文件可能需分割处理 。

    DeepTranslate

    DeepTranslate是一个免费的AI双语翻译器,支持超过142种语言,能一键生成双语网页,帮助用户快速准确地翻译各种内容,包括新闻、学术论文、社交媒体帖子等。具有自定义翻译风格、友好的用户界面和多平台兼容性,适合学生、研究人员和普通用户使用,提高工作效率和理解力。

    ✅ 产品优点

    • 多语言支持:DeepTranslate 支持超过142种语言的翻译,覆盖了全球大部分语言,满足不同用户的需求。
    • 双语页面生成:用户可以一键生成双语网页,方便对比不同语言的内容,提升理解力。
    • 自定义翻译风格:通过内置的AI提示,可以根据需要自定义翻译风格,确保翻译结果符合行业术语和特定语境。
    • 快速准确:依托强大的翻译引擎,DeepTranslate 能快速、准确地翻译复杂的内容,包括习语和专业术语。

    ⛔产品不足

    • 语言支持限制:与Google Translate等相比,DeepTranslate 支持语言主要集中在欧洲语言、中文、日文和韩文。
    • 文件大小限制:免费版本的文件翻译有大小限制,不适合翻译大型文件。

    百度翻译

    百度翻译官网

    百度翻译是一款由百度公司提供的在线AI翻译工具,提供中文和190多种其他语言之间的快速机器翻译,可以将文字和语音翻译成目标语言,并朗读出来。相较于其他翻译工具,在汉译时,更好地支持习语、俚语和文化细微差别。此外,百度翻译还提供了一些其他功能,例如文档翻译、语音翻译、短语翻译等。

    ✅ 产品优点

    • 支持多种语言之间的翻译,覆盖了全球大多数国家和地区
    • 提供多种特色功能,如双语对照、英文润色、同反义词、双语例句等
    • 支持多个平台,包括网页端、桌面端、移动端应用程序、浏览器插件等

    ⛔ 产品不足

    • 有时翻译结果可能不够准确,需要进行手动修正

    谷歌翻译

    谷歌翻译

    谷歌翻译是由谷歌于2006年推出的免费多语言神经机器翻译服务,提供130多种不同语言之间的即时翻译,包括英语、中文、西班牙语、法语、阿拉伯语等,并且支持的语言之间可以进行任何方向的翻译。除开在线翻译外,谷歌翻译还支持即时翻译、图片翻译、语音翻译、离线翻译、文档翻译和网页翻译等。

    ✅ 产品优点

    • 免费、快速、支持多种语言,并且可以离线使用。
    • 神经机器翻译提供了高质量的翻译

    ⛔ 产品不足

    • 国内用户可能无法直接访问
    • 复杂的句子、不常见的方言或俚语中翻译质量不佳
    • 没有提供词典、例句、同义词等更加全面的功能

    火山翻译

    火山翻译

    火山翻译是由字节跳动 AI Lab(人工智能实验室)自主研发推出的AI翻译工具,支持120多种语言间互相翻译,内置权威词典、支持多种查词方式。10+ 语种丰富音色免费开放,练听力练跟读。提供PDF文字格式整理、对照阅读模式、个人术语库等特色功能。

    ✅ 产品优点

    • 支持的语言翻译覆盖范围广
    • 支持网页端、浏览器插件、微信小程序等多个平台
    • 搭配火山写作,可进行AI英文拼写和语法修改

    ⛔ 产品不足

    • 暂未提供iOS和Android端应用程序
    • 网页端的翻译暂不支持图片、语音翻译等,需要在小程序使用

    DeepL

    DeepL

    DeepL是一款备受用户好评的在线AI翻译工具,凭借其准确的翻译质量和高效的语言识别能力,成为了市场上备受瞩目的翻译工具之一。DeepL的翻译质量在业内处于领先地位,其翻译结果比其他翻译工具更为准确。由于DeepL的翻译算法采用了先进的深度学习技术,能够模拟人类在翻译过程中的思维和技巧,从而更准确地把握句子的语义和上下文信息。

    ✅ 产品优点

    1. 英语和德语翻译质量较好
    2. 支持多个平台,包括网页端、Mac、Windows、iOS、Android、Chrome扩展
    3. 匹配上 DeepL Write 人工智能写作助手可检查拼写和语法

    ⛔ 产品不足

    1. 由于服务器在国外,有时网站加载速度较慢
    2. 支持的语种相对较少,目前提供30多种语言的翻译
    3. 免费版单次输入的翻译字符数不能超过3000字符

    必应翻译

    必应翻译

    必应翻译是微软作为其必应搜索引擎的一部分而提供的机器翻译服务,支持70多种不同语言的免费翻译,包括常见的英语、西班牙语、法语、德语、汉语、日语、俄语等通用语言之间的翻译。

    ✅ 产品优点

    • 与微软旗下其他产品(如Bing、Office、Skype和SwiftKey键盘)有集成
    • 翻译速度快,支持多种通用语言

    ⛔ 产品不足

    • 语言覆盖范围相比其他产品要少,翻译中偶尔会出现不准确的地方
    • 免费版本可以连续翻译的文本数量有限制,不同语言的翻译质量也不同

    腾讯翻译君

    腾讯翻译君

    腾讯翻译君是腾讯最新出品的实时会话翻译软件,支持中、英、日、韩等17门语言之间的翻译。具有精准语言识别,高效、免费等特点。非常适用于境外旅游、对外交流、口语练习等情境,让你体验同声传译般的流畅和快感。

    ✅ 产品优点

    • 提供AR翻译、口语评测、同声传译等特色功能
    • 支持免费使用全球最大最权威的《新牛津词典英汉双解大词典》

    ⛔ 产品不足

    • 支持的语言数量相对较少
    • 需要连接互联网才能使用全部功能,无法离线使用
    • 不支持文档翻译、网页翻译等翻译模式

    搜狗翻译

    搜狗翻译

    搜狗翻译是一款由搜狗搜索推出的AI翻译产品,它结合了机器翻译与人工翻译的优点,支持中、英、法、日等50多种语言之间的互译,并且提供多种功能。搜狗翻译可以应用于学习、生活和工作等多个场景,无论是需要查阅词典、翻译长文、还是进行实时对话翻译,它都能提供有效的帮助。

    ✅ 产品优点

    • 功能丰富,支持语音翻译、文本翻译、拍照翻译、双人对话等
    • 支持英文写作AI批改,可智能校正错误,升级句式

    ⛔ 产品不足

    • 在俚语和习惯用语的翻译方面也存在一些不足
    • 支持的语种还有待提高,不支持一些较为小众的语言

    阿里翻译

    阿里翻译

    阿里翻译是由阿里巴巴提供的多语种在线实时AI翻译网站,由阿里巴巴达摩院机器智能技术实验室提供技术支持,提供多种领域、覆盖200+语言的智能机器翻译服务。阿里翻译还支持文档翻译、图片翻译、视频翻译、语音翻译等多模态翻译能力。

    ✅ 产品优点

    • 翻译准确性较高,由达摩院的AI技术加持
    • 覆盖的语言多,支持全球214种语言翻译
    • 适用场景范围广,适用于跨境电商、语言服务、翻译教育、企业办公等场景

    ⛔ 产品不足

    • 仅提供网页端体验和API接入,没有移动端应用程序
    • 更加适合于商业公司的产品接入适用,不适合个人用户日常高频使用

    讯飞智能翻译

    讯飞智能翻译

    讯飞智能翻译是由科大讯飞推出的一个快速准确、稳定可靠的人工智能翻译平台,支持超过140多种语言间进行互译,并提供文档翻译、文本翻译、语音翻译、图片翻译、网页翻译、视频翻译、音频翻译等多种翻译模式。

    ✅ 产品优点

    • 结合讯飞先进的语音识别和翻译技术,语音翻译准确度高
    • 支持23种文档格式翻译,保留原版格式样式和排版

    ⛔ 产品不足

    • 目前仅提供网页端使用,不支持其他终端设备
    • 免费版文本翻译限制为2000字符
    • 需要登录注册后方可使用翻译功能
  • AI快讯:8月第1期(8月1日到8月10日的AI行业新闻)

    AI工具集采用每月3期的版面集合,每日更新AI行业的最新快讯,本期为8月第1期(8月1日到8月10日)的AI行业新闻集合。

    AI快讯8月第一期

    8月10日

    • 百度网盘今日推出基于文心大模型的“云一朵”—— 国内首个基于大模型的网盘智能助理。官方表示,用户可通过该智能助理完成快速搜索文件和视频、总结知识、翻译文档、内容创作等需求。(新闻来源:IT之家
    • Anthropic 发布了更快、更便宜的 Claude Instant 1.2 版本,企业可通过 API 访问。该版本结合其 Claude 2 的优势,在数学、编码、推理和安全等关键领域有显着的进步。(新闻来源:Anthropic
    • 据英国《金融时报》援引两位与英伟达关系密切的未具名人士报道称,百度、字节跳动、腾讯和阿里巴巴向英伟达下单订购 50 亿美元的芯片,这些芯片对人工智能系统至关重要。(新闻来源:界面新闻
    • 美国国防高级研究计划局 (DARPA) 计划发起一项人工智能网络安全挑战赛,与 AI 公司 Anthropic 、OpenAI、微软和谷歌合作,要求参赛者使用人工智能识别和修复软件漏洞,尤其是关键基础设施的代码。(新闻来源:The Verge
    • Tome 是一家利用人工智能让制作和设计演示文稿变得更加容易的初创公司,该公司已与投资者讨论筹集新资金的事宜,这可能使其估值翻一番,最高可达 6 亿美元。据一位知情人士透露,新融资金额可能高达 6000 万美元。(新闻来源:The Information
    • IBM 表示将在其旗下的企业人工智能平台 watsonx 上托管 Meta 平台的人工智能大语言模型 Llama2,为客户提供了对该模型的早期访问,以帮助企业将人工智能集成到工作流程中。(新闻来源:IBM Newsroom
    • 人工智能和机器学习开发平台 Weights & Biases 宣布获得了 5000 万美元的新一轮融资,使其估值达到 12.5 亿美元。该公司的机器学习平台,可帮助开发人员更快地构建更好的模型。(新闻来源:TechCrunch
    • Deepset 是一个构建由类似于ChatGPT的大型语言模型支持的企业应用程序的平台,今天宣布在由 Balderton Capital 领投、GV 和 Harpoon Ventures 参与的一轮融资中筹集了 3000 万美元。(新闻来源:TechCrunch
    • 英国伦敦最大的百货商店 John Lewis(约翰—路易斯)宣布与 Google Cloud 签署了新的战略合作伙伴关系,其中一部分将涉及人工智能和机器学习的扩展,该笔交易在未来五年内价值 1 亿英镑。(新闻来源:The Grocer

    8月9日

    • Stability AI 宣布推出名为 StableCode 的代码生成大语言模型,旨在帮助用户生成编程语言代码。StableCode 提供三个不同的版本:一般用例的基座模型、指令微调模型以及可支持多达 16,000 个 token 的长上下文窗口模型。(新闻来源:Stability AI Blog
    • 英伟达宣布推出新一代 GH2000 Grace Hopper 超级芯片,新芯片将于2024年第二季投产。同时宣布基于GH200构建的新服务器设计。(新闻来源:东方财富网
    • 英伟达与 Hugging Face 合作提供云端 AI 训练服务,该项名为 Traning Cluster as a Service 的服务将于未来几个月推出,以简化企业自定义生成 AI 模型的创建。(新闻来源:TechCrunch
    • 初创公司 MindsDB 宣布获得 Nvidia 旗下 NVentures 领投的 500 万美元投资。该公司是一个以人工智能为中心的应用程序的数据库平台,可以将数据库连接到流行的人工智能框架。(新闻来源:VentureBeat
    • 初创公司 Dropzone AI 宣布已从 Decibel Partners 领投的一群投资者处筹集了 350 万美元的种子资金,该公司推出自主人工智能安全代理,旨在将调查安全警报的繁琐且耗时的工作自动化。(新闻来源:VentureBeat

    8月8日

    • 微软的 AI 聊天机器人 Bing Chat 现已支持在所有的手机移动端浏览器中访问,不再只限制在自家旗下的 Edge 浏览器,此前 Bing Chat 于 7 月底开始向 Chrome 和 Safari 桌面端浏览器开放。(新闻来源:The Verge
    • OpenAI 推出了一款名为 GPTBot 的新网络爬虫,用于从互联网收集公开数据来训练人工智能模型。GPTBot 的目标是更加透明、正确地识别自己,以便网站管理员在 robots.txt 文件中允许或禁止该爬虫访问。(新闻来源:Search Engine Land
    • 据彭博社消息,知名 AI 公司 OpenAI 对一家名为 Open Artificial Intelligence(开放人工智能)且拥有域名 www.open.ai 的公司提起诉讼,声称该名称侵犯了 OpenAI 商标,并造成消费者混淆。(新闻来源:IT之家
    • 据广汽研究院官方消息,广汽正式推出广汽AI大模型平台,该平台是汽车行业首创的大模型平台技术,将在近期搭载于高端智能轿跑昊铂GT。(新闻来源:广汽研究院官微
    • 百川智能正式发布首个闭源大模型Baichuan-53B,参数量为530亿。据介绍,53B大模型在写作、文本创作能力更加完善。百川智能CEO王小川表示,本次发布的新模型计划主要面向B端落地。(新闻来源:36氪
    • 据36氪报道,近日大模型中间件厂商“澜码科技”完成数千万元A轮融资,该轮由IDG资本、联新资本、Atom Capital参与投资。(新闻来源:36氪
    • 据外媒 9To5Google 报道,谷歌日前上线了一个名为“语法检查”的功能,该功能类似 Grammarly,可以为用户提供语法纠错。用户在谷歌搜索框中输入英文句子后,谷歌便会提示用户拼写中可能存在的问题。(新闻来源:IT之家
    • 麻省理工学院和 Dana-Farber 癌症研究所的研究人员利用机器学习创建了一个名为「OncoNPC」的计算模型,可以分析约 400 个基因的序列,并利用该信息来预测特定肿瘤在体内的发生位置。(新闻来源:MIT News
    • Tractian 是一家利用人工智能预测机械故障的工业资产监控公司,宣布完成 4500 万美元的 B 轮融资,由风险投资公司 General Catalyst 和 Next47 领投。(新闻来源:VentureBeat
    • HR 初创公司 One Model 宣布在 Riverwood Capital 领投的一轮融资中筹集了 4100 万美元,该公司提供利用人工智能帮助雇主做出招聘、雇用、晋升、裁员和一般工作场所规划决策的平台。(新闻来源:TechCrunch
    • 初创公司 Multiplayer 宣布筹集了 300 万美元的资金,由 Bowery Capital 领投。该公司提供一种基于 AI 的分布式协作和可视化工具,用于管理支持公司运营的复杂和多层系统架构。(新闻来源:VentureBeat

    8月7日

    • 研究机构Aletheia报告指出,预估AI服务器市场规模将在2024年翻倍、2025年达到1350亿美元,是2022年规模的4.5倍。(新闻来源:财联社
    • 智源研究院发布开源可商用中英文语义向量模型BGE(BAAI General Embedding),在中英文语义检索精度与整体语义表征能力均超越了社区所有同类模型,如OpenAI 的text embedding 002等。此外,BGE 保持了同等参数量级模型中的最小向量维度,使用成本更低。(新闻来源:智源研究院
    • 联想浏览器今日更新,在侧边栏增加了接入文心一言大模型的小乐 AI 助手测试版。据官方消息,新版联想浏览器加入了文案润色,总结提炼,邮件撰写等功能,同时具备 AI 搜索功能和AI对话能力。(新闻来源:品玩
    • 据推特用户 @ Leopeva64 发现,最近的一次 Edge Canary 更新引入了一个用 Bing AI 重写文本的功能。该功能允许用户在输入框中选择一段文本,并使用 Alt + I 快捷键进行重写。(新闻来源:IT之家
    • 日前,在蒙牛全球合作伙伴答谢会上,蒙牛宣布与智谱AI、腾讯等多家科技巨头联手,共同发布了全球首个营养健康领域模型MENGNIU.GPT。(新闻来源:中国日报网
    • 根据游戏评测媒体 IGN 的最新消息,IGN 即将推出自家的 AI 聊天机器人 IGN Guides Chatbot Alpha,该机器人是根据数十名 IGN 指南作者和贡献者编写的游戏指南和攻略内容进行培训的,可回答用户关于游戏的问题。(新闻来源:IGN
    • 元象XVERSE公司宣布开源其百亿参数的高性能通用大模型XVERSE-13B,可免费商用。据介绍,XVERSE-13B是一个通用大模型,基于它生成的服务包括了文本生成、自动化写作、数据分析、知识问答等方面。(新闻来源:36氪
    • 国家企业信用信息公示系统显示,北京光年之外科技有限公司现已完成工商变更,创始人王慧文退股,美团旗下天津三快科技有限公司成唯一股东。(新闻来源:品玩

    8月6日

    • 据 Tech 星球报道,字节跳动内测的对话类 AI 项目已经开启测试,代号为 Grace。目前,供测试使用的网站已经初搭建完毕,需要邀请或授权的相关账号登录后才可使用。(新闻来源:Tech星球
    • 据成都市政府官网消息,2022年全市人工智能产业规模为616亿元,位列全国第7,产业增速位居全国第1,综合实力排名全国第6。今年上半年产业规模达424亿元,同比增长36.9%。(新闻来源:品玩
    • 据英国《金融时报》报道,苹果公司正在加强其在生成式人工智能方面的专长,以将其应用于iPhone和iPad,已在加利福尼亚、西雅图、巴黎和北京的办公室招聘数十个从事大型语言模型(LLM)工作的职位。(新闻来源:界面新闻

    8月5日

    • Salesforce 发布「Einstein Studio」,一款无代码、基于界面的 AI 模型训练工具,面向数据科学家和工程师,旨在帮助企业将其Salesforce数据连接到任何人工智能或大型语言模型。(新闻来源:InfoWorld
    • 微软研究院近日展示了 Project Rumi 项目,结合文本,音频和视频数据,通过多模方法,提高人工智能系统的理解能力,从而更能理解人类的意图。(新闻来源:IT之家

    8月4日

    • OpenAI 今天宣布,从下周开始,将会推出一系列小更新来改善 ChatGPT 的使用体验,包括增加提示语用例、对话建议、Plus用户默认使用 GPT-4 版本、支持上传多个文件。(新闻来源:品玩
    • 成都市经信局印发《成都市加快大模型创新应用推进人工智能产业高质量发展的若干措施》,其中提到,推动算力基础设施建设,加快建成国家新一代人工智能公共算力开放创新平台。(阅读全文:上海证券报
    • 苹果CEO 蒂姆・库克在接受采访时表示,苹果多年来一直在研究包括生成式 AI 在内的各种 AI 技术。库克表示,苹果正在寻找各种切入点,将包括生成式 AI 在内的各种 AI 技术融合到产品中,以进一步丰富用户的生活、工作。(新闻来源:9to5Mac
    • 华为手机消息,通过盘古大模型的底层能力加持,HarmonyOS带来更进步的AI,小艺将具备AI大模型能力,在智慧交互、高效生产力提升和个性化服务三个方向持续增强。(新闻来源:36氪
    • IBM 和 NASA 日前联合宣布在 Hugging Face 上推出 watsonx.ai 开源地理空间基础模型,作为新型气候和地球科学人工智能的基础,可以跟踪森林砍伐、预测农作物产量并记录温室气体排放。(新闻来源:Engadget
    • 伦敦证券交易所集团(LSEG)正在与微软和多家银行合作开发定制的生成式人工智能模型,让客户以安全和私有的方式结合使用 LSEG 的广泛数据和他们自己的数据。(新闻来源:金融时报
    • AI.com域名现已重定向到马斯克的人工智能初创公司X.ai的官网,而在 2 月份时该域名曾重定向到 ChatGPT 官网。(新闻来源:Mashable
    • 云应用程序监控和安全平台 Datadog 今日宣布推出人工智能生成助手——Bits,可以根据客户的可观测数据进行学习,帮助工程师实时解决应用问题。(新闻来源:DevOps
    • 为 AI 训练提供云基础设施的云计算平台 CoreWeave 表示,在 4 月份的 B 轮融资中筹集了 2.21 亿美元,并在 5 月份对该轮融资扩大了 2 亿美元后,CoreWeave 已获得 23 亿美元的债务融资。(新闻来源:TechCrunch
    • 鸿海子公司 Icreate Investments 取得 AI 初创公司耐能智慧(Kneron)股份,投资金额约1400万美元。耐能主攻神经网络处理器及各种图像识别功能,先前耐能募集资金,研发下一代边缘计算AI芯片。(新闻来源:界面新闻
    • 建筑平台 Acelab 日前宣布获得 530 万美元的新一轮融资,该平台的机器学习搜索和推荐引擎可帮助建筑师一站式探索、整理和进行产品协作。(新闻来源:VentureBeat

    8月3日

    • 阿里云开源通义千问 70 亿参数模型,包括通用模型 Qwen-7B 和对话模型 Qwen-7B-Chat,两款模型均已上线阿里旗下的 ModelScope 魔搭社区,开源、免费、可商用。(新闻来源:魔搭社区官微
    • Meta 发布了新的开源人工智能音乐生成器 AudioCraft,用户可以通过输入文本提示来生成音乐和声音。(新闻来源:The Verge
    • 据36氪报道,腾讯自研的 “腾讯混元大模型”已经进入应用内测阶段,多位腾讯员工告诉36氪,近期收到了内部邮件邀请,可以通过网页或者小程序体验混元大模型,腾讯内部多个业务也已经接入混元大模型进行测试。(新闻来源:36氪
    • 谷歌的AI搜索生成体验(Search Generative Experience)发布新的功能更新,若用户在搜索实验室中启用了基于 AI 的 SGE 功能,可以在搜索结果中看到更多的多媒体和更好的链接。(新闻来源:The Verge
    • 微软发布了最新的 Windows 11 预览版,为内测人员带来了多项新功能和改进,其中包括了向部分 Beta 频道的内测人员推出 Windows Copilot 预览版。(新闻来源:IT之家
    • 近日发表在《柳叶刀·肿瘤学》杂志上的研究发现,人工智能比经过多年培训和经验丰富的医生能更有效地发现乳腺癌,并将放射科医生的 X 光检查工作量减少了近一半。(新闻来源:腾讯网
    • 据 Nature 报道,Scopus、Dimensions、Web of Science等科研数据库正在推出类似于 ChatGPT 的对话式人工智能搜索功能,以帮助研究人员快速获得文献和研究主题的摘要。(新闻来源:Nature
    • 据香港电台网站报道,香港岭南大学候任校长秦泗钊今天表示,香港岭南大学决定接受 AI 浪潮,并表示目前校方已为全校购买 ChatGPT 3.5 版本的许可证,同时将对教学人员和学生提供相应技术培训。(新闻来源:IT之家
    • AI 芯片初创公司 Tenstorrent 宣布,获得来自现代、起亚、三星等公司的 1 亿美元新融资,该公司的CEO Jim Keller 曾为苹果、特斯拉和英特尔开发芯片。(新闻来源:财联社
    • 据 36氪报道,AI 企业级应用服务商「弘玑Cyclone」于 7 月完成约 4000 万美元的 C+ 轮融资,由华兴资本担任独家财务顾问。本轮融资将主要用于大模型相关产品 AIGA(AI Generated Automation 即生成式自动化 )的研发落地、行业资源整合与市场拓展。(新闻来源:36氪
    • 生成式人工智能平台 Inworld 从 Lightspeed Venture Partners 获得超过 3000 万美元的投资,最新估值超 5 亿美元,该平台使用AI技术帮助用户通过自然语言描述来创建可对话的角色和NPC。(新闻来源:TechCrunch
    • 机器人初创公司 Orangewood 近期在由 Y Combinator 领投的一轮融资中筹集了 450 万美元,该公司制造更加便宜的机械臂,并开发了 RoboGPT 帮助用户使用文本或语音对机械臂进行编程。(新闻来源:TechCrunch

    8月2日

    • 据科创板日报报道,百度智能云千帆大模型平台已完成新一轮升级,全面接入LLaMA2全系列、ChatGLM2、RWKV、MPT、Dolly、OpenLLaMA、Falcon等33个大模型,成为国内拥有大模型最多的平台。(新闻来源:品玩
    • 阿里云通义听悟上线了三大新功能,包括国内音视频AI领域首创的视频自动提取PPT,以及浏览器插件、钉钉和微信小程序,帮助用户在PC和移动端随时随地听懂、理解、阅读各类音视频内容,提升职场人士和学生的工作学习效率。(新闻来源:36氪
    • 据 AndroidPolice 报道,谷歌开始在 YouTube 视频平台上测试人工智能自动生成的视频摘要,部分英语视频的观看和搜索页面上会显示视频内容的简要概述。(新闻来源:Android Police
    • 据彭博社报道,Uber 的首席执行官 Dara Khosrowshahi 在接受采访时表示,Uber 正在研发AI驱动的聊天机器人,以集成到其应用程序中。(新闻来源:Bloomberg
    • AI 视频生成平台 HeyGen 宣布与在线设计平台 Canva 达成合作,将 AI 数字人虚拟口播引入 Canva 在线设计中,用户可以在几分钟内制作会说话的口播视频。(新闻来源:Metaverse Post
    • 初创公司Steg.AI宣布获得由 Paladin Capital Group 领投的 500 万美元种子轮融资,该公司旨在帮助创作者使用深度学习给图像嵌入几乎看不见的水印,即使调整大小和重新保存也无法去掉水印。(新闻来源:TechCrunch
    • 无代码平台 Akkio 宣布获得 1500 万美元的 A 轮融资,该公司表示,将利用这笔资金加速其平台的商业化,并向任何处理数据的用户提供易于使用的人工智能助手。(新闻来源:VentureBeat
    • AI 药物管理平台 FeelBetter 宣布获得由 Firstime Ventures 和 Shoni Health Ventures 领投的 590 万美元融资,该公司利用机器学习和患者数据提供与复方用药相关的个性化药物管理。(新闻来源:PRNewsWire

    8月1日

    • 据 OpenAI 官方消息,安卓版 ChatGPT 现已在所有支持 ChatGPT 的国家和地区上线。安卓版 ChatGPT 于7月26日推出,先行上架美国、巴西、孟加拉国等地区,并在两天后扩展至英国、法国等16个国家和地区。此前该APP 已在5月登陆iOS平台。(新闻来源:品玩
    • 据《金融时报》报道,Meta(原Facebook)正在准备一系列人工智能驱动的聊天机器人,这些机器人将表现出不同的个性,以提高其社交媒体平台的参与度,最早于下个月推出。(新闻来源:Financial Times
    • 戴尔科技集团官方宣布,将与英伟达合作推出生成式人工智能解决方案,帮助客户在本地快速安全地构建生成式人工智能(GenAI) 模型,以加速改进成果并推动新的智能水平。(新闻来源:IT之家
    • 据商标律师Josh Gerben 透露,OpenAI 已经在7月18日申请注册“GPT-5”的商标。目前尚不能确定该商标是否为保护性注册。从商标信息来看,GPT-5将提供文本生成、自然语言处理、语音转录、翻译等功能。(新闻来源:品玩
    • 根据市场调查机构 Gartner 公布的最新报告,全球客服中心(CC)正大力拥抱对话式 AI 和虚拟助手,预估 2023 年 CC 支出将达到 186 亿美元,比 2022 年增长 16.2%。(报告全文:Gartner
    • 据 9to5google 报道,谷歌内部宣布,将会对 Google Assistant 进行更新,引入大语言模型技术。(新闻来源:9to5Google