Blog

  • DingTalk A1 – 钉钉推出的智能办公设备

    DingTalk A1是什么

    DingTalk A1 是钉钉推出的智能办公设备,集成多种办公功能,如智能考勤、门禁管理、会议室预订等,能有效提升企业办公效率。通过与钉钉软件的深度结合,DingTalk A1能实现数据同步和自动化管理,让企业管理更便捷和智能化。DingTalk A1 支持多种身份识别方式,如人脸识别、二维码识别等,操作简单,安全可靠,是中小企业和团队实现数字化办公的得力助手。

    DingTalk A1

    DingTalk A1的主要功能

    • 多场景使用:适用会议、销售、面试、沟通等多种工作场景。
    • AI办公小助理:通过听、记、分析功能,自动整理行动清单,并自动同步到AI表格。
    • 多语言互译:支持8种常用语言即时互译和21种语言同声传译。

    DingTalk A1的规格参数

    • 品牌:钉钉
    • 型号:DTA1
    • 产品类别:录音笔
    • 生产企业:钉钉(中国)信息技术有限公司
    • 屏幕尺寸:0.95英寸
    • 显示屏类型:OLED
    • 内存容量:64GB
    • 存储类型:闪存
    • 存储卡类型:不支持扩展卡
    • 电池规格:锂电池
    • 附加功能:蓝牙连接、录音功能、支持WIFI

    DingTalk A1的价格配置

    • 价格:799元

    DingTalk A1的购买地址

    • DingTalk A1官网购买:https://page.dingtalk.com/wow/dingtalk/default/dingtalk/4pYIJkWHJZa4X2zhCZmC

    DingTalk A1的应用场景

    • 考勤管理:企业员工通过人脸识别快速打卡,将考勤数据同步至钉钉后台,方便管理。
    • 门禁控制:企业办公区域用人脸识别门禁,保障安全,支持多种开门方式。
    • 会议室预订:员工通过钉钉APP预订会议室,系统自动提醒,提高会议室使用效率。
    • 校园门禁:学校大门和教学楼采DingTalk A1门禁系统,保障校园安全。
    • 考勤记录:学生和教职工通过人脸识别考勤,将考勤数据实时同步至学校管理系统。
  • 专访ChatExcel逄大嵬,完成千万级天使轮融资背后做对了什么?

    ChatExcel 团队近日完成近千万元天使轮融资,由上海常垒资本、武汉东湖天使基金投资。

    官方透露,这笔资金将主要用于产品研发迭代和全球化运营,进一步推进其在“AI数据智能体(DataAgent)”方向的探索与落地。

    ChatExcel 作为 AI Native 团队,在过去两年累计服务用户超千万次,曾在央视《赢在AI+》创业大赛中拿下智能办公组全国第一的成绩。

    如今,它不仅能处理 Excel、数据库、网页等多种格式的数据,还推出了全球首款适配AIPC本地部署的垂类模型,构建出一套完整的数据闭环。

    在创始人逄大嵬看来,这只是开始:“ChatExcel 不只是一个工具,也是团队跟上 AI 时代的第一张门票。希望通过全链路的数据能力,把数据从获取到价值变现串起来,让普通人也能拥有自己的数据智能体。”

    产品名称:ChatExcel

    Slogan:仅通过聊天,AI即可处理Excel和数据分析

    主要功能:一句话,处理Excel表格和数据库数据,无需函数,10秒钟即可获得数据洞察

    官网:ChatExcel

    以下是我们和 ChatExcel 创始人 Davis 的访谈:

    K姐研究社

    Hi~Davis,可以介绍一下你们最近在忙些什么吗?

    🧑🏻‍💻 Davis

    最近主要在围绕 AI DataAgent(AI 数据智能体)这个方向迭代产品,同时也在推进商业化。

     K姐研究社

    我看到你们最近的访问量数据,相比上个月涨了好几倍,可以分享一下是怎么实现的吗?

    🧑🏻‍💻 Davis

    我觉得核心点是产品迭代了。我们的访问量增长了大约 175%,在非凡的排行榜里进入了增速前五。国内流量排名大概在 58 名。这个结果超出了我们的预期。

    我们几乎没有进行商业化投放,所以增长主要来自产品本身的迭代。同时,一些大平台和大渠道的曝光也带来了一部分流量提升。总体来看,是产品和自然曝光推动了增长。

     

    不是因为 AI 而做 Excel,是因为 Excel 本身值得做

     

     K姐研究社

    我在官网上看到你们在央视《赢在AI+》智能办公组获得了第一名,可以分享一下你们是怎么拿到这个第一名的吗?

    🧑🏻‍💻 Davis

    《赢在AI+》是当年央视《赢在中国》的节目组在 AI 时代重新举办的创业类节目。我们最早是在去年阿里云的云栖大会上参加初赛,当时有现场直播。之后经过三轮比赛,最终进入决赛并拿到第一名。

    比赛形式和大家在电视上看到的差不多:创始人需要在两三分钟内介绍产品和商业模式,由评委和观众打分。

    对我们团队来说,这是一个很好的机会,不仅获得了曝光,也让我们重新思考:我们的核心竞争力是什么?目标和壁垒在哪里?未来要走的方向是什么?这有点像“电梯演讲”,要求在极短的时间里把产品和愿景讲清楚。

    更重要的是,在央视这样的平台上,我们得到了大量流量和传播,同时也面对了评委和投资人的尖锐点评。这些一针见血的问题促使我们反思:哪些地方还需要改进,未来该如何准备。整体来说,这个节目对我们帮助非常大。

     

    K姐研究社

    你最初是出于什么样的初衷去做 ChatExcel 这款产品?

    🧑🏻‍💻 Davis

    我们团队核心成员来自北大,有两位博士合伙人在读研究生时就已经在做数据处理和 Excel 相关研究。那时我们用的还是 BERT 这一代的 AI 技术,并不是因为 GPT 出现才开始做的。

    后来,两位博士读博期间在导师的指导下,尝试用 Transformer 架构重新做数据处理。到 2022 年下半年,我们逐渐切换到这一新架构。恰好在 2023 年 GPT 崛起,于是我们顺势将产品定位为 ChatExcel,并推出给用户使用。

    所以,我们的出发点是真的为了解决 Excel 问题,并不是因为有 AI 出现才定这个方向的。

     

    越难的问题,越有价值

     

     K姐研究社

    你们现在团队不到 10 个人,大概是什么样的构成?

    🧑🏻‍💻 Davis

    我们团队其实只有 8 个人,基本上全部是产品和技术背景。可以说我们是一个高度技术型的团队,也非常笃定地相信 AI 时代。

     K姐研究社

    这确实算很少的团队规模了。

    🧑🏻‍💻 Davis

    AI 产品靠的是产品技术能力,是 PFG 的模式。所以我们认为增长一定要依赖产品力的迭代。其他的应用手段只是锦上添花,但在技术迭代周期面前,很可能无法对抗。

    所以即便我们只有 8 个人,我们也是按照产品技术迭代的方式来做起产品迭代。

     K姐研究社

    新的架构和 AI 技术在处理 Excel 时,与传统方式最大的区别是什么?

    🧑🏻‍💻 Davis

    最大的区别在于用户的使用习惯和预期发生了变化。过去用户需要记忆函数、公式,甚至写代码;而现在用户只关心结果,不在乎过程。只要把表格和数据交给系统,就希望立即得到反馈。

    这种方式反而更符合人的真实预期和使用过程,就像使用 ChatGPT 一样,把需求说清楚,得到结果就行了。

     K姐研究社

    您刚刚提到团队几乎都是工程师,但在国内已经拥有了很大的用户体量。你们是怎么触达到这么多用户的?

    🧑🏻‍💻 Davis

    主要还是靠产品力和用户自传播。我们没有太多资金去投流或找大号带货,增长靠的是产品本身的价值。

    另外,我们做得比较早,算是有一些先发优势。严格来说,我们是国内最早一批做 AI 应用的。虽然中间有一段时间停滞过,但两年下来,在这个赛道里我们仍然排在第一位。背后原因在于,AI + Excel、AI 数据处理这个方向门槛很高,市场上几乎找不到旗鼓相当的产品。

    大家常说“难而正确”,我觉得很有道理。比如在 AI 时代,真正应该做的是那些难题:如何保证准确性?如何支持多种数据类型?如何处理大型数据库?如何保证数据安全?这些都是技术壁垒。

    我们之所以能积累这么多用户,靠的就是不断迭代,逐步满足用户的预期。

    我们也是从 10 个用户,然后 1000 个、1 0000个慢慢攒起来的。用户用过之后有反馈,我们再迭代,满足他们更多需求,他们就会继续使用,并带来口碑传播。

    所以,本质上我们的增长还是靠产品力。

     

    怎么让用户相信结果是准确的?

     

     K姐研究社

    现在很多用户已经把 AI 当作日常办公工具,比如写文案、做 PPT 等。但在数据场景里,AI 依然会出现幻觉问题,用户往往需要反复核对结果。你们是怎么解决“结果是否准确”这个问题的呢?

    🧑🏻‍💻 Davis

    这是个好问题。我们做的是数据智能体,Excel 只是其中一种文件类型。

    那准确怎么解决?有两个方面:

    第一,我们背后是 AI 编程的方式来做。我们相信 AI Coding 的能力和处理规则是准确的。

    第二,是过程可信化、可视化。我把文件和数据处理的整个链路都让用户看到,并且可以介入。过程是透明的。

    比如我们现在给四大审计公司做服务,他们就要求 Coding 的过程必须能看到,这样才能证明逻辑没有问题。

    怎么证明可信呢?是你的结果必须能够验证。

    另外,数据的准确还和数据源有关。如果数据源质量差,结果肯定差,所以还涉及到数据质量、数据治理的问题。

    所以,这件事并不是单靠模型能力解决的,而是从模型、产品交互、可视化、数据源等多个维度共同去解决。整个 DataAgent 的链路其实非常长。

     

    商业化方向——形态产品化、能力产品化

     

     K姐研究社

    你们现在的营收情况怎么样?已经开始赚钱了吗?

    🧑🏻‍💻 Davis

    赚钱,我们是赚钱的。

     K姐研究社

    我看到你们上线了 SaaS 企业版、AIPC 版、一体机版的私有化部署版本,还开放了 MCP 和 API 接口。对外的产品形态很多,那你们商业化的重点方向是什么?

    🧑🏻‍💻 Davis

    我们重点其实就一件事:产品化。以 Product 的方式来交付。最终面对的是 C 端用户。

    这个 C,可以是个人用户通过互联网访问我们的网站,也可以是下载客户端,或者通过 MCP 的方式在其他产品上体验,包括我们做的 APP 版、企业版,都是围绕这一点。

    同时,我们也在解决另一个关键问题:安全。数据智能体的使用场景里,大家最关注的就是安全和敏感性。最简单的办法就是让文件不出笔记本、不出局域网、不出公司的范围。

    我们做了模型的量化训练,单独做了一个数据模型,可以支持部署在 AIPC、一体机里,或者局域网内部。

    这就是我们商业化的两个方向:

    • 把形态的产品化;
    • 能力的产品化——能把模型部署到单个的电脑里。

     K姐研究社

    从你们的视角来看,未来 C 端和 B 端的营收贡献大概是什么比例?

    🧑🏻‍💻 Davis

    我们还是以 C 端用户为主,目前营收主要来自 C 端。虽然也有一些 B 端客户在合作,但整体上我们的重点还是解决 C 端用户的数据处理问题。我们不是做传统的 BI 产品,所以现阶段 C 端占比会更多。

     

    和WPS、Office定位不同,没有可比性

     

     K姐研究社

    目前 C 端用户可以用于做表格和数据处理的应用,市面上还挺多的,比如 WPS、Office,里面也集成了 AI 的能力,还有一些新出现的像爱图表。你们怎么和这些工具竞争?你们的差异在哪里?

    🧑🏻‍💻 Davis

    差异点在于定位不一样。我们不只是做表格处理,我们本身定位是 DataAgent(数据智能体)。

    像 WPS、Office,本质还是表格编辑器,只是在编辑器上加了 AI,或者只解决某个单点问题,比如生成图表。

    ChatExcel 围绕数据全链路(数据获取、数据准备、分析洞察、数据可视化、决策应用、价值交换)构建AI DataAgent,让数据流通起来,打造商业闭环。

    不同节点都有不同的场景,而且每一个真实的用户,在不同的工作场景上,对数据的需求点是不一样的。

    我们和 WPS、Office 干的是不一样的事情。我们认为我们是新事物,没什么可比性,对吧?

    虽然解决的问题有一些重叠,但技术路线和定位不一样。竞争肯定存在,但我认为真正有效的竞争,一定是 AI 时代新事物之间的竞争,而不是“老产品加 AI”这种模式。

     K姐研究社

    相当于你们是 AI 原生的应用,没有传统产品的那些阻碍?

    🧑🏻‍💻 Davis

    对。我们最大的竞争力就在于,我们是一个 AI Native 团队,做的是 AI Native 产品。我们的视角是随着模型能力的提升来做产品,跟着模型的成熟度不断演进,这和老产品完全不同。

    老产品当然有它的优势和壁垒,但我们今天最大的机会在于——新的 AI 产品能解决哪些问题。

    像我们团队不到 10 个人,却能跑出这样的数据和商业化成绩,背后的逻辑也是因为我们是 AI Native 团队。

    AI 给我们带来的加持非常明显,不论是对事情的看法、团队构成或者是我们技术的演进,其实你会发现,AI 在我们团队身上,整个模型能力的体现是非常明显的。

     

    未来最大的机会是在海外

     

     K姐研究社

    你们在海外市场的进展怎么样?

    🧑🏻‍💻 Davis

    我们海外产品(英文版)已经上线了,正在做海外推广。但是在海外我们还是一个“新生”

     K姐研究社

    那海外版和国内版是完全隔离的吗?

    🧑🏻‍💻 Davis

    是的,完全隔离。我们用了全新的域名,在交互上有些相同,但在海外是全新的名字和载体,重新去做 PMF、市场测试和商业化测试。

    我们非常相信,未来最大的机会还是在海外。本质上我们是一款效率工具,而海外用户在为效率工具付费方面的意愿和能力更强,所以这是我们很大的机会。

    我们也正在加大投入,下半年会把大量资源和精力放在海外产品的迭代上。

     K姐研究社

    你们怎么看国内用户和海外用户的差异?

    🧑🏻‍💻 Davis

    整体来说,我们面对的都是 C 端用户,但差异还是很大。

    首先是使用习惯和付费习惯的不同。国内用户本身就有差别,比如东南沿海一线城市和其他地区,或者不同行业的差异。

    而海外又可以细分:欧美、日本、日韩、南美、中东,使用习惯完全不同,背后是信息化程度和支付水平的差异。

    目前我们还在推进,可能再过几个月会有更多结论。但从现在的体感来看,不同国家在使用习惯和支付能力上确实有区别。

    不过对我们来说还好,因为处理的数据本质都是表格:Excel、Sheet 或 Data,这些是全球通用的。所以在本土化上难度相对没那么大。

     

    8人小团队,已完成近千万融资

     

     K姐研究社

    可以透露一下最近的融资进展吗?有考虑开启新一轮吗?

    🧑🏻‍💻 Davis

    我们在上半年已经完成了一轮融资,近期可能会开启新一轮。本周会正式发布上一轮融资的公告,这也会为下一轮融资做准备

     

    K姐研究社

    这次融资的目标主要是什么?

    🧑🏻‍💻 Davis

    主要还是用于产品迭代和海外市场。虽然我们团队本身已经在赚钱,但做海外需要投入更多成本。

    另外,现在这个阶段拼的是速度,无论是团队厚度、技术迭代,还是用户增长策略,都需要资金支持。

     K姐研究社

    你们更倾向于什么样的投资?对投资会有筛选吗?

    🧑🏻‍💻 Davis

    我们没有特别明确的倾向,毕竟还在比较早期。

    上一轮融资已经完成,接下来我们希望投资人能够认同我们做数据智能体这个方向,有认知,也能带来资源上的帮助。尤其是在海外,如果投资方在这方面有积累,对我们会更有价值。

     

    频繁迭代能帮助我们快速找到正确的方向

     

     K姐研究社

    你们更新的频率特别高,是怎么选择迭代方向的?为什么能保持这么高的更新频率?

    🧑🏻‍💻 Davis

    这和我们对 AI 时代产品的理解有关。本质上,靠的是产品力的成长来吸引用户。AI 时代的用户愿意和创业团队一起成长,所以我们会跟着用户的需求不断迭代。

    第二点,频繁更新能帮助我们快速找到正确的方向。迭代频率高,试错周期就短,试错成本也更低,我们能不断地获取正反馈。

    正反馈周期越短,说明方向越对。

    如果半年才更新一次,试错周期太长,在 AI 时代根本跟不上。现在一个月就已经天翻地覆了,所以更新频率是非常重要的一件事情。

     K姐研究社

    我大概在 2022 年底就关注到你们了,但一直到 2025 年你们的产品化才逐渐完善,也有人评价你们进展比较慢吗?

    🧑🏻‍💻 Davis

    确实会有这样的评价。但背后原因很客观:我们团队来自北大,两位博士合伙人当时还在读博,学业是第一位的。比如去年他们正好在读博一,所以那段时间几乎没有太多迭代,主要精力还是放在读书上。

     

    AI 创业者要承认自己有边界

     

     K姐研究社

    你们怎么看待当前的生态位?比如你们已经和阿里、华为这样的头部公司有合作。

    🧑🏻‍💻 Davis

    我觉得生态位本身就是一种竞争力和壁垒。但核心还是看你的产品在行业内是否具备独特性,能否解决一个细分、垂直的问题,而这个点可能是大厂在短时间内还没有把资源放进来的。

    另外,我一直认为在 AI 时代,尤其在中国,创业团队一定要非常开放地去做生态合作。AI 技术有模型,有边界,团队自身的能力和资源也有边界,所以合作开放才是最好的成长策略,而不是封闭地各自重叠去做一件事。

    我觉得今天对于 AI 时代的这一批创业者和产品来说是一个很好的时代。大厂愿意开放资源、平台和流量,来帮助和接纳像我们这样的第三方小团队。

    我们要拥抱这个节奏,保持开放心态。其实大家现在做 MCP 逻辑也是一样的。我们在细分方向做好做扎实就已经很有挑战了,要相信自己的团队是有边界的,不要认为自己团队多,什么都能做,这个很重要。

     K姐研究社

    国内像华为、阿里云、腾讯云、字节火山等厂商,本身就提供服务器和数据库服务。你们会担心他们直接复制你们的产品,然后提供给他们的客户吗?

    🧑🏻‍💻 Davis

    我们从来不担心这个问题。其实不止是 AI 时代,所有软件产品都会面临竞争,这是常态。我们诞生之前,已经有很多团队在做类似方向,竞争永远是全方面的竞争。

    但在 AI 时代,迭代速度非常快,我们并不认为大厂做这件事就一定有优势。尤其在国内,大厂有自己更高优先级的事情,不一定会把资源投入到这个细分领域。

    对我们来说,更重要的是专注把自己的事情做好。我们是做 AI Native 的新产品,用户预期也很高。我们还没覆盖的客户群体已经非常庞大,所以与其担心别人会不会做,不如关注用什么方式、用什么样的速度满足用户需求。

     

    定位是做 AI Decision(AI 决策智能体)

     

     K姐研究社

    我在官网上看到你们最近有两个即将上线的产品,叫 ChatData 和 ChatPanel,可以分别介绍一下吗?

    🧑🏻‍💻 Davis

    这两个产品会在两周内上线。其实它们是我们产品迭代路线的一部分。我们定位是做 AI Decision(AI 决策智能体),最早从 Excel 这种高频通用场景切入,先服务 C 端用户,积累数据和使用习惯。

    我们认为数据有多种类型。第一个 Source 是文件类型,第二个是数据库类型。

    我们马上要上线的 ChatData,就是在处理数据库类型数据。比如你有 MySQL 数据库、SQL Server 还是 Spark 等各种数据库,我们支持直接通过 AI 来处理。

    ChatPanel 面向外部数据。数据大致分三类:文件型数据(如 Excel)、数据库型数据(多为企业内部数据),以及公开的数据,比如网页版的数据、第三方互联网数据。我们会自动获取网页的数据,生成表格和分析报告。

    举个例子,我想知道 618 全网手机销量最高的是哪些品牌,新能源汽车排名如何,我们的智能体可以直接抓取并生成可视化结果。

    从产品路线看,我们是从 Excel,扩展到数据库,再到三方公开数据,甚至支持三方 API 的对接,以及 MCP 协议。只要是数据,不管来源,我们都希望能覆盖从获取、处理、加工到应用分析的全链路。

    官网上提到的新产品,其实就是在实现这一方向。

     

    AI 时代刚刚开始,ChatExcel 是起点,不是终点

     

     K姐研究社

    我了解 David 之前是也是创业者,是吗?

    🧑🏻‍💻 Davis

    对。

     K姐研究社

    之前你是做营销方向的 ToB SaaS,现在在做 ChatExcel。这会是你最后一个创业项目吗?

    🧑🏻‍💻 Davis

    我算是连续创业者,之前主要是在做营销类的企业服务 SaaS。至于 ChatExcel 会不会是最后一个项目?我觉得不会。

    ChatExcel 只是这个时间点的一个项目名称。AI 时代才刚刚开始,我更把它看作是我们团队、也是我个人进入这个时代的一个门票。

    它只能代表我们刚刚跟上了这个时代的脚步,而未来几十年、几百年,还有非常多事情可以去做,具体会走到哪里,现在也没法判断。

    所以,这是不是第一个或最后一个项目并不重要。真正重要的是:在这个时代选对方向,坚持去做,并且保持开放的心态不断迭代。

    原文链接:专访ChatExcel逄大嵬,完成千万级天使轮融资背后做对了什么?

  • Rokid Glasses – Rokid推出的AI智能眼镜

    Rokid Glasses是什么

    Rokid Glasses是全功能AI智能眼镜,重量不到50克,集成显示、摄像头和语音交互功能。眼镜能抬眼显示字幕、翻译和导航,能随时拍照、录像。基于贴合耳朵的镜腿和空气鼻托,长时间佩戴无负担。眼镜配备充电胶囊,移动场景下能随时充电。Rokid Glasses支持双向翻译、智能提词和“看一下支付”功能,成像素质佳。Rokid Glasses凭借轻巧、全能和实用的特点,受到全球消费者欢迎,成为智能眼镜领域的新标杆。

    Rokid Glasses

    Rokid Glasses的主要功能

    • 显示功能:支持自定义调节提词器和翻译显示范围、高度,支持89种语言的双向翻译,满足多场景信息获取需求。
    • 摄像头功能:具备HDR夜景增强和智能HDR功能,优化暗光和逆光拍照效果,提供多种视频拍摄比例和时长选择,提升拍摄质量。
    • 语音交互功能:自研端侧AI意图识别模型,精准识别物体、解答问题、翻译书籍、识别卡路里等,便签功能还能记录事项、提醒日程。
    • 支付功能:全球首发“看一下支付”,解放双手,实现便捷的支付体验。
    • 音频体验:提供三种音频模式和三种拾音模式,满足不同环境下的听音需求。

    Rokid Glasses的规格参数

    参数类别 规格详情
    重量 49g
    SOC 高通AR1
    WIFI WiFi 6
    蓝牙 BT 5.3
    RAM 2GB
    ROM 32GB
    Voice Pickup 支持定向拾音麦克风
    Sound Speaker 2颗超线性定向高保真扬声器
    摄像头 分辨率:3024*4032,光圈 F2.25
    摄像头指示灯 支持
    IMU 支持
    交互 拍照键,触摸板x2
    佩戴检测 支持
    Optics Design Micro LED +衍射光波导,双目显示
    FOV 30度
    Brightness 1000nits
    Resolution 640*480

    Rokid Glasses的价格配置

    • 价格:3299元

    Rokid Glasses的购买地址

    • 京东购买地址:https://item.jd.com/10128195443527.html

    Rokid Glasses的应用场景

    • 日常生活:在出行时帮助用户轻松找到目的地,无需频繁查看手机。
    • 学习教育:学生在学习外语时实时显示外语文本的翻译,帮助学生更好地理解外语内容,提高学习效率。
    • 商务办公:演讲或会议中为演讲者提供实时提示,让演讲更加流畅自然。
    • 旅游出行:在旅游过程中,方便游客与当地人的交流,更好地了解当地文化和历史。
    • 运动健身:运动时,帮助用户规划运动路线,如骑行或跑步时的轨迹。
  • AutoCodeBench – 腾讯混元开源测评大模型代码能力的数据集

     AutoCodeBench是什么

    AutoCodeBench 是腾讯混元推出的专门测评大模型代码能力基准测试集,包含 3920 个问题,均匀分布在 20 种编程语言中。数据集具有高难度、实用性和多样性,能衡量大模型在多语言编程任务中的性能。基准测试集通过自动化工作流生成数据,保证高质量和覆盖度,且提供了简易版本(AutoCodeBench-Lite)和用在评估基础模型的版本(AutoCodeBench-Complete)。

    AutoCodeBench

    AutoCodeBench的主要功能

    • 多语言代码能力评估:提供3920个问题,覆盖20种编程语言,全面衡量大模型的多语言代码生成能力。
    • 高难度基准测试:支持设计高难度问题,有效识别大模型在复杂编程任务中的不足。
    • 性能差异放大:基于筛选问题构建AutoCodeBench-Lite,放大不同模型间的性能差异,便于对比分析。
    • 基础模型评估:用3-shot提示构建AutoCodeBench-Complete,专门评估基础模型的代码生成性能。
    • 自动化代码数据生成:基于LLM生成测试输入并借助沙盒获取输出,合成高质量多语言代码生成数据。
    • 多语言代码执行验证:提供MultiLanguageSandbox服务,支持30多种编程语言的编译和执行,验证生成代码的正确性。

    AutoCodeBench的技术原理

    • 自动化数据生成:AutoCodeGen 通过大语言模型(LLM)生成测试输入,将测试输入传递给沙盒环境。沙盒环境执行代码并返回测试输出,构造高质量的测试函数。基于逆序构造编程问题,确保生成的问题具有高难度和多样性。用多种策略过滤生成的数据,进一步保证数据的高质量、高难度和实用性。
    • 多语言支持:AutoCodeBench 中的 3920 个问题均匀分布在 20 种编程语言中,确保每种语言都有足够的问题用在评估,避免语言分布不均的问题。MultiLanguageSandbox 支持超过 30 种编程语言的编译和执行,能验证生成代码在不同语言环境下的正确性和性能,确保模型在多种语言上的表现能得到准确评估。
    • 高难度与实用性:基于逆序构造问题和策略过滤,生成的问题具有较高的难度,能有效评估模型在复杂编程任务中的表现。生成的问题难度高,具有实际应用价值,能反映真实编程场景中的复杂问题,帮助模型在实际应用中更好地发挥作用。

    AutoCodeBench的项目地址

    • 项目官网:https://autocodebench.github.io/
    • GitHub仓库:https://github.com/Tencent-Hunyuan/AutoCodeBenchmark
    • HuggingFace模型库:https://huggingface.co/datasets/tencent/AutoCodeBenchmark
    • arXiv技术论文:https://arxiv.org/pdf/2508.09101

    AutoCodeBench的应用场景

    • 模型性能评估:用在全面衡量大模型在多语言编程任务中的代码生成能力,帮助识别模型的强项和弱点。
    • 数据集构建与优化:生成高质量、高难度的代码生成数据集,支持自定义数据集构建,提升模型训练效果。
    • 多语言能力验证:验证大模型在不同编程语言(包括低资源语言)中的表现,推动多语言编程能力的研究。
    • 模型训练与验证:作为训练数据补充,提升模型复杂编程任务表现,并定期验证训练效果。
    • 学术与工业应用:为学术研究提供标准化基准,支持工业场景中代码生成工具的开发与优化。
  • BubblePal – Haivivi推出的AI陪伴玩具

    BubblePal是什么

    BubblePal 是跃然创新(Haivivi)推出的智能 AI 陪伴玩具,支持角色扮演、多语言对话、AI 故事共创等功能,能实时监测情绪,为监护者提供干预信息。产品用经 FDA 认证的食品级硅胶和 ABS 材质,安全可靠。内置锂离子电池,待机时间超过 4 天。BubblePal 能讲述动人故事,与孩子一起创作故事,提供贴心的情感陪伴。

    BubblePal

    BubblePal的主要功能

    • 角色扮演:支持众多角色,每个角色都有独特的形象、声音、故事和性格。用户能自主创建属于自己的玩偶人设。
    • 多语言对话:支持与用户进行多语言交流,提升语言学习的趣味性。
    • AI故事共创:玩具能讲述故事,且能与用户一起创作故事,激发想象力和创造力。
    • 长期记忆:具备长期记忆功能,能记住与用户的互动内容,提供更个性化的陪伴。
    • 情感识别与交互:实时监测用户情绪,当发生紧急情况时,监护者能及时干预,提供情感支持。
    • 互动性强:通过多种互动模式,如聊天、游戏等,增强用户参与感和乐趣。

    BubblePal的规格参数

    • 产品尺寸:53×57×40mm。
    • 包装尺寸:112×182×52mm。
    • 产品材质:经 FDA 认证的食品级硅胶 & ABS。
    • 包装材质:100%可回收纸盒及可降解甘蔗渣纸塑。
    • 产品重量:280g(含包装 230g)。
    • 电池信息:内置锂离子电池。
    • 待机时间:4 天以上。
    • 连接环境:需要 2.4G 无线网络。
    • 工作温度:0°C 至 35°C (32°F 至 95°F)。
    • 非工作存放温度:-20°C 至 45°C (-4°F 至 113°F)。
    • 相对湿度:非凝结状态下 5% 至 90%。
    • 工作海拔:0 米至 3000 米 (0 英尺至 10000 英尺)。
    • 包装内容:Haivivi BubblePal、Type-C 充电连接线、使用手册。

    BubblePal的价格配置

    • 价格:399元
    • 玩具+玩偶: 449元

    BubblePal的购买配置

    • BubblePal官方购买地址:https://tuicashier.youzan.com/pay/wscgoods_order?fromStore=true&banner_id=f.132646533~image_ad.2~0~7fwQazHZ&reft=1756086969808&spm=f.132646533&sf=wx_sm&form=kdt&alias=2ote774yf8z8r8e
    • 京东购买地址:https://item.jd.com/100134572775.html

    BubblePal的应用场景

    • 儿童教育与娱乐:BubblePal能激发儿童的语言学习兴趣、想象力和创造力。
    • 家庭互动:作为亲子互动的桥梁,增强家庭成员间的交流与合作,增添家庭乐趣。
    • 情感陪伴:为孩子提供情感支持,缓解孤独感,帮助用户更好地表达和管理情绪。
    • 教育辅助:在教育场景中,作为辅助工具,提升教学互动性和趣味性,辅助语言学习和故事创作。
    • IP互动:凭借对经典IP角色的支持,让孩子与喜爱的IP互动,拓展IP故事,增强IP的吸引力和互动性
  • 谱乐AI – AI音乐生成平台,训练专属音色模型

    谱乐AI是什么

    谱乐AI是青岛艾夫斯科技有限公司推出的AI音乐生成平台,专注于为用户提供高效、个性化的音乐创作服务。支持文本、图片、视频等多种输入方式,能快速生成匹配的AI音乐,满足不同场景需求。例如,输入文字描述“温暖的钢琴曲”,系统可在短时间内生成完整的音乐作品。谱乐AI具备强大的个性化定制功能,用户可以调整音乐风格、节奏速度、旋律走向等,能对BPM、调性、乐器配比等专业参数进行编辑。

    谱乐AI

    谱乐AI的主要功能

    • AI音乐生成:用户可以通过输入文字描述、上传图片或视频等方式,快速生成匹配的音乐作品,支持多种风格和场景。
    • 多模型协作:结合Suno和Udio两个顶尖AI音乐模型,发挥各自优势,实现更丰富的音乐创作可能性。
    • 个性化定制:用户可以调整音乐的风格、节奏速度、旋律走向等,能对BPM、调性、乐器配比等专业参数进行编辑。
    • 音乐续写与编辑:支持音乐续写功能,用户可以上传已有音乐片段,AI自动延伸编曲、补全副歌或桥段。提供专业的音乐编辑工具,如AI母带处理、音乐剪辑器等。
    • 歌词创作:内置中文咬字与押韵算法,生成更自然的中文歌词。
    • 声音克隆:用户可以上传自己的声音样本,训练独一无二的AI声音模型,让AI用你的声音演唱任何歌曲。
    • AI母带处理:专业级AI母带处理技术,自动优化音频动态、均衡和响度,让音乐达到商业发行标准。
    • 智能音轨分离:AI驱动的音轨分离技术,精确提取人声、鼓点、贝斯等独立轨道,为混音和翻唱提供完美素材。
    • 多轨音频混音:支持16轨道专业混音,包含EQ调节、音量控制、实时预览,像专业制作人一样创作音乐。
    • AI音质增强:智能音频升采样和降噪技术,提升音频清晰度和保真度,让作品音质更加出色。
    • 高音质与商业授权:生成的音乐音质高,付费用户享有完整的商业使用权,可应用于广告、影视、游戏等商业场景。
    • 协作与分享:提供一键分享功能,用户可以生成链接或二维码,方便与他人在线审听和协作。

    谱乐AI的官网地址

    • 官网地址:https://yourmusic.fun/

    谱乐AI的应用场景

    • 短视频BGM:抖音、快手、B站等平台创作者可快速产出无版权风险的音乐。
    • 广告与影视:广告公司可在5分钟内生成配乐,节省版权采购费。
    • 游戏与APP:独立开发者可为关卡、UI场景批量生成循环音乐。
    • 个人作品:可为婚礼、生日、校园活动等定制歌曲,支持姓名、故事嵌入歌词。
  • DeepSeek V3.1 – DeepSeek最新开源的AI模型版本

    DeepSeek V3.1是什么

    DeepSeek V3.1是DeepSeek最新推出的AI模型版本,具备混合推理架构,能自由切换思考模式与非思考模式,思考效率显著提升。模型在V3的基础上进行多项升级,上下文窗口从64k扩展至128k,能处理更长的文本输入。模型用混合专家(MoE)架构,参数量与V3相同。模型在编程和搜索智能体方面表现出色,能高效完成复杂任务。模型现已在DeepSeek网页端App、小程序及 API 开放平台所调用模型均已同步更新,新模型自我认知为DeepSeek V3。

    DeepSeek V3.1

    DeepSeek V3.1的主要功能

    • 自然语言处理:DeepSeek V3.1能生成高质量文本,如创意写作和故事创作,回答问题时语气更活泼、信息更丰富。
    • 编程能力:模型能生成更复杂、完成度更高的代码。
    • 多领域知识:对小众历史问题等的回答更准确、信息量更大,且在科技和科学领域也能提供有深度的解答。
    • 混合推理架构:支持思考模式与非思考模式的自由切换,适应不同场景需求。
    • 高效思考能力:相比前代,思考效率更高,输出更精简且性能持平。
    • 强大的 Agent 能力:在编程智能体和搜索智能体任务中表现卓越,能完成复杂代码修复和多步推理搜索。
    • API 功能升级:支持 deepseek-chatdeepseek-reasoner 两种模式,上下文扩展至128K,支持 Anthropic API 格式。

    DeepSeek V3.1

    DeepSeek V3.1的项目地址

    • HuggingFace模型库
      • Base 模型:https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base
      • 后训练模型:https://huggingface.co/deepseek-ai/DeepSeek-V3.1

    如何使用DeepSeek V3.1

    • 网页端:访问DeepSeek官网,使用最新版本的模型。
    • App:下载并安装DeepSeek App,登录账户后使用V3.1模型。
    • 小程序:在微信或其他平台搜索DeepSeek小程序,登录账户后使用。
    • API开放平台:通过API调用,需要先注册并获取API密钥,根据官方文档中的指南进行调用。API支持思考模式(deepseek-reasoner)和非思考模式(deepseek-chat),上下文窗口扩展至128K,并支持strict模式的Function Calling。
    • 访问Hugging Face平台:访问Hugging Face的DeepSeek-V3.1-Base模型页面https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base
      • 模型下载:下载模型权重、配置文件和脚本代码。
      • 本地部署:在本地环境中安装必要的依赖(如Python、Transformers库等),加载模型并进行推理。
      • API调用:用Hugging Face提供的API接口,将DeepSeek-V3.1模型集成到自己的应用程序或服务中,实现自动化处理和交互。

    DeepSeek V3.1 API价格

    API接口调用价格将于2025年9月6日凌晨起进行调整,取消夜间时段优惠。

    • 输入价格
      • 缓存命中时:0.5 元/百万 tokens
      • 缓存未命中时:4 元/百万 tokens
    • 输出价格:12 元/百万 tokens

    DeepSeek V3.1的应用场景

    • 内容创作:用在生成文章、故事、诗歌等创意文本,辅助创作者激发灵感,提高创作效率。
    • 编程辅助:帮助开发者快速生成代码框架,优化代码逻辑,提升编程效率,适合前端开发和小游戏开发。
    • 教育领域:作为教学辅助工具,为学生提供知识解答,解释复杂的科学和历史问题。
    • 科学研究:协助研究人员整理和分析数据,提供科学问题的解答和分析思路。
  • NVIDIA Nemotron Nano 2 – 英伟达推出的高效推理模型

    NVIDIA Nemotron Nano 2是什么

    NVIDIA Nemotron Nano 2 是英伟达推出的高效推理模型,参数量为9B。模型基于混合Mamba-Transformer架构,在20万亿个token上预训练,支持128k上下文长度。相比Qwen3-8B,推理速度提升6倍,准确率相当或更高。模型具备思考预算控制功能,用户能指定推理token数量。英伟达开源了基础模型和大部分预训练数据集,助力开发者进一步研究与应用。

    NVIDIA Nemotron Nano 2

    NVIDIA Nemotron Nano 2的主要功能

    • 高吞吐量:NVIDIA Nemotron Nano 2 在复杂推理任务中表现出色,吞吐量比 Qwen3-8B 高达 6 倍。
    • 长上下文支持:支持 128k 的上下文长度,能在单个 NVIDIA A10G GPU 上进行推理,适合处理长文本和复杂任务。
    • 推理过程支持:模型在生成最终答案前生成推理过程(reasoning trace),用户能指定模型的“思考”预算。
    • 灵活的输出模式:用户能选择跳过中间推理步骤,直接获取最终答案。
    • 多语言能力:预训练数据集包含多种语言的数据,支持强大的多语言推理能力。
    • 多领域覆盖:涵盖数学、代码、学术、STEM 等多个领域的数据,适合多种应用场景。

    NVIDIA Nemotron Nano 2的技术原理

    • 混合 Mamba-Transformer 架构:用 Mamba-2 层替代传统 Transformer 中的大部分自注意力层,显著提升推理速度,特别是在生成长推理链时。Transformer 层保留部分自注意力层,保持模型的灵活性和准确性。
    • 预训练过程:在 20 万亿个 token 上进行预训练,用 FP8 精度和 Warmup-Stable-Decay 学习率调度。通过持续预训练长上下文扩展阶段,使模型能处理 128k 的上下文长度,不降低其他基准测试的性能。
    • 后训练优化:监督微调(SFT)对模型进行监督微调,提升其在特定任务上的表现。通过策略优化提升模型的指令遵循能力。优化模型的偏好,让模型更符合人类的偏好。通过人类反馈进行强化学习,提升模型的对话能力和指令遵循能力。
    • 模型压缩:基于剪枝和知识蒸馏技术,将 12B 参数的基础模型压缩到 9B 参数,同时保持模型的性能。优化模型支持在单个 NVIDIA A10G GPU 上进行 128k token 的上下文推理,显著降低推理成本。
    • 推理预算控制:基于截断训练,模型能根据用户指定的“思考”预算进行推理,避免不必要的计算。用户能灵活控制模型的推理过程,选择是否展示推理过程或直接获取最终答案。

    NVIDIA Nemotron Nano 2的项目地址

    • 项目官网:https://research.nvidia.com/labs/adlr/NVIDIA-Nemotron-Nano-2/
    • HuggingFace模型库:https://huggingface.co/collections/nvidia/nvidia-nemotron-689f6d6e6ead8e77dd641615
    • 技术论文:https://research.nvidia.com/labs/adlr/files/NVIDIA-Nemotron-Nano-2-Technical-Report.pdf
    • 在线体验Demo:https://build.nvidia.com/nvidia/nvidia-nemotron-nano-9b-v2

    NVIDIA Nemotron Nano 2的应用场景

    • 教育领域:在教育领域,帮助学生解决复杂的数学和科学问题。通过逐步推理的方式解释复杂的数学公式或物理定律,帮助学生更好地理解和掌握知识。
    • 学术研究:研究人员进行学术研究,生成详细的推理过程和分析报告,辅助论文撰写和实验设计。
    • 软件开发:开发者生成高质量的代码片段,帮助快速开发和优化代码。
    • 编程教育:在编程教育中,模型提供代码示例和解释,帮助初学者更好地理解编程语言和算法。
    • 客户服务:在客户服务领域,作为多语言聊天机器人,提供高效且准确的客户支持。
  • 晚点再听LaterCast – AI播客生成应用,广播级音色

    晚点再听LaterCast是什么

    晚点再听LaterCast是AI播客生成应用,将微信公众号长文一键转换成播客的小程序。解决用户因忙碌而无法完整阅读公众号文章的问题,让用户可以在碎片化时间通过听播客的方式获取文章内容。用户只需在微信看到感兴趣的公众号文章后,点击转发到「晚点再听」小程序,3秒即可生成播客。采用接近广播级的TTS技术,音色自然,朗读像朋友的对话,听起来非常舒适。AI会在朗读前提炼段落脉络,让重点层次分明,避免“听过就忘”。

    晚点再听LaterCast

    晚点再听LaterCast的主要功能

    • 一键转化:在微信内看到任意公众号文章,点击转发即可转发到「晚点再听」小程序,3秒实现文章变播客,操作流程与收藏文章一样简单。
    • 接近广播级TTS:采用先进的TTS技术,朗读音色自然,听起来像朋友的对话,避免了机械音带来的不适感。
    • AI提炼重点:在朗读前,AI会自动提炼文章的段落脉络和重点,让听众能更好地把握文章的核心内容,避免“听过就忘”。
    • 多场景适用:适合在多种场景下使用,如通勤、做饭、跑步、开车等。只要戴上耳机,用户就可以在碎片化时间里享受高质量的“阅读”体验,每天多出1-2小时的“阅读”时间。
    • 与传统播客互补:将静态的公众号文章转化为音频播客,与传统播客节目形成互补。传统播客适合开阔视野,LaterCast则让用户不再错过好文章。

    如何使用晚点再听LaterCast

    • 在微信内找到文章:打开微信,浏览公众号文章,找到你感兴趣的长文。
    • 转发到小程序:点击文章下方的「分享」按钮,选择「用小程序工具打开」,选择「晚点再听 LaterCast」。
    • 生成播客:小程序会自动将文章转换为音频播客,3秒即可完成。
    • 开始收听:点击播放按钮,可开始收听文章内容。

    晚点再听LaterCast的应用场景

    • 通勤途中:在上班或下班的地铁、公交上,戴上耳机,听一篇之前收藏的公众号长文,既能打发时间,又能获取知识。
    • 家务时间:在洗碗、做饭等不方便看手机的时候,通过听音频的方式了解文章内容。
    • 健身运动:在跑步、健身等运动时,听一篇公众号文章,让碎片化时间变得更有价值。
    • 休闲时刻:在散步、休息等休闲时刻,听一篇公众号文章,丰富自己的知识储备。
    • 开车出行:在开车时,听一篇公众号文章,利用路上的时间获取信息。
  • CombatVLA – 淘天集团推出的3D动作游戏专用VLA模型

    CombatVLA是什么

    CombatVLA 是淘天集团未来生活实验室团队推出的专为3D动作角色扮演游戏(ARPG)中的战斗任务设计的高效视觉-语言-动作(VLA)模型。模型基于3B参数规模,通过动作追踪器收集的视频动作对进行训练,数据格式化为“动作思维”(AoT)序列。模型用三阶段渐进式学习范式,从视频级到帧级再到截断策略,实现高效推理。CombatVLA 在战斗理解基准测试中超越现有模型,推理速度提升50倍,任务成功率高于人类玩家。

    CombatVLA

    CombatVLA的主要功能

    • 高效战斗决策:CombatVLA 能在复杂的3D游戏环境中实时做出战斗决策,包括躲避攻击、发动技能、恢复生命值等,决策速度比传统模型快50倍。
    • 战斗理解与推理:CombatVLA 能评估敌人的状态、判断敌人的攻击意图,推理出最优的战斗动作,战斗理解能力显著优于其他模型。
    • 动作指令生成:模型能输出具体可执行的键鼠操作指令,例如按下特定按键或执行鼠标操作,控制游戏角色进行战斗。
    • 泛化能力:在不同难度的任务和不同游戏中,CombatVLA 均展现出较强的泛化能力,在未见过的游戏场景中能有效执行战斗任务。

    CombatVLA的技术原理

    • 动作追踪器:基于动作追踪器收集人类玩家的游戏操作数据,包括键盘和鼠标操作,同步截取游戏画面,生成视频动作对数据。
    • 动作思维(AoT)序列:将收集到的数据转化为“动作思维”(Action-of-Thought)序列,每个动作都附带详细解释,帮助模型理解动作的语义和逻辑。
    • 三阶段渐进式学习
      • 阶段1:视频级 AoT 微调,让模型初步理解战斗环境。
      • 阶段2:帧级 AoT 微调,帮助模型理解动作与前序帧的严格对齐。
      • 阶段3:帧级截断 AoT 微调,引入特殊标记 <TRUNC>,截断输出以加速推理。
    • 自适应动作权重损失:通过动作对齐损失和模态对比损失,优化模型的训练过程,确保模型准确输出关键动作。
    • 动作执行框架:将模型输出的动作指令基于动作执行框架转换为实际的键鼠操作,实现对游戏角色的自动控制。

    CombatVLA的项目地址

    • 项目官网:https://combatvla.github.io/
    • GitHub仓库:https://github.com/ChenVoid/CombatVLA
    • arXiv技术论文:https://arxiv.org/pdf/2503.09527

    CombatVLA的应用场景

    • 3D动作角色扮演游戏(ARPG):实时控制游戏角色进行战斗,实现高效决策和动作执行,提升游戏体验。
    • 游戏测试与优化:帮助开发者测试游戏的战斗系统,发现并优化潜在问题。
    • 电子竞技训练:为电竞选手提供智能对手,帮助用户练习战斗技巧和战术,提升竞技水平。
    • 游戏内容创作:辅助游戏开发者生成战斗场景和剧情,快速构建复杂的游戏关卡和任务。
    • 机器人控制:在现实世界中,将技术扩展到机器人控制,使机器人在动态环境中进行快速决策和动作执行。