Skip to main content

Author: Chimy

Agentar – 蚂蚁数科推出的金融智能体开发平台

Agentar是什么

Agentar是蚂蚁数科推出的智能体开发平台,为金融机构提供一站式、全栈的智能体开发工具,助力金融机构高效打造自主决策、可信可靠的金融智能体应用。平台依托蚂蚁集团在金融级场景中锤炼的AI技术能力,具备全流程数据治理能力,沉淀亿级高质量金融数据,基于十万级长思维链标注数据提升复杂决策场景的逻辑性与可靠性。Agentar提供零代码、低代码开发及可视化编排能力,大幅降低搭建智能体的门槛,保障金融级安全合规性。

Agentar

Agentar的主要功能

  • 可信智能体技术:确保推理、知识库、交互和评测归因的可信性与可靠性。
  • 高质量金融知识库:沉淀亿级金融数据,涵盖多维信息,基于长思维链标注数据提升复杂决策逻辑性。
  • 零代码开发与可视化编排:提供零代码、低代码开发能力,内测上线金融MCP服务广场,支持拖拽式搭建智能体应用。
  • 金融级安全合规:具备数据与内容安全防御及监测能力,保障应用场景的安全性。
  • 丰富的服务组件:提供超百个金融MCP服务和“可插拔”组件库,方便用户按需组合使用。

Agentar的应用场景

  • 智能投研:基于高质量金融数据和专家级推理路径,辅助金融机构进行投资研究,提升决策效率和准确性。
  • 智能客服:基于可信智能体技术,实现金融业务的自动化问答和客户咨询处理,提升客户体验。
  • 风险评估:借助大数据和智能分析能力,对金融业务中的风险进行实时监测和评估,提供精准的风险预警。
  • 智能营销:根据用户行为和偏好数据,实现个性化金融产品推荐,提升营销效果和用户满意度。
  • 合规管理:保障金融业务操作符合监管要求,用智能体技术实现合规流程的自动化和智能化,降低合规风险。

URM – 阿里妈妈推出的世界知识大模型

URM是什么

URM(Universal Recommendation Model)是阿里妈妈推出的世界知识大模型,基于知识注入和信息对齐,将LLM的通用知识与电商领域的专业知识相结合,解决传统LLM在电商推荐场景中表现欠佳的问题。URM引入多模态融合的商品表征和高效的Sequence-In-Set-Out生成方式,处理多种推荐任务(如多场景推荐、长尾推荐等),显著提升推荐效果。URM已经在阿里妈妈的展示广告场景中上线,显著提升商家投放效果和消费者购物体验。

URM

URM的主要功能

  • 多任务处理:支持同时处理多种推荐任务,如多场景推荐、多目标推荐、长尾推荐、发现性推荐等。
  • 用户兴趣理解:全面理解用户的兴趣和需求,提供更符合用户当前情境的推荐结果。
  • 高效率推荐:在单次前向传播中生成高质量的推荐集合,满足工业级推荐系统的低时延、高QPS需求。
  • 多模态融合:结合商品的ID表征和语义表征(如文本、图像等),提升商品的表达能力和推荐的准确性。
  • 零样本学习能力:快速适应新任务和新场景,在没有大量标注数据的情况下提供有效的推荐。

URM的技术原理

  • 多模态融合表征
    • ID表征:基于分布式哈希表将商品ID映射为独特的嵌入向量,捕捉商品间的协同信息。
    • 语义表征:文本编码器和图像编码器将商品的文本描述和图像信息转换为语义嵌入向量。
    • 融合机制:MLP层将ID表征和语义表征对齐融合,生成多模态商品嵌入向量,提升商品的表达能力。
  • Sequence-In-Set-Out生成方式:输入序列由用户行为中的商品ID、任务提示中的文本token及特殊查询符(如UM、LM)组成。输出机制基于用户建模头(hUM)和语言模型头(hLM)分别生成用户表征和文本输出。增加UM token数量,使URM在一次前向传播中并行生成多个用户表征,提升召回指标。
  • 任务定义与提示工程:基于文本来定义不同的推荐任务,将商品ID作为特殊token注入文本描述,实现用户行为序列的高效表达。设计不同的提示模板,调整推荐结果的分布,让模型根据不同的任务需求和用户行为动态调整推荐策略。
  • 训练方式:结合商品推荐任务的噪声对比估计(NCE)损失和文本生成任务的负对数似然损失。基于完整参数的有监督微调(SFT),仅冻结商品的原始表征,保留LLM的预训练知识。
  • 异步推理链路:为满足低时延、高QPS要求,设计面向用户行为动态捕捉的异步推理链路,将推理结果持久化存储,供在线召回阶段读取。基于多instance在同一容器部署,将URM推理的并发qps提升200%。

URM的项目地址

URM的应用场景

  • 多场景推荐:根据不同页面(如首页、详情页)提供个性化推荐。
  • 多目标推荐:综合分析用户点击、购买等行为,预测兴趣商品。
  • 长尾商品推荐:挖掘低频商品的潜在价值,丰富用户选择。
  • 发现性推荐:推荐用户未曾接触但可能感兴趣的新品类商品。
  • 搜索增强推荐:结合查询意图和历史行为,提升搜索结果相关性。

AI会取代哪些职业,如何应对就业冲击?一文看懂

人工智能(AI)将主要取代具有高重复性、低技能门槛、工作流程可标准化特征的职业,例如数据录入员、基础客服、生产线工人、部分零售与销售人员、基础会计与行政文员以及基础翻译与内容创作者。面对AI带来的就业冲击,个人应积极提升技能(包括AI相关技能和“人类专属”的软技能),培养创新与创造力,学会与AI协同工作,关注行业动态并灵活规划职业生涯,保持终身学习的心态,勇于探索新兴职业机会。

AI会取代哪些职业?如何应对就业冲击?

人工智能(AI)概览

AI的基本概念与定义

人工智能(Artificial Intelligence, AI)是计算机科学的重要分支,能研究、开发用在模拟、延伸和扩展人的智能的理论、方法、技术及应用系统。AI的核心目标是让机器能像人一样思考、学习、决策和解决问题,在某些方面超越人类。AI是涵盖多种技术的综合领域,研究范围广泛,包括机器学习、深度学习、自然语言处理、计算机视觉、专家系统、机器人技术等。AI系统通过分析大量数据,从中学习规律和模式,用这些知识执行特定任务或做出预测。AI的应用已经渗透到生活的方方面面,从智能手机的语音助手到推荐算法,再到自动驾驶汽车和智能医疗诊断,AI正在深刻地改变着世界。

AI的实现方式

人工智能的实现方式多种多样,机器学习(Machine Learning, ML)和深度学习(Deep Learning, DL)是最为核心和热门的技术路径。机器学习是AI的子领域,赋予计算机系统从数据中学习并改进性能的能力,无需进行显式编程。传统的机器学习算法,如决策树、支持向量机、朴素贝叶斯等,依赖于人工提取的特征进行学习和预测。随着数据量的爆炸式增长和计算能力的提升,深度学习作为机器学习的分支,凭借强大的特征学习能力迅速崛起。深度学习模型,特别是神经网络,能从原始数据中自动学习和提取复杂的特征,无需或仅需少量的人工特征工程。例如,卷积神经网络(CNN)在图像识别领域取得巨大成功,循环神经网络(RNN)及变体(如LSTM、GRU)在自然语言处理和时序数据分析中表现出色。从机器学习到深度学习的演进,标志着AI从依赖人工经验向数据驱动的自动化学习转变,极大地拓展AI的应用边界和能力上限。

AI的核心原理浅析

AI的核心原理在于模拟人类的认知过程,特别是学习、推理和问题解决能力。AI系统通过以下步骤实现功能:

  • 数据输入,系统接收来自传感器、数据库或其他来源的数据;
  • 信息处理,用算法和模型对输入数据进行处理和分析,提取有用的信息和模式;
  • 知识表示,将学习到的知识和规则用计算机理解和操作的方式存储起来;
  • 决策与行动,基于已有的知识和当前情境,做出决策并执行相应的动作。

例如,在图像识别任务中,AI系统分析图像中的像素数据,学习不同物体的特征(如边缘、纹理、形状),根据特征判断图像中包含哪些物体。在自然语言处理任务中,AI系统通过学习大量的文本数据,理解词语的含义、句子的结构及上下文关系,进行文本生成、翻译、问答等。AI的核心在于学习能力,即通过经验(数据)改进自身性能,让AI系统适应不断变化的环境和任务需求。

AI会取代哪些职业?如何应对就业冲击?

AI会取代哪些职业?

人工智能(AI)的飞速发展改变着全球的就业市场格局。麦肯锡等知名咨询机构的多份报告均指出,未来将有大量现有职业面临被AI取代的风险 。报告预测,在自动化发展迅速的情况下,到2030年,全球可能有高达8亿个工作岗位被机器取代;在自动化发展相对缓和的情况下,被取代的工作岗位将达到4亿个 。具体到中国,麦肯锡全球研究院的报告预测,中国约一半的工作内容有被自动化的可能,使中国成为全世界自动化潜力最大的国家之一 。在2030年至2060年间,全球50%的现有职业将被AI取代,进程比预期的要快大约10年 。到2030年,预计自动化将让大多数人30%的工作时间实现自动化,至少需要1200万人进行职业转型 。

职业被AI取代的核心逻辑:高重复性、低技能、可标准化

综合多份研究报告和行业分析,总结出职业被AI取代的核心逻辑主要围绕三个关键特征:高重复性、低技能门槛以及可标准化。

高重复性是AI取代人类工作的首要因素。日常工作内容涉及大量重复性、标准化任务的职业,例如数据录入、文件整理、流水线操作等,AI系统凭借不知疲倦、高效运行的特点,轻松完成这些任务,在效率和成本上往往优于人工 。

低技能门槛更容易被AI替代。这些岗位不需要高度专业化或复杂的技能,AI通过大量的数据训练快速掌握相关任务的执行方法 。例如,会计工作中信息搜集和整理的部分,对严谨性要求极高。可标准化或可预测性强的职业也面临较高风险。如果一项工作的流程和规则是固定的,或工作环境和任务内容相对稳定、可预测,AI系统更容易通过编程和算法模拟和执行工作 。世界经济论坛的白皮书指出,日常任务和重复性工作最有可能实现自动化,例如授信员、收银员和文员等职业,多达81%的工作任务能实现自动化 。

可标准化的工作是指具有清晰流程、固定规则和可预测操作模式的职业。这类工作的执行逻辑通常被明确拆解和程序化,让AI系统能通过算法精确复现其工作流程。例如,在制造业中,产品的装配工序遵循标准化的操作规范;在金融领域,基础的数据录入和报表生成都有固定的模板和规则;在法律行业,标准合同的审核和基础法律文书的起草遵循既定的格式要求。AI系统通过学习和掌握标准化的工作模式,能用更高的效率和更低的错误率完成这些任务,逐步替代人工操作。

高风险职业类别一:数据与文档处理人员

数据与文档处理人员是受AI冲击显著的职业群体。这类职业的核心工作内容,如数据录入、信息提取、文档整理、报告生成等,具有高度的重复性和标准化特征,适合AI技术进行自动化处理。

在客户服务和行政支持领域,AI驱动的智能助理和机器人技术能完成大部分秘书和行政助理的工作,例如日程安排、文件整理、邮件回复等 。办公支持类岗位,如秘书与行政助理,工作内容(约6600万人从事此类工作)通过生成式AI技术进行部分或全面自动化,AI能处理日常任务,如文档整理、行程安排和数据录入,简化繁琐的办公室支持工作 。

高风险职业类别二:客户服务与支持人员

客户服务与支持人员,包括从事基础咨询、问题解答和投诉处理的岗位,面临着被AI大规模取代的风险。主要源于AI在自然语言处理(NLP)和机器学习领域的飞速发展,让智能客服系统能模拟人类对话,高效处理大量的客户请求。生成式AI通过智能客服和个性化推荐,能替代大量重复性的沟通工作,大幅提升客户运营效率 。例如,AI自动处理客户需求,提供个性化服务,大幅提高效率 。在金融与医疗领域,AI在智能投顾、风险评估、客户服务等方面,提高服务的智能化和个性化水平,及整体服务的效率和质量 。

高风险职业类别三:制造业与生产线工人

制造业与生产线工人是工业自动化和AI技术应用的传统领域,受AI冲击最直接和显著。在可预测环境中进行物理活动的工作,如机器安装修理人员、清洁人员、食物准备工人等,岗位需求呈现下降趋势 。在制造业中,装配线上的工人,主要是进行重复性的组装操作,AI驱动的机器人能更加精确和高效地完成工作,减少对人工的需求 。中国作为制造业大国,AI对生产流程的改造和优化正在加速。麦肯锡的报告预测,到2030年,机器将取代中国1.5亿个左右的职位,仓库货架员和叉车操作员等职位受冲击的程度最大。

高风险职业类别四:运输与物流从业人员

运输与物流行业的从业人员,包含司机、快递员等依赖驾驶技能的岗位,面临着自动驾驶技术带来的巨大挑战。AI在辅助驾驶、特定场景下的自动驾驶(如港口、矿区、仓库等封闭环境)及物流路径优化等方面展现出巨大潜力。例如,自动化仓储和分拣系统的出现,让仓库管理员和分拣员的岗位面临着被淘汰的风险 。这些岗位的部分工作内容,如货物的装载、运输、配送等环节,具有一定的重复性和可预测性,AI系统通过精确的算法和传感器实现高效、安全的操作。

高风险职业类别五:零售与销售岗位

零售与销售岗位,特别是传统的收银员、售货员及部分依赖标准化推销流程的销售代表,面临着AI技术带来的替代风险。自助服务技术和智能销售系统的普及是主要驱动因素。例如,无人超市、自助收银台等新型零售模式的出现,直接减少对收银员的需求。AI驱动的智能推荐系统和聊天机器人能在一定程度上替代人工销售代表,完成产品介绍、客户咨询和订单处理等任务。例如,AI分析大量的数据提供市场趋势的信息,辅助进行个性化推荐 。

高风险职业类别六:基础会计与行政文员

基础会计与行政文员工作内容中包含大量重复性、流程化的事务处理,同样面临着被AI技术替代的风险。在会计领域,例如数据录入、账目核对、发票处理、基础财务报表生成等任务,AI通过自动化流程和精确计算高效完成。在会计与审计员的工作中,重复性的数字记录和复查工作将被AI所取代,AI将帮助审计师进行更深入的数据分析,提高审计效率和准确性 。

在行政文员方面,诸如文档管理、会议安排、信息传达、基础数据整理等工作,AI驱动的智能办公系统能实现自动化。例如,微软Office 365将类似ChatGPT的功能嵌入到Word、PPT和Excel中,自动生成简报、PPT和表格。

高风险职业类别七:基础翻译与内容生成

基础翻译和部分内容生成类职业,因AI在自然语言处理和生成方面的进步面临挑战。机器翻译技术,如谷歌翻译、百度翻译及更先进的神经网络翻译模型,在许多场景下能提翻译结果,对于标准化、专业性不强的文本,AI翻译的效率和成本优势明显。AI翻译技术的快速发展使自动翻译成为现实,并不断提升翻译质量 。

在内容生成方面,AI写作工具能根据特定主题和关键词自动生成新闻报道、产品描述、营销文案甚至简单的文学创作。例如,AI创作文本、图片、视频等多种形式的内容,用更快的速度和更高的效率完成创作任务。

如何应对AI带来的就业冲击?

人工智能的发展将对就业市场产生深远影响,部分传统岗位面临被替代的风险,同时催生新的职业机会。与其被动等待,不如主动适应,通过提升技能、转变思维、拥抱新技术,在AI时代找到自己的立足之地和发展空间。核心策略包括不断提升自身技能适应变化的市场需求,培养创新思维和创造力从事AI难以替代的工作,学会与AI协同工作提高效率,密切关注行业动态灵活调整职业规划,发展那些“不可替代”的软技能,保持终身学习的心态,积极探索新兴职业机会。

策略一:提升技能,适应变化

在AI时代,提升个人技能适应快速变化的就业市场需求是应对冲击的首要策略。可以从以下几个方面入手:

学习基础技术知识,例如数据分析、编程语言(如Python)、机器学习基础、深度学习、自然语言处理等关键技术 。这些技能是从事AI相关工作的基础,也能帮助个人更好地理解和应用AI工具,提升在现有岗位上的竞争力。例如,数据录入员通过学习SQL和Power BI等数据分析工具,转型为数据分析师,参与更复杂的数据处理和价值挖掘工作 。

掌握AI工具的应用。市面上有许多面向不同领域的AI应用软件和平台,学会熟练使用这些工具,能显著提高工作效率,将更多精力投入到更具创造性和战略性的工作中。例如,设计师用AI辅助设计工具快速生成设计方案初稿,程序员用AI代码生成工具提高编码效率,营销人员用AI分析工具优化广告投放策略。

注重培养跨学科能力。AI技术的应用与特定行业知识深度融合,具备跨学科背景的人才将更具优势。例如,在医疗领域,既懂医学知识又了解AI技术的医疗数据科学家将非常抢手;在金融领域,掌握金融业务并熟悉AI算法的金融科技分析师将大有可为 。

提升现有专业技能到更高阶水平。如果所在的行业或岗位尚未被AI完全替代,将专业技能提升到AI难以企及的高度,也是一种有效的应对策略。例如,制造业的技术工人学习如何操作和维护更复杂的自动化设备,成为稀缺的技术型人才 。

策略二:关注创新,培养创造力

在AI时代,培养创造力需要建立系统性思维:将AI转化为创意伙伴,用生成式工具拓展思维边界,同时保持人类独有的审美判断和情感共鸣能力;要构建跨领域知识网络,通过”技术+人文”的复合视角发现创新机会。建议采取”输入-转化-输出”的闭环训练,广泛吸收多元知识,用设计思维方法重构问题,通过快速原型验证创意,建立持续迭代的创新习惯。

真正的创新竞争力在于”人机协同”的深度整合能力: 既要善用AI处理信息、生成选项的效率优势,又要发挥人类在价值判断、情感连接和系统思考方面的独特优势。例如设计师用AI生成百种方案,最终依靠人文素养选择最有温度的设计;产品经理借助数据分析发现需求,需结合人性洞察打造真正打动人心的解决方案。这种”AI执行+人类决策”的协作模式,将成为未来最具价值的创新能力。

策略三:学会与AI协同工作

面对AI技术的普及,普通人提升竞争力的关键策略之一是学会与AI工具协同工作。AI工具,如智能客服系统、AI写作助手、数据分析平台等,逐步渗透到各行各业,改变着传统的工作模式。通过掌握AI工具的使用技巧,普通人在工作中实现效率的大幅提升,在竞争中占据优势。

理解AI的能力边界是实现有效人机协同的前提。AI擅长处理重复性、标准化、数据驱动型的任务,在需要复杂推理、情感理解、创造性思维和伦理判断的领域,AI仍然存在局限性。个人需要明确哪些工作能交给AI处理,哪些工作需要人类主导,在此基础上进行合理的任务分配和流程优化。企业应应积极推动员工学习和使用AI工具,通过培训和实践,帮助员工适应新的工作方式,实现人机协同效应最大化。

策略四:关注行业动态,灵活规划职业生涯

个人要时刻保持对行业动态和技术发展趋势的敏锐洞察,灵活规划自己的职业生涯 。通过多种渠道获取信息,例如研读权威行业报告、参加行业研讨会、关注技术领袖的观点等 。这些信息有助于深入了解行业和职业的发展前景,识别哪些岗位可能面临被AI替代的风险,哪些新兴领域将迎来发展机遇。

发现自己所在的职业或岗位有被AI替代的迹象,需要及时调整职业规划,提前做好准备,如转型到新兴领域或提升相关技能等 。例如,传统的数据录入员应该主动学习数据分析、数据可视化等更高级的技能,向数据分析师或数据科学家方向转型。从事基础编程工作的程序员,应该思考如何提升自己在系统架构、算法设计或AI模型微调等方面的能力,向更资深的研发岗位或AI相关岗位发展。职业规划师建议,可以每年进行一次自我评估和职业规划调整,确保个人发展方向与市场趋势同步 。

AI会取代哪些职业?如何应对就业冲击?

策略五:发展“不可替代”的软技能

OpenAI CEO Sam Altman 呼吁个人应聚焦培养AI难以复制的“不可替代技能”,例如复杂问题解决能力、跨领域协作能力、战略思维等 。高阶认知能力和人际交往能力,是AI在可预见的未来难以企及的。例如,面对涉及多因素、多目标的复杂商业问题,AI或许能提供数据分析支持,最终的决策制定、风险评估及跨部门协调沟通,仍需要人类的智慧和经验。在需要深度团队合作和创新突破的项目中,人类的同理心、沟通技巧和协作精神是项目成功的关键。

职业规划师强调,未来五年的职场核心竞争力将转向“软技能”和“适应性能力” 。创造力与创新思维是AI难以替代的,AI能生成内容,但原创性和情感表达仍是人类专属,创意人才将AI工具转化为灵感引擎 。情感智能与人际协作能力在职场中越来越受重视,AI缺乏同理心,职场重视团队合作和领导力,高情感智能者能更好地化解冲突,构建高效网络 。个人在提升技术技能的同时,应有意识地培养和发展“不可替代”的软技能,是在AI时代构建个人职业护城河的关键。

策略六:探索新兴职业机会

随着AI技术的普及和应用,一系列新兴职业应运而生,例如数据科学家、机器学习工程师、AI架构师、AI产品经理、AI训练师、提示词工程师、数据标注员、智能运维工程师(AIOps)、人机交互设计师、AI伦理学专家等 。这些职业要求从业者具备深厚的专业知识,能设计、开发、维护和优化AI系统及相关产品,或者将AI技术与特定行业需求相结合。

AI与医疗、金融、教育、制造等领域的深度融合催生了一系列新的职业机会,如医疗数据科学家、教学导演、金融科技分析师、智能自动化顾问等 。跨领域融合的职业要求从业者掌握AI技能,需了解所在行业的专业知识和业务流程。例如,在医疗领域,AI辅助诊断系统需要医学影像AI分析师进行结果验证和解读 。在制造业,AI驱动的机器人和自动化系统需要专业的技术人员维护和管理,创造了机器人维护工程师、自动化系统操作员等岗位 。个人通过关注行业动态报告、参加新兴技术研讨会、学习相关技能课程等方式,提前了解这新兴职业的技能要求和发展前景,结合自身兴趣和优势,有意识地朝着这些方向进行职业规划和技能储备。积极拥抱新兴职业机会,是应对AI冲击、实现职业跃迁的重要途径。

总结

人工智能的快速发展正在深刻重塑全球就业市场格局,具有高重复性、低技能门槛和可标准化特征的职业首当其冲面临替代风险。中国作为制造业大国预计将有1.5亿职位受到影响。面对这场变革,个人应当积极拥抱”人机协同”的工作模式,既要掌握AI工具应用技能,更要重点培养创新思维、情感智能等人类特有优势。

正如创新工场董事长李开复所言:”未来十年,最抢手的人才不是会使用AI的人,而是最懂得如何与AI合作共创价值的人。”在这个变革的时代,我们需要重新定位自身价值,将AI视为能力放大器而非替代者,通过持续学习和能力升级,在智能时代保持不可替代性。

ACI.dev – 为AI智能体设计的开源MCP基础设施平台

ACI.dev是什么

ACI.dev 是开源的基础设施平台,专为 AI 智能体设计,提供强大的工具调用支持。集成了 600 多种预构建工具,涵盖 Gmail、Slack、Notion 等常见应用,支持通过函数调用或 MCP 服务器灵活访问。多租户认证和动态工具发现功能,让 AI 智能体可以根据需求动态调用工具,通过自然语言定义权限边界,确保安全运行。ACI.dev 采用框架无关的设计,兼容任何 LLM 框架和智能体架构,开发者可以快速通过 Python SDK 或 MCP 服务器集成工具,无需为每个工具单独开发 OAuth 流程和 API 客户端。

ACI.dev

ACI.dev的主要功能

  • 丰富的预构建集成:提供 600+ 预构建的工具集成,涵盖常见的服务和应用程序,如 Gmail、Slack、Notion 等。
  • 灵活的访问方式:支持通过直接函数调用或统一的 Model-Context-Protocol (MCP) 服务器访问工具。
  • 多租户认证与权限管理:内置 OAuth 流程和秘密管理功能,支持多租户认证和细粒度权限控制。
  • 动态工具发现:AI 智能体可以根据意图动态发现和使用工具,无需手动配置。
  • 自然语言权限边界:通过自然语言定义权限边界,确保智能体在安全的范围内运行。
  • 框架与模型无关性:ACI.dev 支持任何 LLM 框架和智能体架构,开发者可以轻松将其集成到现有的 AI 项目中,无需修改底层架构。
  • 多语言支持:ACI.dev 提供了多种语言的 SDK 和开发工具,支持 Python、Node.js 等常用编程语言,方便开发者快速上手和开发。
  • 监控与日志:ACI.dev 提供了详细的监控和日志功能,开发者可以实时查看智能体的工具调用情况、性能指标和错误信息,方便调试和优化。

ACI.dev的官网地址

ACI.dev的应用场景

  • 个人助理聊天机器人:能搜索网络、管理日历、发送邮件、与 SaaS 工具交互。
  • 研究智能体:对特定主题进行研究,将结果同步到其他应用程序。
  • 销售智能体:自动生成潜在客户列表、进行邮件推广和更新 CRM。
  • 客户支持智能体:根据客户查询提供答案、管理工单并执行操作。

Pokee AI – 通用 AI Agent 开发平台,灵活调用各种工具

Pokee AI是什么

Pokee AI 是下一代通用 AI Agent 开发平台。平台基于强化学习(RL)技术构建高效、个性化且交互性强的 AI Agent,替代传统大语言模型进行任务规划和工具调用。Pokee AI 的 Agent 在多步骤任务执行、推理和工具使用方面表现出色,能快速响应用户指令、提供精准服务,适用于电商、开发与创作、企业自动化等多个领域,基于个性化服务与用户建立长期绑定关系,推动 AI 在更多场景中的落地应用。

Pokee AI

Pokee AI的主要功能

  • 高效任务规划:基于强化学习模型,高效地规划多步骤任务。
  • 灵活工具调用:Agent 能灵活调用各种工具(如API、数据库、文件系统等),支持上千或上万个工具的精准调用,同时保持低计算量。
  • 强大的推理能力:支持进行复杂的推理和决策,适用于数学、编程等任务。
  • 个性化服务:根据用户需求和习惯提供定制化服务,理解用户的个性化需求执行任务。
  • 快速响应:支持快速响应用户指令,提供即时结果,提升用户体验。

Pokee AI的官网地址

Pokee AI的应用场景

  • 社交媒体运营:帮助营销人员和运营人员自动发布内容、回复评论和私信,实现多平台的高效管理。
  • 内容创作与分发:快速生成和编辑内容,分发到不同的平台,节省人工操作时间。
  • 数据收集与分析:基于集成的数据接口,自动收集和分析数据,为决策提供支持。
  • 客户服务自动化:自动处理客户咨询,提供常见问题解答,提升客户满意度。
  • 企业工作流优化:协助企业内部任务分配、进度跟踪和文档管理,提高工作效率。

Traini – AI犬语翻译应用,解读宠物叫声和面部表情

Traini是什么

Traini 是AI犬语翻译应用,基于先进的 AI 技术改善宠物主人与宠物之间的沟通和互动体验。应用基于 PetGPT 技术,解读宠物的叫声和面部表情,帮助主人理解宠物的情绪和需求。Traini 提供个性化训练课程,涵盖 200 多种狗技巧和行为训练,配备视频指导,适合从幼犬到成犬的各种训练需求。Traini拥有庞大的宠物社交社区,用户能分享经验、交流心得,与其他宠物主人建立联系。

Traini

Traini的主要功能

  • 宠物行为解读:基于 AI 技术解读宠物的叫声和表情,帮助主人理解宠物的情绪和需求。
  • 个性化训练计划:提供 200 多种狗训练课程和视频指导,涵盖基本服从、幼犬训练、如厕训练等,支持定制个性化训练计划。
  • 专业支持与社区互动:支持向专业训练师和 PetGPT 寻求帮助,解决训练问题;拥有宠物主人社区,分享经验、交流心得。
  • 行为优化与健康管理:帮助解决宠物的常见行为问题,如吠叫、啃咬等;可跟踪训练进度,确保效果。

Traini的官网地址

Traini的应用场景

  • 宠物主人:解读宠物情绪,进行个性化训练,增强互动与情感连接。
  • 宠物训练师:优化训练计划,分享专业经验。
  • 宠物健康管理专业人士:了解宠物健康状况,提供精准建议。
  • 宠物社交爱好者:与其他宠物主人交流经验,增强社交互动。
  • 宠物相关企业:了解宠物主人需求,推广产品和服务。

F-Lite – Freepik联合FAL开源的文生图模型

F-Lite是什么

F-Lite是Freepik团队联合FAL开源的10B参数的文生图模型。基于Freepik内部80M有版权的数据集训练,支持商业用途。F-Lite将T5-XXL作为文本编码器,基于抽取第17层特征注入到DiT模型中。训练包括256和512分辨率的预训练,及1024分辨率的后训练,训练成本较高。推出针对丰富纹理和详细提示优化的特殊版本F-Lite Texture。

F-Lite

F-Lite的主要功能

  • 文本到图像生成:用户输入文本描述,模型生成与描述匹配的图像。
  • 商用许可:模型在 Freepik 提供的版权安全数据集上训练,生成的图像能用在商业用途。
  • 多分辨率训练:支持 256、512 和 1024 分辨率的图像生成,满足不同场景的需求。
  • 特殊版本优化:推出 F-Lite Texture 版本,针对丰富纹理和详细提示进行优化。

F-Lite的技术原理

  • 扩散模型架构:基于逆向扩散过程将随机噪声逐步转化为有意义的图像。用文本条件扩散模型,结合文本编码器将文本特征注入到图像生成过程中。
  • 文本编码器:基于T5-XXL 作为文本编码器,提取文本特征。从 T5-XXL 的第 17 层提取特征,而不是最后一层,更好地捕捉文本的语义信息。文本特征用交叉注意力机制注入到扩散模型中,确保生成的图像与文本描述高度相关。
  • 训练策略
    • 多分辨率预训练:模型在 256 和 512 分辨率上进行预训练,学习图像的基本特征。
    • 高分辨率后训练:在 1024 分辨率上进行后训练,生成更高质量的图像。
    • 强化学习训练:基于 GRPO(Gradient-based Reinforcement Policy Optimization)的强化学习训练,提升生成图像的多样性和质量。
  • 优化技术:引入可学习的 register tokens,更好地对齐文本和图像特征。基于残差连接,提升模型的训练稳定性和效率。基于μ-Parameterization 技术优化扩散过程,提升生成图像的质量。

F-Lite的项目地址

F-Lite的应用场景

  • 创意设计:为广告、海报、插画等设计提供灵感和视觉素材,提升设计效率和创意多样性。
  • 内容创作:生成社交媒体配图、博客配图等,丰富内容的视觉效果,提升吸引力和传播效果。
  • 游戏开发:快速生成游戏角色、场景和复杂纹理,加速游戏设计和开发流程。
  • 教育与学习:根据教学内容生成相关图像,帮助学生更好地理解和记忆,提升学习效果。
  • 商业与企业:生成产品展示图、品牌宣传图等,用于商业推广和品牌建设,提升品牌形象和市场竞争力。

Xiaomi MiMo – 小米开源的首个推理大模型

Xiaomi MiMo是什么

Xiaomi MiMo 是小米开源的首个推理(Reasoning)大模型,支持提升模型在复杂推理任务中的表现。模型基于联动预训练和后训练,挖掘大量富推理语料并采用创新的强化学习算法,显著提升数学推理和代码生成能力。MiMo 仅用 7B 参数规模,在公开测评集上超越 OpenAI 的 o1-mini 和阿里 Qwen 的 QwQ-32B-Preview 等更大规模模型。Xiaomi MiMo包含4 个模型版本,预训练模型MiMo-7B-Base、监督微调模型MiMo-7B-SFT、强化学习模型MiMo-7B-RL和MiMo-7B-RL-Zero已开源至 HuggingFace,为开发者提供强大的推理工具。

Xiaomi MiMo

Xiaomi MiMo的主要功能

  • 强大的数学推理能力:解决复杂的数学问题,提供准确的推理路径和答案。
  • 高效的代码生成能力:生成高质量的代码,适用于多种编程任务。
  • 优化的推理性能:基于预训练和后训练的联动提升推理能力,用 7B 参数规模超越更大规模的模型,展现出高效的推理性能。

Xiaomi MiMo的技术原理

  • 预训练阶段:着重挖掘富推理语料,合成约 200B tokens 的推理数据,确保模型见过更多推理模式。基于三阶段训练,逐步提升训练难度,总训练量达到 25T tokens,模型在不同难度的任务中逐步提升能力。
  • 后训练阶段
    • 强化学习算法:推出 Test Difficulty Driven Reward 算法,缓解困难算法问题中的奖励稀疏问题,提升模型在复杂任务中的表现。
    • 数据重采样策略:引入 Easy Data Re-Sampling 策略,稳定强化学习(RL)训练过程。
    • 高效训练框架:设计 Seamless Rollout 系统,加速 RL 训练(2.29 倍)和验证(1.96 倍),提升训练效率。
  • 模型架构优化:针对推理任务优化模型架构,确保在有限参数规模下实现高效推理能力。

Xiaomi MiMo的项目地址

Xiaomi MiMo的应用场景

  • 教育领域:辅助数学解题和编程学习,提供解题步骤和代码示例。
  • 科研与学术:协助逻辑推理和算法开发,帮助验证假设和设计实验。
  • 软件开发:生成和优化代码,辅助代码调试和问题解决。
  • 智能客服:解答复杂问题,提升问答系统效率。
  • 游戏娱乐:提供策略建议和智力谜题解答,增加游戏趣味性。

RepText – Liblib AI联合Shakker Labs推出的多语言视觉文本渲染框架

RepText是什么

RepText 是Shakker Labs 和 Liblib AI推出的多语言视觉文本渲染框架,基于复制字形而非理解文本内容实现高质量的文本渲染。框架基于预训练的单语言文本到图像生成模型,引入 ControlNet 结构、Canny 边缘检测、位置信息及字形潜变量复制技术,精准地渲染用户指定字体和位置的多语言文本。RepText 适用于平面设计、自然场景等多种场景。

RepText

RepText的主要功能

  • 多语言文本渲染:支持生成多种语言(包括非拉丁字母)的视觉文本,支持用户指定文本内容、字体、颜色和位置。
  • 精准控制:用户能精确控制文本在图像中的位置和样式,实现高度定制化的文本渲染。
  • 高质量生成:基于创新的技术手段,生成的文本在视觉上与背景协调,且具有较高的清晰度和准确性。
  • 与现有模型兼容:支持与现有的文本到图像生成模型(如基于DiT的模型)无缝集成,无需重新训练基础模型。

RepText的技术原理

  • 模仿而非理解:RepText的核心思想是模仿字形,而不是理解文本的语义。基于复制字形的方式生成文本,类似于人类学习写字的过程。
  • ControlNet结构:基于ControlNet框架,用Canny边缘检测和位置信息作为条件,指导模型生成文本。避免对文本编码器的依赖,降低对多语言理解的要求。
  • 字形潜变量复制:在推理阶段,RepText从无噪字形潜变量开始初始化,初始化方式为文本生成提供引导信息,提高文本的准确性和颜色控制能力。
  • 区域掩码:为避免在生成过程中对非文本区域造成干扰,RepText引入区域掩码,确保只有文本区域被修改,背景保持不变。
  • 文本感知损失:在训练阶段,RepText引入文本感知损失(基于OCR模型的特征图),提高生成文本的可识别性和准确性。

RepText的项目地址

RepText的应用场景

  • 平面设计:用在设计贺卡、海报、宣传册等,精准控制文本的字体、颜色和位置。
  • 自然场景渲染:生成自然场景中的文本,如商店招牌、广告牌、路标等,支持多语言和多种风格的字体。
  • 艺术创作:支持艺术字体和复杂排版的生成,例如书法风格的文本、艺术字效果等,为艺术创作提供灵感和素材。
  • 数字内容创作:在视频游戏、动画、网页设计等领域,快速生成符合场景需求的文本内容,提升内容创作效率。
  • 多语言内容本地化:为全球化的数字内容提供本地化的文本渲染支持,快速生成不同语言版本的视觉文本。

风宇 – 中国气象局联合华为和南昌大学推出的空间天气大模型

风宇是什么

风宇是中国气象局联合南昌大学和华为共同推出的全球首个全链式空间天气大模型。模型基于创新的链式训练结构,结合卫星观测数据与数值模式数据,实现太阳风、磁层和电离层的全链式耦合模拟,突破传统模型的算力与实时响应瓶颈。在短临预报与极端事件响应方面表现优异,预测误差控制在国际领先水平。模型广泛应用于卫星通信、航天器轨道管理、电力防护及航空与极地航行安全保障等领域,推动AI与地球空间科学的深度融合。

fengyu

风宇的主要功能

  • 空间天气监测与预警:实时监测太阳风、磁层和电离层的变化,提前预警可能影响地球空间环境的极端事件。
  • 卫星通信与导航保障:基于准确预测空间天气变化,减少卫星通信干扰和导航误差,保障卫星系统的稳定运行。
  • 航天器轨道管理:优化航天器轨道设计,避免因空间天气变化导致的轨道偏差,确保航天任务的安全。
  • 电力与基础设施防护:提前预测地磁暴等事件,帮助电力系统采取防护措施,减少对电网的冲击。
  • 航空与极地航行安全提升:为航空和极地航行提供空间天气信息支持,降低因空间天气变化带来的风险。

风宇的技术原理

  • 全链式耦合:将太阳风、磁层和电离层分别建模,基于耦合优化机制实现多区域、多尺度之间的信息交互与动态响应模拟。链式结构能真实再现太阳风如何影响地球周围环境,及磁场和电离层之间的复杂相互作用。
  • 数据融合:结合卫星的真实观测数据和自主研发的全链式空间天气数值模式生成的数据,形成互相补充、相互印证的数据基础。
  • AI 技术:创新性地将人工智能核心思想与地球系统科学机理深度耦合,基于机器学习算法提升对空间天气变化过程的理解和预测能力,特别是在短临预报与极端事件响应方面表现出色。
  • 预测性能优化:用长达一年的预测性能测试,“风宇”在太阳风、磁层和电离层各区域的24小时短临预测能力表现优异,对全球电子密度总含量的预测误差基本控制在10%以内,处于国际领先水平。

风宇的项目地址

风宇的应用场景

  • 卫星通信与导航系统:减少太阳活动对卫星通信信号的干扰,降低导航误差。
  • 航天器轨道管理:避免因空间天气事件导致的轨道偏差或损坏,确保航天任务的安全和高效执行。
  • 电力与基础设施防护:提前预警地磁暴等空间天气事件,帮助电力系统采取防护措施。
  • 航空与极地航行安全:为航空和极地航行提供空间天气信息支持,帮助规划安全的飞行和航行路线。
  • 科学研究与教育:作为先进的空间天气研究工具,为科研人员和教育机构提供数据支持和技术平台。