Blog

  • GLM-4.6 – 智谱推出的最新旗舰模型,最强Coding模型

    GLM-4.6是什么

    GLM-4.6 是智谱推出的新一代基座大模型,总参数量达 355B,激活参数 32B。模型在真实编程、长上下文处理、推理能力、信息搜索、写作能力及智能体应用等方面实现全面进阶。代码能力比肩 Claude Sonnet 4,上下文长度提升至 200K,推理和搜索能力显著增强,多语言翻译效果更佳,性价比优势突出。GLM-4.6 适配寒武纪芯片,能实现高效推理部署,为开发者和企业提供强大的 AI 支持,推动人工智能技术的广泛应用与创新发展。GLM-4.6 现已上线智谱 MaaS平台,现在订阅即可体验模型性能。

    GLM-4.6

    GLM-4.6的主要功能

    • 编程能力:在公开基准与真实编程任务中表现卓越,复杂调试、跨工具调用等场景表现突出,代码生成与优化高效准确。
    • 上下文处理:上下文窗口由128K提升至200K,支持超长文档阅读、跨文件编程与复杂推理任务。
    • 推理能力:支持工具增强推理,在多个评测基准上取得开源模型最佳表现,逻辑推理能力强。
    • 信息搜索:优化长时程、深度信息探索任务,擅长深度研究及内外信息整合。
    • 写作能力:文风、可读性与角色扮演场景更符合人类偏好,能生成高质量、风格多样的文本。
    • 多语言翻译:进一步增强跨语种任务处理效果,翻译精准流畅。
    • 智能体应用:原生支持多类智能体任务,覆盖办公、开发、写作与内容创作,提升 PPT 可用性、前端代码美观度与版面布局。

    GLM-4.6的性能表现

    • 综合评测:为全面评估 GLM-4.6 的通用能力,在 AIME 25、LCB v6、HLE、SWE-Bench Verified、BrowseComp、Terminal-Bench、τ²-Bench 等 7 大权威基准进行测试。结果显示,GLM-4.6 在大部分榜单中表现卓越,与国际顶尖模型 Claude Sonnet 4 比肩,稳居国产模型首位。
    • 真实编程评测:为更精准地测试 GLM-4.6 在真实编程任务中的表现,在 Claude Code 环境下进行真实场景编程任务测试。实际测试结果显示,GLM-4.6 在实际性能方面超越其他国产模型,领先于国际顶尖模型 Claude Sonnet 4。在平均 tokens 消耗上,GLM-4.6 低于多个模型,与 GLM-4.5 相比,GLM-4.6 在同类任务中可节省 30% 以上的 tokens 消耗。

    GLM-4.6 GLM-4.6

    • 硬件适配
      • 寒武纪芯片适配:GLM-4.6已在寒武纪国产芯片上实现FP8+Int4混合量化部署,这是首次在国产芯片投产的FP8+Int4模型芯片一体化解决方案,在保持精度不变的前提下,大幅降低推理成本。
      • 摩尔线程GPU适配:基于vLLM推理框架部署,摩尔线程新一代GPU可基于原生FP8精度稳定运行GLM-4.6,展现了MUSA架构和全功能GPU在生态兼容与快速支持方面的强大优势。

    如何使用GLM-4.6

    • 通过智谱MaaS平台使用
      • 访问平台:登录智谱 MaaS平台bigmodel.cn,注册并创建账号。
      • 选择模型:在平台上找到GLM-4.6模型,选择相应的服务或套餐。
      • 输入问题:在平台界面输入你的问题或任务,如文本生成、代码生成、搜索等。
      • 获取结果:点击提交后,平台会调用GLM-4.6模型,返回生成的结果。
    • 使用API接口
      • 获取API密钥:在智谱 MaaS平台注册账号后,获取API密钥。
      • 调用API:根据平台提供的API文档,使用HTTP请求调用GLM-4.6的API接口,将问题或任务作为参数传递。
      • 解析结果:接收API返回的JSON格式结果,并解析其中的内容。
    • 通过z.ai平台:海外用户可以通过z.ai平台使用GLM-4.6。

    GLM-4.6的订阅服务优化

    • 功能扩展:新增图像识别与搜索能力,进一步丰富订阅服务的功能范围。
    • 工具支持:支持 Claude Code、Roo CodeKilo CodeCline 等 10 + 主流编程工具,满足不同开发者的多样化需求。
    • 套餐升级
      • 推出 GLM Coding Max 套餐,为高频重度开发者提供三倍用量,满足高强度开发需求。
      • 新增GLM Coding Plan企业版套餐,为企业用户提供兼具安全、成本效益与国际顶尖性能的编码解决方案,助力企业高效开发。
    • 性价比提升:通过优化套餐内容和用量,为开发者和企业提供更具性价比的选择。

    GLM-4.6的应用场景

    • 编程开发:GLM-4.6能高效生成高质量代码,支持复杂调试和跨工具调用,帮助开发者提升编程效率,轻松应对各种开发任务。
    • 文档处理:GLM-4.6能轻松处理超长文档,支持跨文件编程与复杂推理任务,满足文档阅读、编辑和分析需求。
    • 智能推理:模型能快速准确地解决复杂问题,为用户提供高效智能的推理支持。
    • 信息搜索:模型能帮助用户快速获取关键信息,提升工作效率。
    • 写作创作:在文风、可读性与角色扮演场景中更符合人类偏好,生成高质量、风格多样的文本,满足学术论文、小说创作等写作需求。
  • Ring-1T-preview – 蚂蚁百灵开源的万亿参数推理大模型

    Ring-1T-preview是什么

    Ring-1T-preview 是蚂蚁集团开源的万亿参数大模型预览版,基于 Ling 2.0 MoE 架构,在 20T 语料上预训练,通过自研强化学习系统 ASystem 进行推理能力训练。在自然语言推理方面表现出色,AIME 2025 测试中得分 92.6,接近 GPT-5。在 IMO 2025 测试中,一次性解出第 3 题,在其他题目给出部分正确答案,展现出高阶推理能力。

    Ring-1T-preview

    Ring-1T-preview的主要功能

    • 强大的自然语言推理能力:在 AIME 2025 测试中取得 92.6 分,接近 GPT-5 的 94.6 分,展现出强大的数学推理能力。
    • 高效的问题解决能力:在 IMO 2025 测试中,一次性解出第 3 题,并在其他题目上给出部分正确答案,具备高阶推理能力。
    • 多领域竞争力:在 HMMT 2025、LiveCodeBench v6、CodeForces 和 ARC-AGI-1 等任务中表现突出,展现出广泛的适用性。
    • 开源协作:代码与权重完全开源,发布在 Hugging Face 平台,便于社区探索与反馈,加速模型迭代完善。

    Ring-1T-preview的技术原理

    • 架构设计:采用 Ling 2.0 MoE 架构,结合万亿参数规模,为模型提供了强大的表达能力和高效的计算效率。
    • 预训练语料:在 20T 高质量语料上完成预训练,确保模型能够学习到丰富的语言知识和模式。
    • 强化学习训练:通过自研的高效强化学习系统 ASystem 进行针对推理能力的 RLVR 训练,提升模型的推理和决策能力。
    • 持续迭代:模型仍在持续训练中,不断优化性能,解决当前存在的问题,如语种混杂、推理重复等。

    Ring-1T-preview的项目地址

    • Hugging Face模型库:https://huggingface.co/inclusionAI/Ring-1T-preview

    Ring-1T-preview的应用场景

    • 自然语言推理任务:在 AIME 25 测试中获得 92.6 分,接近 GPT-5 的 94.6 分,展现出强大的数学推理能力。
    • 代码生成与优化:在 CodeForces 测试中以 94.69 分的成绩超过 GPT-5,证明了其出色的代码生成能力。
    • 多智能体框架应用:接入多智能体框架 AWorld,可用于测试和探索复杂的推理任务。
    • 学术研究与开发:作为全球首个开源的万亿参数推理大模型,为研究者和开发者提供高性能、可复现的推理基座,推动大模型生态的透明化与协作创新。
  • Claude Sonnet 4.5 – Anthropic最新推出的AI编程模型

    Claude Sonnet 4.5是什么

    Claude Sonnet 4.5 是 Anthropic 最新推出的最强编程模型。模型在编程、计算机操作、推理和数学等多个领域表现出色,在 SWE-bench Verified 测试中登顶,能专注工作超 30 小时。模型具备强大的智能体能力,可通过 API 和工具实现复杂任务自动化。Claude Sonnet 4.5 在对齐性和安全性方面有显著提升,减少不良行为、增强防御能力。Claude Sonnet 4.5支持多种应用场景,包括代码生成、知识问答和内容创作等,目前,Claude Sonnet 4.5 已全面开放,包括 claude.ai 官网、App 和 API(API定价与前代Claude Sonnet 4相同)。

    Claude Sonnet 4.5 为用户推出Imagine with Claude临时研究预览功能,用户通过自然语言指令能与 Claude 互动,实时生成和调整软件代码及功能,所有内容均为即时创造,无需预设代码。该功能目前仅对 Max 订阅用户开放,旨在加速软件开发、原型设计和创意探索,提供高效、灵活的交互体验。

    Claude Sonnet 4.5

    Claude Sonnet 4.5的主要功能

    • 长时运行智能体:提供卓越的指令遵循、工具选择、错误纠正和高级推理能力,适用面向客户的智能体和复杂 AI 工作流。
    • 代码生成:Sonnet 4.5 能完成从初始规划到漏洞修复、维护和大规模重构的整个软件开发生命周期任务,支持最多 64K 输出 tokens,适合复杂代码生成和规划。
    • 浏览器和计算机操作:模型在计算机操作能力上领先,能可靠地处理各种基于浏览器的任务,从竞争分析到采购流程再到客户入职,计算机操作能力比前代更准确可靠。
    • 网络安全:用 Sonnet 4.5 和 Claude Code 的团队能部署智能体,自动修补漏洞以防止被利用,从被动检测转向主动防御。
    • 金融分析:模型能处理从基础金融分析到高级预测分析的所有任务,例如持续监控全球监管变化,提前调整合规系统,实现从手动审计准备到智能风险管理的转变。
    • 业务任务:模型在制作和编辑幻灯片、文档和电子表格等办公文件方面表现出色。
    • 研究:Sonnet 4.5 能搜索外部和内部数据源,以综合复杂信息环境中的全面见解。
    • 内容生成与分析:模型在写作方面表现出色,能理解细微差别和语调,生成更具吸引力的内容,在更深层次上分析内容。

    Claude Sonnet 4.5的核心升级

    • Claude Code:Claude Sonnet 4.5 在 Claude Code 中新增检查点功能,能保存进度、即时回退到之前状态,同时更新终端界面、发布原生 VS Code 扩展,满足用户的强烈需求、提升开发体验。
    • Claude API:Claude Sonnet 4.5 为 Claude API 新增上下文编辑功能和记忆工具,使智能体能运行更长时间、处理更复杂的任务,进一步增强 API 的功能和应用场景。
    • Claude 应用:Claude Sonnet 4.5 将代码执行和文件创建功能(包括电子表格、幻灯片和文档)直接集成到 Claude 应用的对话中,为上个月加入等待列表的 Max 用户提供 Chrome 扩展,提升用户在实际使用中的便利性和效率。
    • Claude Agent SDK:Claude Sonnet 4.5 推出 Claude Agent SDK,为开发者提供构建 Claude Code 所使用的基础设施和工具,使开发者能构建自己的前沿产品。

    Claude Sonnet 4.5

    Claude Sonnet 4.5的性能表现

    • SWE-bench Verified 评估:Claude Sonnet 4.5 在 SWE-bench Verified 评估中达到行业领先水平。实际应用上,模型能在复杂、多步骤的任务中保持专注超过 30 小时。
    • OSWorld 基准测试:在 OSWorld 基准测试中,Claude Sonnet 4.5 的表现大幅提升,达到 61.4% 的准确率,领先于其他模型。
    • Chrome 浏览器:通过 Claude for Chrome 扩展,Sonnet 4.5 能直接在浏览器中工作,包括浏览网站、填写电子表格和完成任务。
    • 在推理和数学等广泛评估:Claude Sonnet 4.5 在推理和数学等广泛评估中展现改进的能力,相比之前的模型,在这些领域的表现更加出色。
    • 在特定领域知识和推理能力:金融、法律、医学和 STEM 领域的专家发现,Sonnet 4.5 在特定领域的知识和推理能力上相比旧模型(包括 Opus 4.1)有显著提升。

    Claude Sonnet 4.5

    Claude Sonnet 4.5的应用场景

    • 长时运行智能体:适用需要长时间运行的复杂任务,如自动化工作流、持续监控和多步骤任务处理。
    • 代码生成:贯穿整个软件开发生命周期,从规划到实现、维护和重构,支持复杂编程任务。
    • 浏览器和计算机操作:支持处理基于浏览器的任务,如自动化网页操作、数据抓取和在线流程处理。
    • 网络安全:部署智能体能自动检测和修复漏洞,从被动防御转向主动安全防护。
    • 金融分析:模型能进行从基础到高级的金融分析,包括风险评估、合规监控和预测分析。

    Claude Sonnet 4.5的官方报告

    免费领取Claude Sonnet 4.5官方模型报告,微信扫码关注回复:20250930

    Claude Sonnet 4.5的适用人群

    • 软件开发者:模型强大的代码生成和优化能力,帮助开发者快速实现复杂编程任务,提升开发效率。
    • 网络安全团队:模型能自动检测和修复漏洞,助力团队从被动防御转向主动安全防护。
    • 金融分析师:模型能处理从基础到高级的金融分析,包括风险评估和合规监控,助力智能风险管理。
    • 企业业务人员:高效创建和编辑办公文件,如幻灯片、文档和电子表格,提升日常办公效率。
    • 研究人员:整合内外部数据源,生成跨复杂信息领域的综合见解,助力学术和商业研究。
  • 腾讯推出《企业级智能体产业落地研究报告》(PDF文件)

    《企业级智能体产业落地研究报告》是腾讯云、腾讯研究院联合国际权威研究机构Gartner共同推出的,报告深入探讨企业级智能体的产业落地情况。介绍了智能体从“辅助工具”到“自主生产力”的转变,详细阐述智能体的定义、形态及能力层级。报告通过“智能体场景罗盘”和“百大场景”梳理智能体在各行业的应用现状。分析了智能体落地的技术挑战,如训推成本、模型性能、安全防护等,且提出相应的解决方案。报告展示了多个行业的先锋实践案例,对未来智能体的发展趋势进行展望,强调智能体在推动企业智能化转型中的重要作用。

    获取《企业级智能体产业落地研究报告》报告PDF原文件 扫码关注回复: 20250929

    引言

    报告指出,人工智能正迎来重要的转折点,从“辅助工具”向“自主生产力”转变。智能体(AI Agent)作为变革的核心,能自主理解目标、规划路径、调用工具、与物理或数字世界交互。未来的企业运营人员能通过自然语言表达战略目标,由智能体组成的“虚拟团队”自主协作完成任务,如市场分析、广告投放和数据分析等。变革将重塑人机协作的边界,推动生产力的革命。

    智能体概念

    • 定义与形态
      • 狭义智能体:强调自主学习与优化,具备原生工具调用与任务闭环执行能力。核心特征包括自主规划与反馈调节,能在无需持续人工干预的情况下完成任务。
      • 广义智能体系统:更包容,依赖预设规则,通过工作流和工具协同实现任务。核心特征是执行预定义任务,依赖提示(Prompt)进行决策。
    • 能力界定与分类
      • 核心要求:智能体需要“能干活、能落地、能实战”,能力界定和分类必须依托可验证的评测体系。
      • 评测体系:分为模型基础能力测试、通用任务测试和特定领域的端到端任务测试。评测方式包括最终输出评测、中间过程评测和相对评测。
      • 能力层级:从L1(基础响应与流程执行)到L5(组织与领导)。每个层级对应不同的任务执行方式和技术要点,例如L1主要依赖知识库问答和工作流,L3开始具备自主规划和优化能力。

    智能体场景盘点

    • 智能体场景罗盘:报告提出“智能体场景罗盘”,通过横纵两个坐标轴(任务复杂度和自主规划依赖度)划分四个象限:高效助手、执行专家、决策专家和全能专家。每个象限代表不同类型的智能体应用场景,成熟度从概念验证到稳定可用不等。
    • 智能体百大场景:报告梳理了金融、零售、文旅、教育、医疗等14个行业的上百个智能体应用场景,为企业提供直观的参考。场景覆盖从简单任务自动化到复杂项目管理的广泛应用。

    智能体技术/产品方案解析

    • 技术挑战
      • 训推成本:大模型的训练和推理对资源需求极高,导致成本居高不下。业务负载的“潮汐效应”使传统的静态算力部署模式难以适应,进一步加剧资源浪费和成本问题。
      • 模型性能:通用大模型在处理特定领域的专业知识时存在局限性,容易产生“幻觉”问题,在需要自主执行任务的场景中可能导致错误决策和危险行为。
      • 安全防护:智能体应用引入了新的安全风险,如提示词注入、敏感信息泄露和不当的API调用。智能体处理和存储的海量敏感数据面临数据滥用、隐私泄露和法规不合规的风险。
      • 数据治理:企业内部数据普遍存在质量参差不齐、格式不统一、信息缺失和逻辑冲突等问题,形成了以打破的“数据孤岛”。导致智能体在整合不同部门数据时出现矛盾,影响其策的准确性。
      • 业务流程耦合:智能体需要与企业现有的复杂系统深度集成,但旧系统之间的技术耦合和人机协作的流程耦合存在诸多障碍。
    • 解决方案
      • 腾讯云智能体战略全景图:腾讯云智能体战略全景图整合智能体应用、开发平台和基础设施,提供全链条解决方案,助力企业高效构建和优化智能体系统,推动智能化转型。
      • 腾讯云产品方案:具体技术优化聚焦通信、调度、模型、安全、数据治理和知识解析等关键领域,通过先进技术手段提升智能体性能与可靠性,为企业应用落地提供支撑。

    智能体先锋实践

    报告列举多个行业的先锋实践案例,展示了智能体在实际业务中的应用效果:

    • 文旅:华住集团打造7×24小时“全能酒店管家”,提升客户服务体验。
    • 医疗:迈瑞×腾讯云“启元”大模型重塑重症诊疗范式,提高医疗效率。
    • 出行:一汽丰田用大模型打造专家级汽车服务智能客服,优化用户体验。
    • 零售:伊利集团用智能体打造智能导购新体验,激活全域营销新动能。
    • 金融:东吴人寿智能体技术助力保险全周期服务体系智能化升级。
    • 互联网:同程DeepTrip智能助手用AI重新定义旅行体验。
    • 教育:考试宝以AI大模型解锁精准学习新范式。

    • 政务:邯郸公积金全国首创“边聊边办”数字柜台,重塑公积金服务新体验。
    • 制造:运达能源科技集团以智能体技术提升风电装备制造和交付效能。
    • 能源:五环集团用AI重塑工程管理赋能新质生产力。
    • 地产:碧桂园服务打造“一问”AI客服机器人赋能员工效率跃升。
    • 物流:DHL用智能体重构跨境智能客服实现效率与合规双提升。
    • 游戏:巨人网络《太空杀》游戏引入AI智能体,创新游戏玩法。
    • 心理健康:腾讯云助力心言集团打造AI情感陪伴服务。
    • 法律:得理科技打造AI法务助手重塑企业法务服务新范式。

    智能体发展展望

    报告预测智能体将从单一、静态的应用走向动态、泛在化和具身化的新形态,推动社会和商业的范式变革:

    • 智能协同:从单兵作战到群体智能,实现多智能体协同和跨组织智能体协同。
    • 感知与推理:通过多模态模型和世界模型,实现更高级的推理和对世界的内在理解。
    • 执行与应用:智能体的泛在化与具身化,将能力延伸到物理世界,融入各类硬件终端。

    结语

    智能体正从“辅助工具”演变为“自主生产力”,将深刻影响企业运营、组织形态乃至社会结构。腾讯云通过构建从技术底座到行业应用的全栈能力,助力企业分阶段、可持续地推进智能体建设,实现从“试点验证”到“生态融合”的智能化转型。

    获取《企业级智能体产业落地研究报告》报告PDF原文件 扫码关注回复: 20250929

  • OpenPPT – 开源AI PPT生成工具,支持多平台使用

    OpenPPT是什么

    OpenPPT 是开源的PPT工具,核心服务基于ChatPPT能提供高效、便捷的 PPT 制作体验。工具支持多平台使用,包括 Windows、macOS 和 Linux,让用户能在不同设备上轻松创建和编辑演示文稿。OpenPPT 的特点包括简洁的界面设计、丰富的模板资源及强大的协作功能,支持多人实时在线编辑,方便团队协作。OpenPPT 提供丰富的动画和交互效果,帮助用户制作更具吸引力的演示文稿。工具开源特性吸引了众多开发者参与贡献,不断优化功能和性能。

    OpenPPT

    OpenPPT的主要功能

    • 多平台支持:兼容 Windows、macOS 和 Linux 系统,用户能在不同设备上无缝切换使用,满足多样化的工作环境需求。
    • 简洁易用的界面:操作直观,上手简单,新手也能快速掌握基本功能,高效制作演示文稿。
    • 丰富的模板库:内置多种专业模板,涵盖不同主题和场景,用户能直接选用或修改,节省设计时间。
    • 强大的协作功能:支持多人实时在线编辑,团队成员能同时对同一演示文稿进行操作,实时查看修改内容,提升协作效率。
    • 动画与交互效果:提供丰富的动画效果和交互设计选项,如页面切换动画、元素动画等,让演示文稿更具吸引力和表现力。
    • 支持多种格式导入导出:兼容常见的 PPT 文件格式,方便地导入其他软件制作的演示文稿,支持导出为多种格式,便于分享和使用。

    如何使用OpenPPT

    • 安装与启动:访问OpenPPT的GitHub仓库 https://github.com/YOOTeam/OpenPPT,下载对应操作系统的安装包,安装完成后启动软件。
    • 选择模板:打开软件后,从内置的丰富模板库中选择一个适合主题的模板,快速开始制作演示文稿。
    • 编辑内容:通过文本框、图片插入、图表绘制等功能,添加和编辑演示文稿的内容。
    • 添加动画:用动画工具栏,为幻灯片中的元素添加进入、强调、退出等动画效果,增强演示的视觉吸引力。
    • 多人协作:点击协作功能按钮,邀请团队成员加入,实时在线共同编辑同一演示文稿,实时查看彼此的修改。
    • 导出分享:完成制作后,选择导出功能,将演示文稿保存为PPTX、PDF等常见格式,方便在其他设备或软件中使用和分享。

    OpenPPT的项目地址

    • 项目官网ChatPPT
    • GitHub仓库:https://github.com/YOOTeam/OpenPPT

    OpenPPT的应用场景

    • 企业汇报:用在制作公司内部的项目汇报、业绩展示、市场分析等演示文稿,简洁高效地传达信息。
    • 教育培训:教师或培训师创建教学课件,结合动画和互动效果,提升教学趣味性和学生参与度。
    • 学术演讲:研究人员和学者借助OpenPPT制作学术报告,清晰展示研究思路、实验结果和结论。
    • 产品展示:企业用OpenPPT制作产品介绍演示文稿,突出产品特点和优势,用在发布会或销售推广。
    • 团队协作:团队成员通过OpenPPT的协作功能共同编辑演示文稿,实时沟通和修改,提高工作效率。
  • DeepSeek-V3.2 – DeepSeek开源的AI模型Exp实验性版本

    DeepSeek-V3.2是什么

    DeepSeek-V3.2-Exp是DeepSeek-AI推出的实验性人工智能模型,通过引入DeepSeek Sparse Attention(DSA)机制,显著提升长文本处理的效率。模型基于DeepSeek-V3.1-Terminus持续训练而成,仅在架构上引入了DSA,实现了细粒度稀疏注意力机制,借助闪电索引器(lightning indexer)高效选择关键信息,在长文本训练和推理时大幅提高效率。

    在性能方面,DeepSeek-V3.2-Exp在多个公开评测集上与DeepSeek-V3.1-Terminus基本持平,展现了其在不同领域的能力。模型在Hugging Face和ModelScope平台开源,方便研究人员和开发者进行探索和应用。DeepSeek-V3.2-Exp的API价格大幅下降,降低了开发者的使用成本,进一步推动了其在实际应用中的广泛部署。

    DeepSeek-V3.2-Exp

    DeepSeek-V3.2的主要功能

    • 架构创新:DeepSeek-V3.2-Exp在DeepSeek-V3.1-Terminus的基础上引入了DeepSeek Sparse Attention(DSA)机制,通过闪电索引器和细粒度标记选择机制,实现了显著的效率提升,尤其在长文本场景下表现突出。
    • 性能优化:模型在多个公开评测集上与DeepSeek-V3.1-Terminus性能相当,在长文本处理中显著降低了推理成本,从 优化至 ,大幅提高了长文本推理效率。
    • 开源共享:DeepSeek-V3.2-Exp在Hugging Face和ModelScope平台开源,提供了详细的实现细节和模型权重,方便研究人员和开发者进行研究和应用。
    • 成本降低:API价格大幅下降,降低了开发者的使用成本,使得更多开发者能够以较低成本接入和使用该模型,推动了其在实际应用中的广泛部署。
    • 应用拓展官方App网页端、小程序均已更新为DeepSeek-V3.2-Exp,支持多种应用平台,为用户提供了更高效、更经济的AI服务体验。

    DeepSeek-V3.2的技术原理

    • 稀疏注意力机制:DeepSeek-V3.2-Exp引入了DeepSeek Sparse Attention(DSA),通过闪电索引器计算查询标记与前序标记之间的索引分数,选择关键值条目,实现细粒度的稀疏注意力,显著提升长文本处理效率。
    • 闪电索引器:闪电索引器是DSA的核心组件,计算查询标记与前序标记之间的索引分数,通过少量的索引头和高效的计算方式,快速确定哪些标记对查询标记最重要。
    • 细粒度标记选择:根据索引分数,模型选择前k个关键值条目进行注意力计算,减少了不必要的计算,提高了模型的推理速度和效率。
    • 基于MLA的实现:DSA在Multi-Layer Attention(MLA)架构下实现,采用Multi-Query Attention(MQA)模式,使得每个关键值条目可以在多个查询之间共享,提高了计算效率。
    • 持续训练与优化:从DeepSeek-V3.1-Terminus的基础检查点开始,通过密集热身和稀疏训练两个阶段,对闪电索引器和整个模型进行优化,以适应稀疏注意力模式。

    DeepSeek-V3.2的项目地址

    • HuggingFace模型库:https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Exp
    • 魔搭社区:https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2-Exp
    • 技术论文:https://github.com/deepseek-ai/DeepSeek-V3.2-Exp/blob/main/DeepSeek_V3_2.pdf

    如何使用DeepSeek-V3.2

    • 通过API使用:开发者可以调用DeepSeek-V3.2-Exp的API接口,在自己的应用程序中集成该模型的功能。API价格的大幅下降使得使用成本降低,方便更多开发者接入。
    • 本地运行:用户可以从Hugging Face平台下载DeepSeek-V3.2-Exp的模型权重,按照提供的本地运行指南,将权重转换为推理演示所需格式,并启动交互式聊天界面进行使用。
    • 使用官方应用:DeepSeek的官方App网页端和小程序均已更新为DeepSeek-V3.2-Exp版本,用户可以直接通过这些平台使用模型,无需额外配置。
    • 模型微调:对于特定任务或领域,用户可以基于DeepSeek-V3.2-Exp进行微调,以更好地适应特定的应用场景,提升模型在特定任务上的性能。
    • 二次开发:DeepSeek-V3.2-Exp在Hugging Face和ModelScope平台开源,用户可以参考开源代码和实现细节,了解模型的具体工作方式,并根据需要进行二次开发。

    DeepSeek-V3.2-Exp

    DeepSeek-V3.2的应用场景

    • 长文本处理:适用于需要处理长文本的场景,如长篇文档分析、长文本生成等,其稀疏注意力机制能显著提高长文本的处理效率。
    • 搜索与信息检索:可用于搜索代理等场景,帮助用户快速准确地检索信息,提升搜索效率和相关性。
    • 代码生成与编程辅助:支持代码生成和编程辅助任务,如代码补全、代码优化等,帮助开发者提高编程效率和代码质量。
    • 数学与逻辑推理:在数学问题解答和逻辑推理任务中表现出色,能够处理复杂的数学问题和逻辑推理链。
    • 多语言处理:支持多语言任务,可应用于跨语言的文本生成、翻译等场景,满足不同语言环境下的需求。
    • 智能代理与交互:作为智能代理的核心模型,可用于构建智能助手、聊天机器人等,提供自然语言交互服务。
  • Lynx – 字节跳动推出的高保真个性化视频生成模型

    Lynx是什么

    Lynx 是字节跳动推出的高保真个性化视频生成模型,仅需单张人像照片,能生成身份一致的视频。基于扩散 Transformer(DiT)基础模型构建,引入 ID-adapter 和 Ref-adapter 两个轻量级适配器模块,分别用于控制人物身份和保留面部细节。Lynx 采用人脸编码器捕捉面部特征,通过 X-Nemo 技术增强表情,LBM 算法模拟光影效果,确保人物身份在不同场景下的一致性。其交叉注意力适配器可将文本提示与人脸特征结合,生成符合场景要求的视频。Lynx 具备“时间感知器”,能理解动作物理规律,保持视频时间连贯性。在大规模测试中,Lynx 在面部相似度、场景匹配度和视频质量等多个维度上表现优异,超越同类技术。采用 Apache 2.0 授权,可用于商用,但需确保人脸原图获得肖像权。

    Lynx

    Lynx的主要功能

    • 个性化视频生成:仅需单张人像照片,即可生成身份一致的个性化视频。
    • 身份特征保留:通过人脸编码器和适配器模块,确保人物在不同场景下身份特征的一致性。
    • 场景匹配能力:利用交叉注意力适配器,结合文本提示生成符合场景要求的视频。
    • 时间连贯性:具备“时间感知器”,理解动作物理规律,保持视频时间维度的连贯性。
    • 高性能表现:在面部相似度、场景匹配度和视频质量等多个维度上表现优异,超越同类技术。
    • 商用授权:采用 Apache 2.0 授权,可用于商用,但需确保人脸原图获得肖像权。

    Lynx的技术原理

    • 基于扩散 Transformer 架构:Lynx 采用开源的扩散 Transformer(DiT)基础模型构建,高效地将随机噪声转换为目标内容。
    • 身份特征提取与保留:通过 ArcFace 技术提取人脸特征,利用 Perceiver Resampler 将特征向量转换为适配器输入,确保生成视频中人物身份的一致性。
    • 细节增强与适配:引入轻量级的 ID-adapter 和 Ref-adapter 模块,分别用于控制人物身份和保留面部细节,使生成的视频在细节上更加逼真。
    • 交叉注意力机制:在所有 Transformer 层中注入细粒度细节,通过交叉注意力机制将文本提示与人脸特征相结合,生成符合场景要求的视频。
    • 3D 视频生成技术:采用 3D VAE 架构,赋予模型“时间感知器”,使其理解动作的物理规律,在生成视频时保持时间维度的连贯性。
    • 对抗训练策略:通过生成器、判别器和身份判别器的三重对抗训练机制,优化模型性能,提升生成视频的逼真度。

    Lynx的项目地址

    • 项目官网:https://byteaigc.github.io/Lynx/
    • Github仓库:https://github.com/bytedance/lynx
    • HuggingFace模型库:https://huggingface.co/ByteDance/lynx

    Lynx的应用场景

    • 数字人制作:为虚拟主播、客服等数字人生成逼真的动态视频,提升交互体验。
    • 影视特效制作:快速生成特定人物在不同场景中的视频片段,辅助影视特效制作,节省时间和成本。
    • 短视频创作:创作者可利用单张照片生成多样化视频,丰富内容创作,提高创作效率。
    • 广告营销:根据产品和品牌需求,生成个性化视频广告,增强广告的吸引力和传播力。
    • 游戏开发:为游戏角色生成个性化动作和表情,提升游戏的沉浸感和真实感。
    • 教育与培训:生成教育视频,如虚拟教师讲解课程,或培训视频中的人物演示操作步骤。
  • Scrumball – AI营销平台,覆盖全球社交媒体平台

    Scrumball是什么

    Scrumball 是 AI 驱动的全球网红营销平台,帮助品牌高效开展海外网红合作。拥有超过1.2亿网红的庞大数据库,覆盖全球主要社交媒体平台,如YouTube、Instagram和TikTok等。通过先进的AI技术,Scrumball能精准匹配符合品牌需求的网红,确保合作的高契合度和真实性。平台提供全面的数据监测和分析功能,实时追踪品牌和网红内容的曝光、互动等关键数据,帮助品牌量化合作成果并优化策略。Scrumball提供邮件自动化和沟通管理工具,简化品牌与网红的沟通流程,提高合作效率。

    Scrumball

    Scrumball的主要功能

    • 网红搜索与筛选:提供全球1亿3000万+网红数据,品牌可通过关键词搜索,精准筛选符合需求的潜在网红。
    • 数据监测与分析:实时监控品牌、网红和视频在主流平台(如YouTube、Instagram、TikTok等)上的曝光和互动数据,帮助品牌了解内容表现,进行调整和优化。
    • 品牌流量分析:为品牌提供详细的品牌流量分析,包括自身品牌和关注品牌在各社交媒体上的曝光数据。
    • 成效落点分析:精准追踪网红合作内容的数据,量化合作成果,为品牌方和网红提供全面的成效落点分析。
    • 沟通与合作管理:提供邮件自动化任务和消息工单功能,帮助品牌批量发送邮件开发网红,并进行后续沟通管理。
    • 品牌合作洞察:搜集了5000+热门出海行业网红营销品牌,并持续新增数据,可监控竞品推广数据,展示合作红人列表,支持快速触达竞品合作红人。
    • 联盟营销支持:可监控红人为shopify站点的引流数据,包括访问量、订单量、产品数、销售额、分佣额等,进一步进行红人的数据复盘。

    Scrumball的官网地址

    • 官网地址:https://www.scrumball.com/

    Scrumball的应用场景

    • 品牌出海:助力品牌在海外市场迅速提升知名度,拓展全球业务版图。
    • 电商营销:帮助电商企业精准触达全球网红,提升品牌影响力,促进销售增长。
    • 内容创作:为创作者提供数据分析与合作机会,助力内容优化与商业变现。
    • 市场调研:通过网红数据洞察市场趋势,为品牌决策提供数据支持。
    • 竞品分析:监控竞品网红合作,挖掘潜在机会,优化自身营销策略。
  • JoySafety – 京东开源的大模型安全框架

    JoySafety是什么

    JoySafety 是京东开源的大模型安全框架,为企业提供成熟、可靠、免费的大模型安全防护方案。模型基于多种原子能力模块(如 BERT、FastText、Transformer 等)和灵活的架构设计,支持高并发、高扩展性及动态策略更新,能有效拦截高风险内容,保障 AI 应用的安全稳定运行。模型具备易用性,支持一键 Docker 启动和标准化 API 接口,方便快速集成。

    JoySafety

    JoySafety的主要功能

    • 内容安全检测:通过敏感内容拦截、红线代答和智能纠偏,确保输出内容符合法规和道德要求,为企业和用户提供安全可靠的 AI 交互环境。
    • 数据安全防护:检测、防止数据泄露,对用户输入和模型输出中的敏感信息进行识别和保护,确保数据处理过程符合隐私法规要求。
    • 提示词攻击防御:基于多轮对话识别技术,智能分析上下文,识别、防御恶意提示词攻击,保障 AI 对话系统的安全性和稳定性。
    • 策略编排与动态更新:支持通过 API 动态调整安全策略,实现原子能力热插拔,灵活适应不同业务场景,无需中断服务即可更新检测模块。
    • 高扩展性与负载均衡:支持集群化部署,通过水平扩展和智能负载均衡技术,提升系统并发处理能力,满足高并发业务需求。
    • 易用性与集成:通过 Docker Compose 实现一键启动,提供标准化 API 接口,支持多语言调用,方便与现有系统快速集成。

    JoySafety的技术原理

    • 多模型协同检测:通过多种预训练模型(BERT/FastText/Transformer 等模型)对输入内容进行分类和检测,识别潜在风险。:结合敏感词库和红线知识库,提供精准的拦截和代答策略。
    • 异步检测机制:采用异步输出机制,将检测任务与主业务流程解耦,大幅提升响应速度,减少用户等待时间。通过多轮对话上下文,智能识别潜在的提示词攻击或恶意引导,确保对话安全。
    • 动态策略更新:原子能力热插拔支持在运行时动态更新检测模块,无需重启服务。通过轻量级编排引擎,灵活配置检测策略,适应不同业务需求。
    • 智能负载均衡:支持水平扩展,通过负载均衡技术提升系统并发处理能力。基于窗口化检测策略在性能与准确性之间找到平衡,优化系统资源利用率。

    JoySafety的项目地址

    • GitHub仓库:https://github.com/jd-opensource/JoySafety

    JoySafety的应用场景

    • AI 导购:为电商平台提供安全可靠的推荐内容,避免误导消费者,确保推荐信息符合法规和道德标准。
    • 物流客服:在物流客服场景中,拦截不当言论和敏感信息,提供合规的客户支持,提升服务质量。
    • 销售助手:帮助销售人员在与客户沟通时防止敏感信息泄露,保障商业机密安全,避免法律风险。
    • 医疗问诊:在医疗咨询中过滤不合规内容,确保提供的医疗建议安全可靠,符合医疗法规和伦理要求。
    • 商家工作台:保护商家在平台上的数据安全,防止隐私泄露,确保商家信息符合隐私法规。
  • KAT-Coder – 快手Kwaipilot推出旗舰代码生成模型

    KAT-Coder是什么

    KAT-Coder 是快手旗下 Kwaipilot 团队发布的闭源旗舰代码生成模型,具备强大的编程能力。能高效完成功能开发、缺陷分析、单测生成等任务,支持多种编程语言,如 Python、JavaScript、Java 等。用户只需描述需求,模型能交付完整的代码解决方案。KAT-Coder 在 SWE-Bench Verified 测试中解决率高达 73.4%,表现卓越。通过 StreamLake 平台提供 API 调用,企业和团队可集成其功能用于自动代码审查、智能编程辅助等场景。

    KAT-Coder

    KAT-Coder的主要功能

    • 代码生成:能根据用户的需求描述,快速生成高质量的代码片段或完整的代码解决方案,支持多种编程语言,如 Python、Java、JavaScript 等,极大地提高了开发效率。
    • 代码审查:可以自动检测代码中的潜在缺陷、错误和不规范之处,提供详细的审查报告和改进建议,帮助开发者及时发现和修复问题,提升代码质量。
    • 单测生成:能自动生成单元测试代码,确保代码的正确性和稳定性,减少手动编写测试代码的工作量,提高测试覆盖率。
    • 问题诊断:针对复杂的编程问题,KAT-Coder 可以提供详细的分析和解决方案,帮助开发者快速定位问题根源,节省调试时间。
    • 多轮交互:支持与用户进行多轮对话,更好地理解用户需求,提供更精准的代码生成和问题解答服务,增强用户体验。

    KAT-Coder的技术原理

    • 多阶段训练:采用多阶段训练方法,包括 Mid-Training、监督微调(SFT)、强化微调(RFT)和大规模智能体强化学习(RL)阶段,通过不同阶段的训练,逐步提升模型的性能和泛化能力。
    • 工具使用能力训练:在训练过程中,大量增加工具使用能力的训练,使模型能够更好地理解和使用各种编程工具和资源,提升其在实际编程场景中的应用能力。
    • 多轮交互训练:通过多轮交互训练,让模型学会在多轮对话中更好地理解用户需求,提供更精准的代码生成和问题解答服务,增强与用户的交互体验。
    • 人类工程师指导:在强化微调阶段,引入人类工程师标注的“教师轨迹”作为训练指导,使模型能够学习到更符合人类编程习惯和逻辑的解决方案,提高代码的可读性和可维护性。
    • 大规模强化学习:采用大规模智能体强化学习技术,通过数概率计算的前缀缓存、基于熵的轨迹剪枝等方法,解决扩展智能体强化学习面临的挑战,进一步提升模型的性能和效率。

    KAT-Coder的项目地址

    • 项目官网:https://kwaipilot.github.io/KAT-Coder/

    KAT-Coder的应用场景

    • 自动代码生成:根据用户的需求描述,快速生成高质量的代码片段或完整的代码解决方案,支持多种编程语言,显著提升开发效率。
    • 代码审查与优化:自动检测代码中的潜在缺陷、错误和不规范之处,提供详细的审查报告和改进建议,帮助开发者提升代码质量。
    • 单元测试生成:自动生成单元测试代码,确保代码的正确性和稳定性,减少手动编写测试代码的工作量,提高测试覆盖率。
    • 复杂问题诊断:针对复杂的编程问题,提供详细的分析和解决方案,帮助开发者快速定位问题根源,节省调试时间。
    • 智能编程辅助:在开发过程中,为开发者提供实时的代码补全、函数调用建议、语法检查等智能辅助功能,提升编程体验。
    • 技术面试与学习:用于技术面试的代码题解答,帮助面试官评估候选人;也可作为学习工具,辅助开发者学习新的编程语言或技术。