《大模型开源开发全景与趋势》是蚂蚁集团开源技术委员会推出的报告,基于社区数据洞察大模型开源开发生态的现状和未来趋势。报告通过全景图展示大模型开源项目的分布,从1.0版本到2.0版本,项目数量和领域划分更加精细,反映生态的快速发展。报告分析了技术关键词、活跃项目、许可证变化等,揭示AI Coding、Model Serving等领域的增长态势。报告探讨了项目更替与生态动态,及全球开发者在大模型开发生态中的分布情况,为开发者和企业提供参考,帮助他们把握大模型开源开发的脉络和趋势。

大模型开源开发生态全景
- 全景图迭代更新
-
1.0版本于2025年上半年发布,收录19个技术领域的135个项目,采用种子项目多跳搜索方式绘制,具有一定随机性。
-
2.0版本于2025年8月发布,采用OpenRank算法直接筛选GitHub项目,收录114个顶尖项目,分布在22个技术领域,标准提高至OpenRank 50。
-
- 项目更替与生态动态
-
2.0版本新增39个项目,占35%,多为近期创建且关注度高;移除60个项目,多因活跃度不足或不符合新标准。
-
这些项目吸引全球366,521位开发者,其中美国占24%,中国占18%,显示中美在大模型生态中的主导地位。
-
- 全景图的构成与意义:全景图分为AI Infra和AI Agent两大方向,基于OpenRank算法衡量项目影响力,提供科学依据。
从生态全景到技术趋势
- 大模型开发生态关键词:通过对项目描述和标签的文本分析,提炼出AI、LLM、Agent、Data等高频关键词,得到一张词云图,反映大模型生态的核心技术方向。
- 活跃项目分析:
- OpenRank前10的项目覆盖模型生态完整链路,Python主导基础设施,TypeScript统治应用层。
- 部分项目采用非传统开源许可证,保护商业利益,导致“开源”定义愈发模糊。
- 技术领域发展趋势:AI Coding、Model Serving和LLMOps增长明显,Agent Framework和AI Data领域则呈现下降趋势。
- 边缘地带的项目:文章关注一些未进入全景图但有潜力的开源项目。
大模型生态下全球开发者分布画像
在全球大模型开发生态中,开发者分布显示美国和中国占据主导地位,分别占比24%和18%,表明两国在大模型技术领域具有显著的影响力和活跃度。欧洲国家如德国、印度等有较高参与度,与中美相比仍有差距,整体呈现出以中美为主、多国参与的全球开发者分布格局。

从1.0到2.0,100天中的变与不变
- 整体生态结构和领域的调整:从1.0到2.0,生态结构和领域划分更加精细,新增“AI Infra”、“AI Agent”和“AI Data”等具体分类。
- 出局的项目:一些曾经热门的项目如Manus、NextChat等因维护不足或被替代逐渐退出视野。
- 昔日巨星TensorFlow的十年消亡之路:TensorFlow自2015年开源后,因缺乏向后兼容性和复杂迁移工具,逐渐被PyTorch超越,走向衰落。
- 新进的项目:新领域如AI Coding和具身智能相关项目涌现,Infra领域整合为LLMOps,覆盖模型全生命周期运维。
- 新进项目中的最活跃开源项目Top 10:新进项目中,Gemini CLI和Cherry Studio等表现出色,位列活跃项目前10。
- 全景图上的“Up and Down”:从2月到8月,TensorRT-LLM、Dynamo等项目OpenRank增长明显,LangChain、Codex等项目下降明显。
专题洞察
- Model Serving(模型服务):模型服务连接AI基础设施与应用层,vLLM、SGLang等项目提升推理性能,Ollama等推动本地部署,NVIDIA Dynamo扩展集群推理。
- AI Coding(AI编程):AI Coding从单一代码补全发展到多模态支持,Gemini CLI、OpenCode等工具提升开发效率,商业化潜力巨大。
- AI Agent(AI代理):2025年AI应用落地,LangChain等框架后继乏力,Mem0、Dify等新项目聚焦不同环节,推动Agent系统发展。
番外篇:大模型生态全景
梳理2025年1月至今国内外主流厂商的大模型发布时间线,详细标注每个模型的参数、模态等关键信息,直观展现当下大模型领域的竞争态势。通过分析,文章指出中国开源大模型呈现百花齐放的局面,国外顶尖模型厂商多走闭源路线,强调模型参数规模化、强化学习提升推理能力、多模态模型走向主流等技术趋势。
