蚂蚁发布《大模型开源开发全景与趋势》报告

Posted in AI专栏, AI教程.

《大模型开源开发全景与趋势》是蚂蚁集团开源技术委员会推出的报告，基于社区数据洞察大模型开源开发生态的现状和未来趋势。报告通过全景图展示大模型开源项目的分布，从1.0版本到2.0版本，项目数量和领域划分更加精细，反映生态的快速发展。报告分析了技术关键词、活跃项目、许可证变化等，揭示AI Coding、Model Serving等领域的增长态势。报告探讨了项目更替与生态动态，及全球开发者在大模型开发生态中的分布情况，为开发者和企业提供参考，帮助他们把握大模型开源开发的脉络和趋势。

大模型开源开发生态全景

全景图迭代更新
- 1.0版本于2025年上半年发布，收录19个技术领域的135个项目，采用种子项目多跳搜索方式绘制，具有一定随机性。
- 2.0版本于2025年8月发布，采用OpenRank算法直接筛选GitHub项目，收录114个顶尖项目，分布在22个技术领域，标准提高至OpenRank 50。
项目更替与生态动态
- 2.0版本新增39个项目，占35%，多为近期创建且关注度高；移除60个项目，多因活跃度不足或不符合新标准。
- 这些项目吸引全球366,521位开发者，其中美国占24%，中国占18%，显示中美在大模型生态中的主导地位。
全景图的构成与意义：全景图分为AI Infra和AI Agent两大方向，基于OpenRank算法衡量项目影响力，提供科学依据。

从生态全景到技术趋势

大模型开发生态关键词：通过对项目描述和标签的文本分析，提炼出AI、LLM、Agent、Data等高频关键词，得到一张词云图，反映大模型生态的核心技术方向。
活跃项目分析：
- OpenRank前10的项目覆盖模型生态完整链路，Python主导基础设施，TypeScript统治应用层。
- 部分项目采用非传统开源许可证，保护商业利益，导致“开源”定义愈发模糊。
技术领域发展趋势：AI Coding、Model Serving和LLMOps增长明显，Agent Framework和AI Data领域则呈现下降趋势。
边缘地带的项目：文章关注一些未进入全景图但有潜力的开源项目。

大模型生态下全球开发者分布画像

在全球大模型开发生态中，开发者分布显示美国和中国占据主导地位，分别占比24%和18%，表明两国在大模型技术领域具有显著的影响力和活跃度。欧洲国家如德国、印度等有较高参与度，与中美相比仍有差距，整体呈现出以中美为主、多国参与的全球开发者分布格局。

从1.0到2.0，100天中的变与不变

整体生态结构和领域的调整：从1.0到2.0，生态结构和领域划分更加精细，新增“AI Infra”、“AI Agent”和“AI Data”等具体分类。
出局的项目：一些曾经热门的项目如Manus、NextChat等因维护不足或被替代逐渐退出视野。
昔日巨星TensorFlow的十年消亡之路：TensorFlow自2015年开源后，因缺乏向后兼容性和复杂迁移工具，逐渐被PyTorch超越，走向衰落。
新进的项目：新领域如AI Coding和具身智能相关项目涌现，Infra领域整合为LLMOps，覆盖模型全生命周期运维。
新进项目中的最活跃开源项目Top 10：新进项目中，Gemini CLI和Cherry Studio等表现出色，位列活跃项目前10。
全景图上的“Up and Down”：从2月到8月，TensorRT-LLM、Dynamo等项目OpenRank增长明显，LangChain、Codex等项目下降明显。

专题洞察

Model Serving（模型服务）：模型服务连接AI基础设施与应用层，vLLM、SGLang等项目提升推理性能，Ollama等推动本地部署，NVIDIA Dynamo扩展集群推理。
AI Coding（AI编程）：AI Coding从单一代码补全发展到多模态支持，Gemini CLI、OpenCode等工具提升开发效率，商业化潜力巨大。
AI Agent（AI代理）：2025年AI应用落地，LangChain等框架后继乏力，Mem0、Dify等新项目聚焦不同环节，推动Agent系统发展。

番外篇：大模型生态全景

梳理2025年1月至今国内外主流厂商的大模型发布时间线，详细标注每个模型的参数、模态等关键信息，直观展现当下大模型领域的竞争态势。通过分析，文章指出中国开源大模型呈现百花齐放的局面，国外顶尖模型厂商多走闭源路线，强调模型参数规模化、强化学习提升推理能力、多模态模型走向主流等技术趋势。