实测Kimi-Researcher,7个案例看懂Agent能干什么

最近,Kimi 推出基于端到端自主强化学习技术的 Kimi-Researcher(深度研究)Agent 模型并开启内测。

第一时间申请到了内测资格,深度体验下来,发现Kimi不管是日常生活决策,还是专业领域研究,它都能给你梳理的明明白白。

只需要一句话,它就会自动阅读资料,拆解复杂问题,主动提出研究路径、分解任务、追踪信息,最后输出内容丰富、来源精确的万字报告,还会整理成重点清晰、方便阅读的可视化页面。

今天就跟大家分享一下,Kimi推出的深度搜索到底能做什么?以及,Kimi-Researcher是如何做到SOTA的。

 

01. 实测体验

 

有内测资格的友友可以在对话框看到深度研究按钮,我们输入需求,选择这里的深度研究,就可以使用该功能。

我选择了7个不同方向的需求来测试他的深度研究功能。

case 1:辅助复杂购买决策

小米YU7马上就要开发布会了,我想提前了解一些关于这个车型的知识,于是我告诉Kimi:

提示词:小米YU7。

Kimi会引导我提出更具体的需求并列出了几个方向供我选择:小米YU7的上市价格、具体配置、技术亮点和市场竞争情况等等。

这几个点也确实是我比较想了解的方向,于是我们可以直接让它做个全面的深度研究:

这时候,它会去自主搜索、梳理YU7相关的信息,整个过程大概花了二三十分钟,这期间你可以完全不用管它。

最终,它会把得到的信息整理成一篇详细的深度研究报告和一份可视化报告。

我们先一起看看深度研究报告,全篇9600+字,一百多处引用,内容全面又详细,重点数据都可以看到清晰的信息源。

前面提到的几个要点,它都完整的展示出来了,并且在内容中,标明了出处。选择的信息源也都是像汽车之家、小米汽车、车家号这样在专业领域比较权威的网站。

相比于文字化报告,可视化报告更直观,可以看到更多的数据对比,方便我们快速了解重点。

打开链接查看完成报告: https://www.kimi.com/share/d1eiapsjc3f16p1sumsg

case 2:规划/优化旅行行程

提示词:我想从北京去瑞士旅行,帮我规划一个一周的行程,预算5万,尽量把热门景点都囊括。

同样的,它给我生成了一份瑞士一周深度游的行程规划与预算指南,还有一份可视化报告。

在深度游行程规划与预算指南中,交通、景点、住宿、美食都有很详细的介绍。

在可视化报告中,各项信息都一目了然。

如果不想看太多文字,直接看可视化报告就能了解到全部内容。

打开链接查看完整报告:https://www.kimi.com/share/d1eie8mmcu0nio8n7t40

case 3:金融投资分析/市场研究

提示词:中国游戏出海现状及趋势。

深度研究报告:

可视化报告:

打开链接查看完整报告: https://www.kimi.com/share/d1eiapsjc3f16p1sumsg

case 4:科学研究与文献综述

提示词:查询与茶与咖啡哪个提神效果更好的相关文献。

除了一些官方媒体,我注意到它的内容中引用了比较多的知乎专栏内容。

如果在学术相关研究时,数据库能与Kimi的学术搜索数据库打通就更好啦。

深度研究报告:

可视化报告:

打开链接查看完整报告:https://www.kimi.com/share/d1eid6jof8jlmi2au4lg

case 5: 政策分析与解读

提示词:公积金利率下调,购房者能省多少

深度研究报告:

可视化报告:

打开链接查看完整报告:https://www.kimi.com/share/d1eid0kjc3f16p1t9sjg

case 6: 深度信息检索与分析

提示词:分析月之暗面这个公司的市场竞争力

深度研究报告:

可视化报告:

打开链接查看完整报告:https://www.kimi.com/share/d1eidcn37oq3d4ubqqi0

case 7:专业级研究报告生成

提示词:对AI大模型领域的最新进展进行综述。

深度研究报告:

可视化报告:

打开链接查看完整报告:https://www.kimi.com/share/d1eidh8osk9hkuhggi20

这个可视化报告是Kimi-Researcher的一大亮点,各种图表和数据都很清晰的展现出来,一眼就能看出来它到底在说什么。

这一切,不需要你开几十个标签页、来回切换资料——你只是说出需求,它就能跑完研究链条。

如果能够提供下载就更好了~

 

02. Kimi-Researcher的优势

 

通过上面的几个案例,我们可以很清楚的认识到Kimi-Researcher 的信息搜集能力真的很不错。而且对于搜集到的信息再加工的能力也是数一数二的。

在人类最后一次考试(Humanity’s Last Exam, HLE)和红杉中国发布的 xbench 基准测试等测试中都取得了很好的成绩。是目前此类模型的第一梯队。

它背后核心能力可以分为三个层面:

  • 主动搜索(WebAgent能力)

它会主动使用浏览器搜索相关内容,再自己判断哪些内容是有用的。

  • 多文档总结(超长上下文)

一次研究,可能涉及十几篇甚至上百篇资料,几万字内容。Kimi 的百万 Token 上下文能力,让它总结多篇文章也毫不费力。

  • 问题拆解(多步推理)

针对复杂问题,它会主动分解为多个子问题,分别去查、分析、总结,再合成结论。这样出来的成果更为细致。

传统 Agent 需要人写好流程; 而Kimi-Researcher 是完全基于Kimi自研的K系列模型,通过端到端 Agentic RL 后训练而成,在解决用户需求的每一步时,都会根据环境的实时反馈不断进行自我调整。

 

03. 一些分享

 

作为一名长期写作、调研、做内容的自媒体人,我对 Kimi-Researcher 的评价是:

“这是我真正想要的 Agent 模式。”

AI不再仅仅是一个聊天对象,而是真正开始像人一样“替你干活”了。

过去半年,大家都在讨论 Agent,但多数还停留在概念验证(PoC)或开发工具阶段。

Kimi-Researcher的发布,标志着:To C层的Agent产品正式上线。跑通了“目标→路径→执行→输出”的完整闭环。

这不是一个“demo”,而是能立即用起来、产生价值的生产力工具。

可以预见,接下来会有越来越多的领域(金融分析、法律综述、医学研究)开始出现类似的“ Researcher 类 Agent ”。

原文链接:实测Kimi-Researcher,这是我真正想要的 Agent !