Category: AI教程

如何用DeepSeek生成课堂互动小游戏，一键制作英语单词卡片
前天凌晨，DeepSeek V3模型升级了一波，版本号到了DeepSeek-V3-0324。

最新模型的测评结果显示，新版本的V3模型有更强的编程与技术能力，前端代码生成质量接近行业标杆Claude 3.7水平。

有很多朋友都在疑问，现在AI这么强了，为什么我找不到一个合适的使用场景。

没关系，我找到了自然会分享给大家~

最近看到一个特别有意思的AI用法，用DeepSeek辅助学习：

这个像消消乐一样的小游戏，我们通过点击屏幕将单词和其对应的中文意思匹配、消除，在这样的记忆过程中可以获得即时反馈，学习的趣味性大大增强！

这样的小游戏用DeepSeek一句话就能生成，而且还可以拓展超多使用方向。

接下来，我们一起试试DeepSeek在学习场景中的实际应用。掌握这些技巧，让你的学习效率提升百倍！

01

小试牛刀

做一个游戏自己玩

比如，我们想做一个闪记卡片，帮助我们背单词。此时我们就要找一个能编程的大模型。比较适合的就是刚更新的DeepSeek-V3-0324。

接入平台我选择的是问小白，它的RAG交叉验证和DeepSeek配合的相当不错，响应速度非常快。

我们首先做一个闪记卡片程序，把要背的单词通过图片形式上传，然后输入提示词：
- 识别图中的单词，同时给出每个词的释义和例句，然后帮我生成单词Flash Card的互动页面，辅助单词记忆。
- 1.界面要求精美直观，单词卡片可以3D翻转，卡片下面有一个随机切换下一次的按钮。
- 2.每次点击”随机下一个”按钮时，卡片会直接显示正面。
- 3.交换按钮要能正常使用，布局合理，不要有重叠重合。
- 4.所有单词都要包含其中，一次生成完，不可省略。
DeepSeek V3的回答没有推理过程，发送需求后，问小白几乎是1秒响应，就开始库库干活，不到1分钟就生成了一套代码，不得不说真的太效率了！

在回答的最后，附上了这段代码的功能和使用方法的说明。

我们按照它的提示，新建一个文本文档。点击代码框右上角的复制按钮，把整段代码粘贴进文本文档保存，把文件名后缀“.txt”修改为“.html”。

双击文件，就可以在浏览器中打开这个程序。

在这个界面能直接互动，辅助单词记忆。

不得不说，问小白接入的DeepSeek-V3-0324太聪明了，一下就能理解我的全部需求，生成页面看起来又简洁又美观，使用起来也很流畅，太牛了！

更让我惊喜的是，它的长上下文记忆已经扩展到了128K，我每次提出需求时，它都会参考之前的内容再回答我当前的问题。

比如，我们继续指令它：
- 根据以上单词，生成【你正在复习考试/四级】级别的英语单词4选1中短句填空题，并且输出成可通过点选交互的HTML格式，供用户复习测试使用。
- 1.每道题的正确答案不一定是我们给出的单词，能强化单词记忆即可。
- 2.HTML界面UI设计要有鲜明的色块和交互设计感。
- 3.把答案和解析放到每道题目卡片的翻转页，完成答题后，有单独的Check Answer键触发翻转页面，并用中文给我每道题的解析。
- 4.每道题的4个选项显示在题目下方。
我们打开它生成的单词测试题界面。做完每道题就能立即检查答案，解析就在题目卡片的下方，非常贴心。

我们继续给它上点难度：
- 给以上背单词程序增加夜间模式切换按钮，并重新输出一个完整的html程序，保证功能都能正常使用
我们可以通过按钮，随时切换页面的模式，让我们在学习时，眼部更舒适。

我们也可以让AI给我们的学习效果进行点评并给出建议：
- 做完一整套题后，给到我们评分跟学习建议。
经过以上这些步骤，我们就学会了从零搭建一个定制化的背单词程序，是不是很简单？

02

专业搜索

问小白技术不简单

上面这些便利只是针对于成年人的自学，我知道有很多家长有时候面对自己家里的孩子不会的题时也会非常头疼，这个问题问小白也能简单解决。

比如，我们给它输入一道高中英语题，它不仅仅是给出答案，也会给出具体的解题思路。

有了问小白，即使遇到不擅长的内容，我们也能轻松给孩子做辅导。
我们可以让问小白根据孩子的学习进度，做学习规划。比如，输入：
- 系统讲解高分英语四级作文的结构，并提供一些常见高分句型和模板。此外，给我几个热门英语四级写作题目，并附上详细的范文解析
我们可以打开问小白的联网搜索，选择专业搜索。

问小白直接整理100+篇网页内容，结合多模态、多领域的高质量知识库内容，给出的回答又快又有深度。

在Chinese SimpleQA评测中，问小白 DeepSeek R1 以91.60%的F-score 成绩显著领先，一度成为中文RAG技术标杆。

Chinese SimpleQA评测结果

03

互动课程

问小白V3也可以

问小白也能帮我们开发一些课堂的新玩法，比如，在课堂上设计一个小游戏，提升学生与知识的互动性。

我们可以在问小白中输入以下提示词：
- 请设计一个游戏，标题为Word Challenge，标题摆放在屏幕最上方居中的位置，页面背景颜色清新自然。屏幕平均分为左右两个界面，左边背景是淡黄色，右边则是淡绿色，左边界面中显示9个单词，左边界面中显示分别显示这9个单词的中文意思，顺序打乱但不重复，左右两边界面里的内容都整齐均匀地排列。设计一个start按钮，start按钮在页面下方。点击start按钮之后游戏开始。单词的列表为：China、teacher、student、boy、girl、women、man、long、fat
- 1.界面要求精美直观，布局合理，不要有重叠重合。
- 2.点击左边的单词后，再点击右边对应的中文释义，配对成功它们就会消失。
- 3.整个环节设置得分机制，单词和释义配对成功可以加一分，反之不得分也不扣分。
- 4.在一次配对错误后游戏结束，显示本次总得分。
在它输出内容之后，我们就得到了最开始的消消乐小游戏。而且它不仅做到了游戏界面的优化，还加入了很多动态的效果，让整个小游戏看起来简洁又美观。

04

小白研报

问小白内测深度研究

最近，我发现问小白有一个Pro版本的联网搜索功能正在搞内测。

在小白研报模式中，大模型会根据我们的需求，搜集、整理大量的专业资料，直接输出成一个可视化页面。

不仅有专业输出能力，这个可视化网页的布局更是能帮你一眼厘清重点。

几个场景用下来，真的实实在在感受到问小白最一流的大模型和最一流的专业搜索能力的强大。

更绝的是，这么顶级的配置，所有人都能完全免费、不限量使用。

如果你也在学习中遇到了问题，快去试试问小白吧。

问小白官网：问小白

本文实例参考：

单词闪卡和测试题：https://www.wenxiaobai.com/share/chat/6cdc29ff-44ef-4453-8903-a90416ba9be6

学习规划：https://www.wenxiaobai.com/share/chat/d4802c02-e398-4f65-ad87-cd4012f6790c

Word Challenge小游戏：https://www.wenxiaobai.com/share/chat/1fa44062-5d72-4c84-8933-b2a860c8f55e

原文链接：DeepSeek-V3更新炸场，我连夜做了3个互动小游戏
March 27, 2025
清华大学《DeepSeek政务应用场景与解决方案最新版》（PDF文件）- AI教程资料
《DeepSeek政务应用场景与解决方案最新版》是清华大学新闻与传播学院新媒体研究中心和人工智能学院推出的针对政务数字化转型的全面方案，基于AI技术提升政务服务的智能化水平。方案涵盖政务数字化转型的三个阶段：电子政务、互联网+政务、AI+政务，每个阶段有特定的核心任务和目标。在电子政务阶段，重点在于基于IT化实现政务流程的初步数字化；互联网+政务阶段用平台化为突破，推动跨部门协同与在线服务整合；AI+政务阶段用智能化为标志，基于AI驱动决策与服务的深度变革。基于公文自动拟制、合同协议智能审查、行政执法智能辅助、就业指导智能推荐等具体解决方案，DeepSeek能显著提升政务工作的效率和质量，实现政务服务的智能化、精准化和便捷化。

获取《DeepSeek政务应用场景与解决方案最新版》 PDF原文件，扫码关注回复： 20250326

人工智能+政务应用场景
- AI应用到政务工作的四大方向：智能政务办公、智能城市治理、智能民生服务、智能辅助决策。
- 公文处理：基于垂直领域知识增强、多模态智能处理、全参数本地化部署和分布式政务协同，实现深度训练和全链驱动，提升公文处理的智能化水平和安全性。
- 行政审批：基于政策知识检索、命名实体生成、全流程优化引擎和案例推理模型，实现精准识别和极速通办，提升行政效率和服务质量。
- 司法行政：基于法律文书智能分类、法律知识图谱检索、全域司法智能协同平台和司法决策辅助生成，实现司法行政全流程数字化升级和智能化推演
- 城市治理：基于多模态数据融合分析、联邦学习与动态博弈模型、图神经网络、智能协同决策系统，实现数据护城和纳什均衡的目标。
- 便民服务：基于云链融合和语义穿透，覆盖出生、教育、养老三大阶段，提供一站式便捷服务。
- 数据安全：基于分层架构和智能隔离实现数据安全。
DeepSeek+政务解决方案
- 技术方案：概述技术方案，包括混合部署方案、本地知识库、模型微调等，展示技术在政务中的应用。
- 本地部署的必要性：讨论本地部署的必要性，包括数据主权、个性化需求、独立运行、资源效率和自主控制等方面。
- 本地部署架构图：提供本地部署的架构图，展示系统的整体结构和各部分的功能。
- 解决方案一：公文写作。介绍公文写作的解决方案，包括公文自动拟制、合规审查、信息摘要和格式规范。
- 解决方案二：合同协议智能审查。描述合同协议智能审查的解决方案，包括合同上传与解析、智能审查流程、审查报告生成和数据管理。
- 解决方案三：行政执法。介绍行政执法的解决方案，包括一线执法人员面临的困境、AI智能体的核心价值和应用场景。
- 解决方案四：就业指导。描述就业指导的解决方案，包括人社部门就业指导的困境、AI的核心价值和应用场景。
- 风险及对策：讨论在实施过程中可能遇到的风险及其对策，包括伦理法律风险、数据安全风险和可信度风险。
- 落地大四步法：包括规划期、建设期、验证期和扩展期，展示项目的实施步骤。
人工智能+政务未来发展
- 职业替代：探讨职业替代的逻辑，分析AI能力范围内外的职业发展情况。
- AIGC与空间智能：介绍AIGC与空间智能的关系，展示其在三维空间和时间中的应用。
- 空间智能：展示空间智能的应用场景，包括线上政务元宇宙VR大厅。
- AIGC与具身智能：探讨AIGC与具身智能的关系，展示其在物体感知和交互中的应用。
- 人形机器人：展示人形机器人的应用场景，包括政务机器人。
- 人机共生：介绍人机共生在复杂任务中的自动化工作流，展示AIGC技术与自动化流程的结合。
获取《DeepSeek政务应用场景与解决方案最新版》 PDF原文件，扫码关注回复： 20250326
March 27, 2025
清华大学《文科生零基础AI编程》（PDF文件） – AI教程资料
《文科生零基础AI编程》是清华大学新闻学院人工智能学院推出的，介绍如何帮助文科生快速掌握AI编程技能，提升在数字化时代的竞争力。课程强调文科生用AI技术快速提升编程能力和想象力，无需深入学习复杂的代码语法，只需用自然语言描述需求。基于具体案例，展示如何利用DeepSeek进行数据处理、文本生成、图表绘制等任务，帮助文科生更好地理解和运用AI技术。分析AI生成数据的质量、应用场景和伦理法律问题，强调AI生成数据在科学研究中的潜力和挑战，引导文科生在使用AI时注意数据质量和伦理问题。

获取《文科生零基础AI编程》 PDF原文件，扫码关注回复： 20250325
- 文科生的AI编程新思维
  
  人机优生、人机快生：介绍文科生如何基于AI进行编程，打破传统编程思维，实现人机优生和人机快生。
  
  破除迷思与核心心法：四个步骤讲解如何破除AI编程中的迷思，掌握核心心法。
- AI重构编程范式：介绍AI如何重构编程范式，包括编程范式的演变和AI在编程中的应用。
  
  实操前的准备：用PyCharm作为本地代码编译器。
  
  实操前的准备：安装Python解释器和相关库。
  
  Python数据分析和绘图常用库示例 ：列举Python中用在数据分析和绘图的常用库，提供具体示例。
  
  总结诸葛亮的辩论词语：基于DeepSeek生成文本，保存到本地。
- DeepSeek给出运行流程：提供详细的运行步骤和代码示例。
  
  DeepSeek生成的代码：展示DeepSeek生成的代码示例。
  
  把诸葛亮的语言可视化：用图表展示诸葛亮语言的词频分析。
- 文生数据
  
  社会数据和AI生成数据：介绍社会数据和AI生成数据的来源、特性和应用。
  
  AI幻觉及其基本特征：讨论AI幻觉问题，特别是多数据集问题加载时的表现和特征。
  
  AI幻觉问题提取：进一步探讨AI幻觉问题在多数据集问题加载时的表现。
  
  逆向满足理论：探讨逆向满足理论在AI应用中的表现，包括理论形式化、计算满足和提升效果。
  
  从零开始做一个数据模拟实验：内容介绍如何从零开始进行数据模拟实验，包括爆火的斯坦福AI小镇。
- 智能体的定义：介绍智能体的三大系统（感知系统、决策系统、学习系统）。
  
  智能体的7层核心架构：介绍智能体的7层核心架构及其功能。
  
  虚假信息引入下的信念演变：研究虚假信息对信念演变的影响。
- 后续想法：介绍代理仿真模拟实验的流程和效果。
  
  创新的思路：介绍如何基于保留表头和限定生成提高文本生成的质量。
  
  微博和AI话题集关键词Top20：分析微博和AI话题集中的关键词Top20，了解当前AI领域的热点话题。
  
  数据和AI话题集关键词Top20：分析数据和AI话题集中的关键词Top20，掌握数据科学与AI研究的最新动态。
  
  代码进行时间序列分析 ：基于可视化图表展示分析结果，帮助理解代码性能与优化方向。
- 文生图表：
  
  从方法开始、从图片可视化开始 ：介绍如何从方法和图片可视化开始进行数据分析。
  
  DeepSeek 应用场景：介绍DeepSeek的应用场景。
  
  数据可视化：基于分析结果自动生成多种类型的可视化图表，清晰展示数据中的关系和模式。
  
  社科的同学非常熟悉的问卷表格：展示如何用AI技术处理和分析社科领域常见的问卷数据。
- 不仅仅是相关分析，还可以建模：如何利用AI进行更深入的数据分析。用AI分析舆情事件步骤，包括数据收集、处理、分析和结果解释等。
  
  知识图谱的AI辅助构建：如何用AI辅助构建知识图谱。如何使用wiki自动识别和构建知识图谱。根据文本中的依存关系构建舆论图谱，分析文本中的情感倾向和主题结构。
- 文生网站：
  
  理论框架：基于黑箱化封装API功能模块、组件化多智能体模拟和便捷交互设计，实现高效、易用的网站功能和用户体验。
  
  DeepSeek 实现路径：基于创建智能体和定义交互规则，及生成包含必要元素和数据来源的交互原型，实现智能体平台搭建和交互设计。
  
  DeepSeek+在线编译：如何用DeepSeek和在线编译创建美食网站。
获取《文科生零基础AI编程》 PDF原文件，扫码关注回复： 20250325
March 26, 2025
清华大学《使用DeepSeek赋能家庭教育》（PDF文件） – AI教程资料
《使用DeepSeek赋能家庭教育》是清华大学新闻与传播学院新媒体研究中心推出的，基于DeepSeek AI工具为家庭教育提供智能化的支持和辅助。DeepSeek基于强大的数据分析和处理能力，根据孩子的学习情况和需求，提供个性化的学习建议和资源。帮助家长更好地理解孩子的学习进度和困难点，制定更有效的教育计划。从基础知识的巩固到复杂问题的解决，提供相应的支持。家长能更科学地参与到孩子的学习过程中，提高学习效率，增强家庭教育的质量和深度。智能化的教育方式，让家庭教育更加灵活和高效，有助于培养孩子的批判性思维、创造力和解决问题的能力，为未来发展打下坚实的基础。

获取《使用DeepSeek赋能家庭教育》 PDF原文件，扫码关注回复： 20250324
- DeepSeek工具介绍与使用指南
  
  介绍DeepSeek在不同平台的使用方式和入口。对比DeepSeek的三种模式：基础模型、深度思考模型和联网模型。
- 家庭教育与学习辅助
  
  如何用DeepSeek提升家庭教育效果。如何让AI成为孩子的学习“超级助手”。
- 学习策略与方法
  
  基础聊法原则：介绍与AI互动的基本原则。
  
  聊法互动策略：提供递进式对话策略、多元反馈策略和兴趣激发策略。
  
  场景化聊法模版：提供不同场景下的聊法模板。
  
  探究式学习词法框架：介绍如何基于角色扮演、引导思考和互动帮助孩子进行探究式学习。
  
  故事化学习词法框架：介绍如何基于故事设置、语言风格和延伸活动帮助孩子进行故事化学习。
  
  多感官技能培养词法框架：介绍如何用结构化学习、视听元素和适应性提示培养孩子的多感官技能。
- 学科学习支持
  
  语文、数学、英语、科学学习：介绍如何用DeepSeek辅助孩子的各科学习。
  
  学科成绩分析：介绍如何用DeepSeek分析学科成绩。
  
  定制化学习：介绍如何进行定制化学习。
- 情感教育与心理健康
  
  借助DeepSeek在情感教育中帮助家长，引导孩子的情绪管理与沟通技巧。
- 安全与伦理
  
  如何守护孩子的安全防线。讨论DeepSeek伦理问题频发时，家长如何为孩子筑牢防线。
- 职业规划与未来技能
  
  DeepSeek如何影响职业规划。基于DeepSeek培养孩子的未来技能。
- AI教育工具的应用
  
  不同类型的AI教育工具及应用场景和建议。推荐、介绍如何使用创意启发型AI工具。
- 实操案例与应用拓展
  
  批改作文：提供DeepSeek批改作文的实操案例。
  
  克服学习障碍：介绍如何克服学习障碍。
  
  分析量化数据：介绍如何分析量化数据优化学习计划。
  
  解决复杂问题：介绍如何帮助孩子解决复杂问题。
  
  应用范式拓展：介绍如何用DeepSeek与其他工具结合拓展家庭教育应用。
- 如何赋能育儿全阶段
  
  婴幼儿阶段（0-3岁）：关注身体、感官、语言和情感的发展。
  
  学龄前阶段（4-6岁）：培养自我意识和社会规则认知，改善语言技能和社交技巧。
  
  小学阶段（7-12岁）：处理结伴关系和社交焦虑，支持同伴关系和心理健康。
  
  中学阶段（13-15岁）：完善自我道德与社会身份建构。
  
  高中阶段（16-18岁）：应对未来规划的不确定性和心理压力，引导道德和伦理认知。
- DeepSeek+：AI赋能家庭教育应用范式拓展
  - DeepSeek + Kimi/WPSAI ：生成教育课件、教学演示。
  - DeepSeek + XMind：学习笔记整理、知识点梳理。
  - DeepSeek + 剪映/可灵AI：科学实验过程记录与解说、家庭学习成果展示。
  - DeepSeek + 豆包爱学：数理辅导、学习计划制定、亲子互动问答。
获取《使用DeepSeek赋能家庭教育》 PDF原文件，扫码关注回复： 20250324
March 26, 2025
古人“回答我”视频爆火，如何用AI制作古人复活视频？
最近，古人“回答我”的视频霸屏了，上午李时珍、下午孙思邈、晚上扁鹊、夜里张仲景轮番登场，每一个又好玩又有梗，流量还特别高！

甚至连人民网都加入了这波热潮。

祖冲之一句句“回答我”直击人心，在整个视频中，通过简短的话语和极具表现力的画面，能有效得表达视频作者想表达的观点。

特别是那句“look in my eyes”，刷到十几条二创视频后，脑子里已经全都是这个声音了。

还有人根据这个玩法快速起号，比如我刷到的这个博主，十多条视频就收获了24.6w赞，一下就起号成功啦。

这类视频做起来并不难，总共需要6步：

1.仿写文案

2.生成人物图像

3.生成人物视频

4.制作音频

5.对口型

6.剪辑

下面是我做的实例：

01

DeepSeek仿写文案

这段视频的原型出自于一名叫“小明剑魔”的游戏博主，原视频情绪感染力超强，我们也是在这个基础上进行二创。

我们将创作需求发给DeepSeek，让AI帮我们生成一个篇幅差不多的文案。这里我们以张仲景为例，输入提示词：
- 帮我生成一个现在网络小明剑魔“回答我”视频的文案模板，并用这个模板套用在张仲景的角度上，要有吐槽和梗。篇幅和原视频差不多。
得到的文案内容是这样的：
- 子时不睡，午时不起，头发塞住下水道，痘痘多过癞疙宝，知道我为什么要“夜卧服”吗？说话！白天喝冰翠菊花茶降火，晚上涮变态辣火锅升阳，搁这玩阴阳动态平衡？《伤寒论》第360条写“寒热往来必伤中”是摆设吗？回答我！舌苔黄白相间，都能画八卦图了，看不见吗？嗯，回答我，Look in my eyes，tell me why，why？baby，why？最绝的是维生素泡腾片配威士忌，当归、黄芪炖奶茶，这波寒热对冲操作，华佗的麻沸散都麻不过你！说话！再敢用八段锦当睡前拉伸，信不信本医圣当场表演“桂枝汤泼醒作死青年”？
我们只需要把提示词中的人名替换为想要的角色和吐槽的主体，就可以用AI批量生成文案。

02

即梦创作古人图片

打开即梦，选择图片生成。

输入提示词：
- 水墨风，张仲景半身照，正面特写
点击DeepSeek-R1，让DeepSeek帮我们完善提示词。

在生成的提示词中，选择一个合适的，点击立即生成。

这里我们保存第二张图像。（人物是正脸且五官比较清晰）

用同样的方法，我们再画一张水墨风的背景图。

03

Viggle制作视频

这里我们需要先下载“小明剑魔”的原视频。

打开Viggle网页版。

上传“小明剑魔”的原视频和我们画的人物画像。

选择绿幕背景，然后点击生成。

初次生成的视频，如果感觉有一些重影，可以点击背景增强，再生成一次，得到的视频效果就可以啦。

点击视频右上角的下载，将视频保存备用。

04

Minimax Audio制作音频

语音部分，我们保留原音频中的“回答我”、“look in my eyes”这些情绪比较突出的部分。

其他文案有改动的部分，我们用Minimax Audio克隆音色，重新生成一下。

把原视频导入剪映，选择仅导出音频。

打开Minimax Audio，在声音栏，选择创建新的声音。

上传我们刚才分离出来的音频。

输入声音的命名，语言选择为中文（普通话），勾选确认下方的服务条款，点击转换。

在语音合成页面，输入文案。

在右方的设置中，选择刚才创建的新声音（小明剑魔），情感模式默认自动即可，速度可以调整到1.1-1.3倍，听起来更自然一些。

点击生成，就可以试听和下载新生成的语音啦。

如果对试听的效果不太满意，可以再次点击生成，每次生成的语音会有随机的调整，可以选择合适的版本下载。

05

即梦对口型

打开即梦数字人中的对口型页面。上传我们刚才生成的视频和音频。

我们音频中用到原声的部分就不需要再次对口型啦，可以在剪映里只截取需要对口型的部分导进来。

06

剪映剪辑

单击选中视频画面。

选择画面-抠像中的色度抠图，用取色器吸取画面中绿幕的颜色。

调整抠图的参数，把绿幕部分完全抠除，露出背景。

加上字幕，就可以导出成片啦~

按照这个步骤，小白也能做出很有新意的视频，不需要费太多功夫，只需要有个好点的创意就行。

如果你也想入局自媒体，不妨就从这条视频开始。

也许下一条爆款视频，就从你手里诞生！

本文涉及的所有工具：

DeepSeek：https://ai-bot.cn/sites/6130.html

即梦：https://ai-bot.cn/sites/17772.html

Viggle：https://ai-bot.cn/sites/11148.html

MiniMax Audio：https://ai-bot.cn/minimax-audio/

剪映：https://ai-bot.cn/app/10296.html

原文链接：古人“回答我”视频爆火！6步学会用AI复活古人（附教程）
March 20, 2025
如何用AI总结播客音频内容，比听快10倍！
今天朋友给我分享了一期超棒的播客，明浩老师深度解读AI Agent、Manus的实现逻辑和使用案例。

我满心欢喜准备听，可一看时长居然有一个多小时。

我平时时间比较碎片化，根本没办法一两个小时啥也不干专心听播客，这样的方式对我来说效率太低了。

要是能有AI工具帮忙，把播客内容快速整理成要点，我就能利用碎片化时间，随时了解播客的精华部分，那可就方便多了。

没想到真让我找到了免费又高效的听播客神器，今天我们一起体验一下，如何用AI辅助高效听播客~

01

用AI一分钟了解Manus

今天播客的主题是：“Manus没有秘密”。

获取《Manus没有秘密》PDF原文件，扫码关注回复： 20250314

这条播客详细介绍了AI Agent的发展历程、Agent的定义，Manus的原理、使用体验以及明浩老师的个人暴论输出。

明浩老师70多分钟的干货分享，我们用AI一分钟就梳理好，总结了全篇精华。

Manus播客内容摘要

引言

你好，我是明浩。今天这期播客，我们来聊聊Manus。最近AI行业都在谈论Manus，作为业界观察者，我对这个话题也有了更深的认知和理解。Manus的出现，或许标志着AI Agent时代的真正到来。

主体

AI Agent的发展历程

从L1到L3，AI Agent的发展经历了几个阶段。L1是像ChatGPT这样的聊天机器人，L2是推理模型，而L3则是我们今天讨论的Agent。AI1.0年代与大模型时代最大的区别在于数据集和模型的通用性。AI2.0克服了AI1.0单领域、多模型的限制，实现了超级海量数据的处理和跨领域知识的融合。

Agent的定义

Agent的概念被严重泛化，但其核心特征包括Planning（规划）、Memory（记忆）、Tools（工具使用）和其他Agent通信交互。Agent的实现需要让大模型自己来，不要干预，更少的限制，更好的激励。

Manus的实现原理

Manus的实现原理强调“less structure”，即更少的控制和限制。Manus没有预设的workflow，而是让模型自己去探索和思考。这种实现方式使得Manus能够更通用，不限定具体场景。

Manus的使用体验

Manus的使用体验强调“看见”，即用户能够直观地看到Agent的工作过程。Manus在规划、执行、归纳和交付方面都让用户能够清晰地看到其操作。例如，Manus在分析特斯拉股票价格时，会展示其详细的to do list，并逐步执行和归纳总结。

行业影响与讨论

Manus的出现引发了行业对Agent的广泛讨论。有人认为Manus“干啥啥不行”，只是“套壳”，也有人质疑其技术创新和营销策略。但不可否认的是，Manus在Agent领域迈出了重要一步。

成本与商业模式

Agent时代的到来，也带来了成本和商业模式的重新思考。Manus的使用时间（AHPU）成为新的衡量指标，其算力成本远高于传统的聊天机器人。同时，行业也在探索Agent的商业模式，包括订阅、付费使用等。

结尾

Manus的出现，让我们看到了AI Agent的潜力和挑战。未来，AI Agent将如何发展，我们拭目以待。感谢收听这期播客，希望这份摘要能帮助你更好地理解Manus和AI Agent的相关内容。

AI梳理出来的精华是不是很简洁明了？

在这个过程中，逐字稿非常关键。

逐字稿就是把播客里说的每一个字都记录下来，有了它，我们就能清晰地看到播客里讲了哪些内容。通过分析逐字稿，也能更好地找到精华内容，这样AI梳理起来就更方便啦。

02

逐字稿+AI速读教程

接下来，我们一起实操一下：
- 一键转写逐字稿
我们进入通义听悟首页，点击播客链接转写。
直接输入播客RSS链接，点击下方的开始解析。不需要下载播客音频，就可以直接将播客转写为逐字稿。AI解析速度真的非常快，这期时长70多分钟的播客，只花了不到5分钟就转写成功啦点击我的记录，可以看到转写后的文档。可以看到原文和智能速览，包含关键词、全文概要、章节速览、发言总结、要点回顾，还可以一键导出为word或者pdf。转写时和转写后都可以翻译，听外语播客也不会有压力。

快速整理重点笔记

今天这期播客还配有一份《Manus没有秘密》70页PPT，我们把逐字稿和PPT一起上传Kimi。输入提示词，让AI帮我们快速梳理播客内容。

提示词：你是一名专业的播客内容分析师，擅长提炼和总结播客中的要点。请你对这份播客的逐字稿pdf文件和与之搭配的PPT进行解读，识别关键信息点，并对每个关键信息点进行深入分析和详细描述，生成一份详细、清晰的播客内容摘要，让普通人也能轻松理解。摘要需要包括每个重点的深入解释，摘要要忠于播客内容，避免添加个人解释或总结。结构化的文本，包含引言、主体（每个重点的详细描述）和结尾。

我们还可以继续追问感兴趣的内容，了解更多相关信息。

当然，原汁原味的播客内容是无法代替的，通过用AI梳理，我们可以快速了解这期播客内容，遇到感兴趣的，再抽时间完整地听一遍播客，既提高了学习效率，还能让你对这些知识的印象更加深刻~

你学会了吗？快去试试吧。

本文涉及的所有工具：

通义听悟：https://ai-bot.cn/sites/2026.html

Kimi：https://ai-bot.cn/sites/5355.html

原文链接：用AI一分钟提炼《Manus没有秘密》全部精华
March 19, 2025
《Manus没有秘密》70页PPT解读AI Agent（PDF免费下载）
《Manus没有秘密》简介

《Manus没有秘密》由明浩老师撰写的解读 AI Agent 的70页PPT，主要介绍了 AI Agent（智能体）技术从L1到L3的过程，探讨了 AI Agent 的定义、实现原理、使用体验以及未来的发展趋势。通过对Manus等Agent产品的分析，深入讨论了AI技术的现状、挑战和未来方向。（文末附逐字稿）

获取《Manus没有秘密》PDF原文件，扫码关注回复： 20250314

Agent的定义与核心叙事

从Agent的定义出发，提出了从“特征”到“看见”的转变，强调Agent的核心在于其通用性和对复杂任务的处理能力。Agent被定义为能自主完成任务、进行推理和交互的智能体，目标是让用户通过简单的自然语言指令能实现复杂的功能。

从L1到L3的发展历程
- L1：基础模型阶段，主要关注简单任务的处理。
- L2：引入了更复杂的任务处理和工具的使用，如多步推理和多模态交互。
- L3：追求通用性和对任意任务的处理能力，强调Agent的自主性和对复杂任务的拆解与执行。
实现原理与技术实现

探讨了Agent实现的技术原理，包括预训练模型、强化学习、少样本学习等技术的应用。特别提到了“Less structure”（少结构化）的概念，强调让模型自主探索思考范式的重要性，不是依赖于过度的结构化方法。

使用体验与用户感知

从用户的角度出发，讨论了使用Agent的体验和感知。通过具体的使用案例，展示了Agent在实际应用中的优势和不足。例如，Manus在处理复杂任务时表现出色，在某些情况下也可能出现性能下降或错误。

惊喜与差距

对比了Agent在实际应用中的表现与预期之间的差距，分析了当前Agent技术存在的问题和挑战。尽管Agent在复杂任务处理、多模态交互等方面取得了显著进展，但在某些任务中仍存在性能瓶颈。

Manus的诞生与创新

重点介绍了Manus这一Agent产品的诞生背景、设计理念和技术创新。Manus通过其创新的交互方式和强大的任务处理能力，展示了Agent技术的潜力。Manus的设计理念是让用户通过简单的自然语言指令就能完成复杂的任务，不需要用户进行复杂的操作。

AI行业的发展与未来趋势

文章站在行业的高度，分析了AI行业在过去几年的发展历程，以及未来可能的发展趋势。讨论了大模型、Agent技术、多模态交互等技术对AI行业的影响，以及如何推动AI技术的进一步发展和应用。

关于Agent的思考与总结

对Agent的概念、技术实现、使用体验等方面进行了全面的总结和思考。提出了对Agent未来发展的期望和建议，包括如何提升Agent的通用性、性能和用户体验，以及如何在市场竞争中建立优势。

《Manus没有秘密》逐字稿
《Manus没有秘密——70页PPT解读AI Agent》

引言

大家好，我是明浩。我翻了一下自己小宇宙的后台，距离我上一次更新PPT的solo博客，应该刚过去半个多月的时间。上一期，我讲的是关于DeepSeek的内容，以及对2025年所有Agent的一些预期。但现在回头去看，会发现我对Agent的讲述在当时其实是有些空泛的。我相当于在那个时间点，针对那一章节的内容做了一些讨巧式的处理。所以，那一段内容回头来看，其实并没有太多的观点，更像是已有信息的排列组合。

为什么会这样呢？其实说实话，在那个时间点，无论是我还是整个业界，对Agent这件事情都没有那么明确的认知。这也直接引出了今天的话题。在过去的一周左右时间里，整个AI行业都在谈论Manus。作为业界的观察者，我对这件事情也有了更深的认知和理解，所以有了今天这样一期播客的内容。

关于Manus的背景和意义

2025年已经过去了两个半月的时间，我做了三个超长的PPT。今天的内容叫“Manus没有秘密”。本来我还加了一个副标题，叫“2025年会是AI Agent年吗？”但在我制作PPT的过程中发现，其实这个问题可能不需要再问了。我们正式进入今天的内容，是没有秘密的。这个PPT大概有五章内容，如果大家需要，也可以去下载我的PPT文档。

五章内容的标题分别是：核心叙事定义、Agent实现原理、Manus的使用体验以及最后的一些暴力输出。我很庆幸的是，当你对一件事情有比较多的了解时，才会有比较多的包容。当你没有那么了解的时候，更多做的是信息的罗列。我们正式进入今天的内容。

从DeepSeek到Manus

差不多一个月多之前，我做的上一个PPT内容是“从DeepSeek爆火看2025年的AI行业发展”。这个PPT包括了DeepSeek爆火的整个过程，过去两年AI行业的叙事，以及新的蓄势可能性，还有最后一章关于Agent的内容。但其实这四章内容中的前三章我觉得都是老的东西。第四章本来应该有些观点和出彩的地方，但受限于我对这个行业的认知和理解，我会觉得当时做的关于DeepSeek以及AI Agent内容的第四章并不那么理想。

很幸运的是，我们聊到了今天的话题。同样地，我在上一期播客的PPT里就有讲过，如果那个大概70页的PPT只用一页做总结的话，就是OMI定义的L1到L5。我们现在处于L2到L3之间。详细来说，L1就是Chatbot，以ChatGPT为代表的。我们今天能够用到的很多产品都是L1。L2是推理模型，比如OpenAI的O1、DeepSeek 21以及之后一系列头部厂商发布的推理模型。L3就是我们今天讨论的最直接的话题——Agent。

在上一次的PPT里，我也讲过Agent的概念被无限泛化了。今天很好，有人把它定义得更清楚了。所以如果今天还只用一页PPT来总结所有内容，我依然可以用这些PPT来总结。

从L1到L3的详细解读

我们来详细聊聊L1到L3。其实之前在整理PPT的过程中，我并没有那么详细地解释，只是列了一些问题。比如，我们从LE的Chatbot再往前推，在2014、2015年兴起的那一波AI 1.0年代的模型公司，其实今天也还在，比如中国的AS小龙。那么，回头去想那个年代的AI 1.0和大模型年代的AI最大的区别是什么？我们当时是怎么从原来那个样子走到大模型的，走到GPT的？然后再去想2022年底的时候，其实2022年中GPT就发布了3，然后发布了3.5。到2022年11月30号，ChatGPT发布，才被定义成这个行业到了一个节点。

我想问的是，ChatGPT对于GPT 3.5的意义是什么？这是L1。那从L1到L2的时候，从OpenAI的O1在2023年9月份发布，到DeepSeek 21在2025年发布，我们又是怎么走到L2的？还有一点就是，为什么每一次的大模型的重大更新，都看上去有一波应用公司死掉？这个问题再延展，变成了模型和产品这两件事情到底是统一的还是分开的？有可能会说模型即产品，也有可能会说模型和产品应该分开。那是不是这件事情在不同的阶段有不同的答案呢？

我的核心思想其实很简单，就是刚才我问的我们从之前的1.0年代到了大模型年代，然后从基础大模型到推理模型，到今天我们去探讨Agent。

关键词：通用、技术实现、用户感知

第一个关键词我写的叫“通用”，也就是说我们这一步的大模型叫通用大模型。到了推理模型的时候，我们也开始在做叫通用推理模型。因为我们几乎没有做一个什么垂直行业的垂直模型，对吧？推理模型出来就是通用的。那这个东西再往下推，如果L3是Agent，那是不是也应该是一个通用Agent呢？

第二个关键词叫“技术实现”。刚才问我们怎么一步步走过来，从之前的AI 1.0到大模型，我们之前用过一个关键词叫“大力出奇迹”，对吧？到了L2的时候，强化学习变得重要了。在L3，或者说从AI 1.0到L1再到L2的过程中，你会发现一直大家遵循的一个观点是说，尽量少的控制，给更多的数据，更强化学习的方式，让模型本身自己学习，这是技术实现的过程。

第三个关键词叫“用户感知”。也就是说对于一个用户而言，他怎么去感知技术的变化。大家经常会说所谓的“啊哈时刻”（Aha Moment），就是用户哇哦会像看到魔法一样，那种时刻。对于一个普通人而言，是不是那么难理解的一件事情。然后你会发现从L1到L2到L3的过程中，都在经历从简单变复杂再变简单再变复杂的过程。所以如果总结来看L1到L3的整个过程，我会觉得有几个关键词：通用、技术实现、用户感知。听起来有点像神棍，对吧？我们一个个来看。

通用性的重要性

先看“通用”。我用了一张创新工场在2015年刚成立的时候，开复老师在一次发布会上的PPT的一页。他讲的是AI 2.0就是大模型克服了AI 1.0单领域和多模型的限制。比如在之前的1.0年代，我们是用单一的数据集，然后在单一的场景下训练固定的模型。到了大模型年代变成通用的，对吧？这个是在大模型年代就出现的。

技术实现的路径

然后我们是怎么到达L2的呢？如果大家有兴趣可以去详细回看我之前讲DeepSeek那期的博客。在O1发布之后，世界上的主流模型厂商都希望复现O1的推理模型。所以用了两个路径或两个技术方案，一个叫COT（思维链），大家会认为让大模型以一步一步的方式去思考问题，这个叫思维链。思维链出现之后就变成一个训练的过程当中，我们是针对这个链条的每一个环节做激励，还是针对结果做激励。所以当时有一种路线方案是针对每一个过程，就是PRI（过程奖励）。

但最后的结果告诉大家，无论是最早浮现出来的Kimi的O1还是DeepSeek的RE，我们去看他的开源文章以及一些他们的员工的社交媒体发布，最后证明是完全只依靠对结果的强化学习。我们走到L2的整个过程，就是不需要在过程中对模型本身做更多的限制，就跟当年阿尔法狗（AlphaGo）出现阿尔法零（AlphaZero）一样。就是不需要跟人类去学习棋谱，我们就可以得到一个更强的阿尔法围棋模型，它摆脱了人的经验。

DeepSeek也是一样。DeepSeek的基础模型叫V3，基于V3的模型能力做强化学习，仅仅针对模型本身的结果做奖励，就出现了RE Zero，就跟阿尔法零一样。这是我们走到L2的整个过程。然后从RE Zero再经过一点点的预训练、简单的基础信息的增加以及数据的调整，我们出现了今天我们在用的R1。并且R1的训练方案和方式同时出现在了Llama和Qwen上，也对那几个模型提升了效率。这是整个我们走到L2的过程。

用户感知的变化

那你会看这样一个过程来说，你会发现这是一个纯技术路线的模型层的实施。那在用户层是什么呢？我有一个说法叫“用户需要magic”，就跟Aha Moment一样。Moment是什么？就是用户作为一个非技术人员非常清晰地看见了，看见是非常重要的。

我们回头来看L1的年代，ChatGPT发布的时候，作为用户来讲他看见了什么？说得赤裸一点，他看见了机器在“吐字儿”，就这么简单，对吧？那L2的时代就是O1或者DeepSeek R1的时候，用户看见了什么？用户看见了模型在推理。同样这个逻辑往下推，L3如果是Agent，或者说那个Aha Moment出现在Agent这个板块里，那也应该是一个用户看见了什么东西，对吧？用户需要magic。

简单与复杂的变化

然后再说刚才我们提到的一个关键词叫“简单复杂”，这是一个重复的过程。我们看L1年代，ChatGPT刚发的时候，所有人都说我们只需要自然语言就可以跟大模型交互。但你发现需要出现非常复杂的提示词工程，对吧？你需要描述非常多，甚至有严格的格式去给模型做刺激，他才会给你好的答案。然后这是L1。为了到L2的时候，我们刚才讲了前面又出现了思维链，对吧？我希望让模型一步一步思考，然后R2真的实现的时候，你发现我们现在在用比如DeepSeek的RE各种各样的推理模型的时候，感觉那个提示词工程也不太需要了。模型自己可能会理解，但训练R的过程其实是一个大家去跑一些弯路的过程。

有很多公司很多厂商用的过程激烈的方式。然后现在我们要去L3了，要做Agent了。你会发现很多厂商在尝试用叫workflow（工作流）的方式来定义模型的执行。如果依然延续这个逻辑来讲，从简单到复杂再到简单再到复杂再到简单，那L3是不是应该也不需要workflow，而且也不应该限定场景。因为你会发现过去这几次的技术更迭，从技术实现的角度来看，我们的这种路径依赖往往会把我们引到一些弯路上，最后成功的都不是一些弯路。

总结L1到L3的过程

总结一下第一张掰开了揉碎的从L1到L3。第一个关键词叫“通用”，不是垂类，不限定具体场景，不设置边界。当然这会非常难，且初期的实现一定是不完美的。通用，第二，让大模型自己来，不要干预，不要加添加条件，更少的限制，更好的激励。当然对于在做相关工作的公司而言，比较考验他们的是成本跟结果之间的博弈。第三，要傻瓜化操作，尤其是对于用户，要让用户看见，看见哪怕是看见实现的过程也很重要，不能一次又一次地走入复杂的区域的用户，那还需要什么呢？

进入第二章：Agent的定义

我们进入第二章，真正意义上我们去看看Agent。刚才其实在前面的L1到L3的推理过程中，其实有一些结论已经慢慢显现了。我们还是把边界收敛一点，到这一章叫定义Agent，副标题叫“从特征到看见”。因为你会发现我在第一章的过程中讲到了很多特征，就跟房间里有那只大象一样，我们可以描述他的腿、描述它的尾巴、描述他的耳朵、描述他的鼻子，那些都是他的特征。但是你想完整意义上定义那个大象，你需要看见。我们还是从两个最不Agent的Agent方向来看。也是我在上一期的DeepSeek的PPT中讲的比较多的两个方向。一个是搜索，一个是coding。

AI搜索与Agent的关系

我们先讲搜索。今天这个时间点，头部的AI搜索公司有Pop Lexi、Jasper、Kimi，国内的比如Meta、Nanom、知乎等垂类的平台。那你会发现针对AI搜索公司也有很多的问题。从AI搜索公司出现的第一天，很多人就会问，AI搜索公司需要有自己的模型吗？如果没有的话，那不就是套壳吗？对吧？那AI搜索的机会到底是属于传统搜索引擎公司还是初创公司？

这一波DeepSeek火了之后，所有的US公司全部都接了DeepSeek。大家的区别是什么？信息源的差别真的能够带来持久的竞争优势吗？产品设计上能够拉开绝对的差距吗？

开源的AI搜索方案似乎也有很多，从工程实现的角度来讲，感觉也没有什么难度。同时专门做法律、金融、医疗等垂直方向的一些搜索是否有意义？你听到这些分析的时候，会不会觉得特别的耳熟？这是AI搜索对吧？

AI Coding与Agent的关系

从AI Coding来看，头部大模型公司的Chat产品出现的第一天就可以编程。Coding进化的能力的原动力一定是大模型本身能力的进化，尤其以Cloud 3.5开始的进化。似乎是不是所有作为AI Coding的公司，本质上来讲都是Cloud 3.5或3.7的Talk。这些项目的护城河又是什么？工程体验产品的边界能拉开差距吗？

AI Coding的开源方案也有很多，所有大厂大概率都会做的。产品的品牌效应会有吗？做垂直会有意义吗？做前端后端某个垂直场景，你会发现差不多的问题被频繁地问起来了。但这问题有答案吗？可能没有。

Agent概念的泛化与共识的缺失

所以就回到我最开始讲的，我又列了四张之前我在上一次DeepSeek PPT里的关于Agent那一章节中的几页PPT。比如“1000个研究1000个Agent的概念”，Agent概念被严重泛化了。然后有一些典型的Agent的定义，包括2024年Agent行业的发展。但是你会发现大家在这种谈论当中，更多的是一种空对空的谈论。因为大家的共识都没有达成。提示一下，截止到这一页之前，我的PPT没有提及任何关于Manus的内容，任何都没有。从这一页开始，我们看看Manus的种种。

Manus的核心理念：让用户看见

我对Manus的第一个描述叫“一切的工作”。为了让用户看见，我在前面强调很多次，看见很重要。我截了一张图是Manus网站官网上的一个案例，是他们分析特斯拉的股票价格。网页的截图里面，你会发现他的整个的to do list（待办事项列表）。然后他去查各种各样的网站，得到各种各样的图表。然后图表做好之后，他会做成一个网页给到你。

本质上来讲，在产品这个层面，Manus所有的工作都是为了让用户看见。记住。前面说过，L1的看见是什么？是看见吐字。L2的看见是什么？是看见推理。Agent看见是什么？就是看见Agent在工作，一切工作为了让用户看见。那为了让用户看见怎么做到呢？我们看第三个部分就是Manus的实现原理，副标题叫“Less Structure，更少的控制，更少的限制”。

第三章：Manus的实现原理

在第三章里面我又分了六个小节，分别是技术、产品、打绑、付现成本跟一个小故事。我们一个一个的来看。先看技术，其实在Manus之前已经有很多所谓的Agent产品。甚至在2023年的时候就有了一些开源或者是闭源的Agent产品。比如Auto GPT、Ison Pic的Computer Use，OpenAI发的Deep Research主发的Auto GLGLM。其实都是大家底层的逻辑似乎都是差不多的，就是Agent来拆解任务，执行任务给出结果。又因为最近一段时间推理模型的成熟度，在第一步拆解任务这件事情上感觉好像没什么难度了。同时又因为像SOPIC推出的MCP协议，就是可以让大模型去使用各种各样的工具跟API。这种协议出现之后，包括昨天OpenAI发布的一系列的A0的框架，似乎让模型去使用工具跟搭建架构的这件事情也不是门槛了。

那很多人会问，为什么之前迟迟没有爆火呢？差的是什么呢？举一个Manus的例子，Manus在发布之前，其实就给一些投资人跟很资深的合作方们看过他们的测试版本。当时有人就问了一个问题是问这个团队，问Manus团队你们自己写了多少个workflow？大家可以猜一下答案是多少？答案是0。还记得我们怎么做到L2现有的COT（思维链），然后PRM（过程奖励机制）针对过程做激励，但发现不对，最后方式是不预设任何的限制跟架构，只通过结果进行激励。在这个逻辑上Manus跟之前所有的模型公司复现O1是一样的，没有预设的flow。

所以反过来讲，为什么叫“通用”？如果你一旦预设了一定的workflow，其实你就没有那么通用。你可能只在几个你预设好的场景边界下会比较好。那为什么会这样呢？就是或者说为什么这一页我一定要把“Less Structure”标红。因为在之前关于OpenAI发布O1之后的几个视频当中，OpenAI的一位核心的研究人员就表达了这样的观点。就不要教他直接给激励，尽可能少的给各种各样的限制，越少的限制，模型表现越好。同样的这句话也出现在了Manus第二天，他们的产品合伙人张涛老师跟Pick的分享的闭门分享会的PPT里面，叫“Less Structure，More Intelligence”，越少的控制，越好的智能。

Manus如果从产品形态来讲，有一个比较简单的比喻。这个比喻也是之前我们科技做YC整理的时候借用的一个KOL的表单。那个KOL叫产品二级，他做了一个非常形象的比喻。当然这个比喻可能是今天这个时间我们看到Manus之后一个很常见容易想到的方式，就是给AI一台虚拟机。我们回头来看Pop Lexi相当于是给AI搜索以Monica为代表的偏插件跟Chatbot的或者说AI搜索类的公司。可能给AI的是一个浏览器，科是这样的，可能给AI的是一个IDE的编辑器，那今天Manus给AI的是一台虚拟机。

再举个更现实的现实场景的例子。这个例子也是Manus团队在第二天的闭门分享会上举的例子。他说我们之前用大模型，有点像我们招了一个实习生，这个实习生是博士学历，懂得非常多。但是你在用的过程中，你在用这个实习生的时候，你只给了他笔跟纸。那你想他能干什么？你只给他比一根纸，他能干什么？但如果你再给他一个浏览器，他又能干什么？如果你再给他一些，比如说你们内部的核心的各种各样数据库的访问权限，他又能干什么？如果你再给他一些必要的训练跟要求，他又会做成什么样子？

这一路走下来，其实就是Manus在做的事情。给他一台虚拟机，给她浏览器，给她必要的数据库访问的权限，同时做一定的训练，这就是Manus。所以对于用户而言，我们具体都看见了什么，我们前面讲了无数次，用户看见很重要。

用户到底看到了什么？

那用户到底看到了什么？首先看到了Manus在规划一个任务，会有一个非常详细的to do list。第二步你会看到他执行这个to do list，无论他去查网页、调API、编程、写代码，各种各样的方式，你都会看到他在那儿做。第三，你会看到他的归纳跟总结。他做完所有这些任务之后，他要一个一个去核对是否完成了，并且把所有做的这每一步的工作变成一个整体的归纳的东西。最后一步给你一个完整的交付，一个PDF文件，一个网页、一篇文章、一个文案，甚至一个程序、一段代码，anyway给你完整的交付。所以你看见了他在规划，他在执行，他在归纳，最后给你交付。那好，到这儿你会发现Manus做出来了。

Manus团队的下一步：效果评估

对于Manus团队而言，他们做完之后就直接的马上来的事情，那就看这种效果怎么样。所以在Manus官网上有一张图是一个打分表，是他们跟OpenAI的DeepSeek以及SOTA（State of the Art）做的对比，这也是两个类似Agent的产品。然后他们这个榜单叫GAI benchmark。在L1这个benchmark也分三档，L1是最简单的题，L2是难一点的，L3是最难的题。我们来看一下这个GAI是什么，它其实就是一个题库对吧？然后这个题库大概有四百多道题，让模型去算这些题，或者说去考他这些题，看正确答案的正确率，然后来去衡量Agent的能力。

刚才我们说过它有三个等级，初级的题目通常不需要工具，或者就需要最多需要一种工具，不超过五个步骤就可以实现结果。中级需要执行5到10个步骤，且必须组合使用不同的工具。L3高级是要要求AI能够执行任意长度的行动序列，使用任意数量的工具，并能广泛访问世界知识，听起来就很吓人的对吧？我们看一下具体的例子，比如L1的问题大概是什么样。再举个例子是20世纪1977年之后，唯一一位国籍记录为已不复存在国家的马尔可夫大赛的获奖者的名字是什么？听懂吗？初级问题、中级问题是什么？

在2015年大都会艺术博物馆以当年中国生肖命名的展览中，十二生肖中有多少个动物的手是能被看见的？第二个等级，第三个等级。在2018年3月上传的一段YouTube 360度VR视频中，旁白由指环王中咕噜角色的配音演员配音。在视频中第一次出现恐龙后，旁白立即提到了什么数字？给你一台联网电脑你觉得你能在回答多少？对这样的问题，所以这个问题的极特别的难。

Manus解决复杂问题的案例

Manus有一个很有意思的小例子，这个在当天的闭门会上Manus团队也讲过，当时他就测了一个GAIL3的题，这个题是什么呢？是在一个类似国家地理风格的YouTube的视频链接里，各种企鹅们来来回回的走出又走进画面，让Agent竖一帧画面里面同时出现了最多几种企鹅。听明白这个问题了吗？然后Manus怎么做的？Manus先打开这个视频链接，接着做的第一个动作是按了一下键盘上的K接着挨个截图记录哪一帧出现了哪种企鹅，最后得出最多的一张画面有三种企鹅，这还没有完，做完之后，Manus回去检查的下一个动作是按了键盘上的3，最后确定答案。

我不大是否用YouTube，或者是否用视频网站。你知不知道YouTube的快捷键里面的K跟3是干嘛的？K是暂停，当然有人说空格也暂停，对，空格也是暂停，但空格有可能会引发旁边的那个拉了条的变动。K完全只针对视频做暂停。3是什么呢？YouTube的1到9的快捷键对应的是10%到90%的视频进度。这是AI在做的事情。

Manus的通用性和成本考量

那除了这个GAI之外，那那还做了什么？这个其实没有太多人讲，因为只有他们当天的闭幕会上讲到了。大家知道今天YC应该是今天这个时间点在孵化器领域投研项目最多的孵化器了。他的一期项目里面可能有一两百个项目，现在70%到80%都是AI项目。如果大家有兴趣可以去翻去年我跟科技做的总结，我们总结是2024年，然后在2025年的最新一季的YC项目当中，可能有一百多个关于AI Agent相关的项目。

Manus团队做了这样一件事情，他把这些项目全部拉出来。因为你的这些项目可能是做医疗、做法律、做销售、做金融，甚至做一个什么4S店销售更小的这样一个场景。无论你做什么，你总归会有个官网，你的官网上总归会有关于业务的介绍，无论是图片是视频还是文字的描述。Manus团队把所有这些YC25WG的Agent项目的描述全部拉出来，让Manus重新去做副线。最后得到结果是它大概可以cover 76%这些不同各种各样的Agent。这一步叫通用对吗？或者说有一点像之前DeepSeek做出RE之后，同时去训练Llama跟Qwen做的事情。

然后再考虑到下一个小的话题，成本的话题也是Manus团队提出的。他说Manus团队会认为今天这个时间点在Agent年代，尤其在AI的Agent年代，衡量一个业务的指标可能不应该去看常规意义上什么DAU（日活跃用户）、MAU（月活跃用户）、留存，有个核心的指标应该叫AHPU（Agent Hours Per User），就是一个用户用Agent的时间。你想一下，比如说我们现在用DeepSeek也好，用豆包也好，用夸克也好，用混元也好，用元宝也好。你跟他的对话一次的消耗的时间是多久？5秒？10秒？20秒？撑死30秒对吧？但是如果大家用过Manus的话，你会发现一个复杂任务交给Agent他快的可能也要十几分钟，慢的可能要几个小时甚至更长的时间。那你想想这中间的算力的成本的差距是多少？可能不是十倍、百倍，甚至是1000倍、1万倍的差距。

同时又因为这样的时间的差距，自己的统计是说平均来看，DeepSeek每个问题所消耗的成本平均在20美金左右。SOTA大概十美金，他们现在大概两美金。有一些开源方案复现了Manus的功能之后，有一些技术人员去重新用开源的方案去做实施的时候。我印象当中看过一些方案，可能做一些任务也需要30美金的算力的成本。

Agent对Token经济的影响

这个成本的巨幅的扩张引发了另外的一个问题，就变成了年初我在做2024年总结的时候，有一页PPT。那个PPT内容是转发聂他的创始人修函对于Token这个市场的估算的。他在今年年初的时候做了这样一个估算。

他说在今年年初那个时间，在中国国内基本上我们不算大模型厂商自己的应用，算第三方调用的话。如果一个应用每天能够消耗百亿的Token，那基本上就是一个垂类比较大的APP。百亿Token大概就是你的算力的成本是5000块钱一天。这种APP大概可能有几百个，每天就是小几百万的消耗。全年这个盘子就是几十亿到将近100亿的盘子。这就是第三方调用大模型的这个商业模式可见的在那个时间点的天花板。

而且重要的是大家会说，我在上一期的博客里也有讲过NS sum下面也提过，基本上每12个月算力的成本会降10%，会降十倍。如果再考虑到比如多模态的迭代可能又是十倍，所以每一年是以百倍的方式在降。那极端设想就来说，一个用户2个小时全部用视频生成的方式去用AI的方式调用，大概是30亿Token。每个用户100万的DAU的产品是3000万亿的投资消耗，是当下的30万倍，那个就是个极限状态。今天你会发现，原来大家会担心，如果今年的成本降百倍，这个第三方市场的业务增长能不能达到100是个问号。但是有了Agent的这样新的衡量方式之后，你会发现100倍真的太容易了。

如果再发散一下我们前面提及的AHPU，这个指标更像是一个单线程的指标。如果多线程并发了，因为大家如果用Manus你会发现很多Manus那些用户是同一时间让Manus执行很多个任务。那如果你作为复工提供商，你的允许的最大并发应该是多少？如果你在考虑到这些并行过程中是有用户的干预，会重新启动一些新的进程，那似乎这个数字可以无限算下去了。所以出现一个结论，就是我的好友公事粉丝机的作者，周末前天发他说因为他在美国跟很多投资人去沟通，他会发现无论我们如何评价Manus，不管怎么样，这一周可能是讨论Agent带来Token变化的第一周。我们真正意义上开始讨论Agent对Token变化的影响。

Manus的起源小故事

最后讲一个小故事，Manus团队最早不是在做Manus的。其实他们最早是想做浏览器的，是做AI浏览器的。而且是很巧合的是，如果对这个行业有了解的话，应该知道美国之前有一个很有名的浏览器叫Up，但是Up已经确认停止更新了也非常巧合的是，Up确认停止更新通告的那一天，也是Manus团队决定不做浏览器的那一天。

为什么大家会发现浏览器不太适合作为Agent？它的承载其实从用户体验层是一个非常好理解的状态。但今天用Manus，你把交任务交代完，你就可以走了。但是如果它是个浏览器，他要占用你的屏幕，你不能干别的任何事情，你甚至不能断开网络，你不能做任何的别的操作，你会打断他。That’s why Manus chose another path. I give him a virtual machine, he can run on the virtual machine. As long as the task is downloaded, he can go. So the browser becomes a middleman, abandoned. So in reverse, back to my title, if anyone still remembers, the title of this episode is “Manus Has No Secrets.”

为什么说Manus没有秘密？

为什么说Manus没有秘密？Manus的核心团队有三个人，CEO小红，首席科学家Pek，产品合伙人张涛老师。在二月份小红接受小俊的播客采访，她就提及到了她说AI今天这个事情，做Agent现有的能力还不够。应该有个虚拟机Chatbot，应该在云上有个电脑，把它写的代码，把它要通过浏览器查的东西都在电脑上执行。因为是虚拟机，坏了也无所谓，他可以再来一台。它甚至可以在当前任务执行完之后销毁掉那个虚拟机。所以我自己觉得那个架构叫做一个虚拟服务器，一个浏览器能够自己写代码去调用API，能够胜任各种各样的复杂任务，这就是我们在做的事情。

2024年10月，Pek开源了一个模型，也是复现O1是做的推理模型。强化学习今天这个时间点在Manus上的很多任务的执行跟更少的架构的控制，就是用的这套开源的模型。2024年10月，张涛老师在二月份讲DeepSeek的PPT的最后一页，提到了TPC给他在产品使用上的启发。他说要提供绝佳的产品价值。用我的理解来看，就是那个“看见”。张老师说要想95%的人用到第一款应用，AI应用应该是什么样子的？如果做Agent获得外部世界的观察很重要，还能加上。所以你发现在Manus发布之前，这三位核心的创始人已经把所有的执行技术路径、实现原理方案、产品设计都讲过了。所以是没有秘密。

关于Manus的公告和用户反馈

在Manus火了第二天，他们发了一个公告。我想在这里重新读一下张涛老师在3月6号发的。他说首先给关注Manus的用户和媒体老师们一个歉意。我们知道很多人没有体验到Manus过去的17个小时，对于团队来说无异于一场充满了各种意外的冒险。我们完全低估了大家的热情，一开始的初心只是分享一下在探索Agent产品形态过程中的阶段性收获。因此，服务器资源完全是按照行业里发一个demo的水平来准备的，根本不曾想会引发如此大的波澜。目前采取邀请码机制，是因为此刻的服务器容量确实有限，不得已而为之。
最后一段，大家目前看到的Manus还是一个襁褓中的小婴儿，离我们正式版中想交付给大家的体验还差得

很远。像模型幻觉、交付物友好度、运行速度等方面都还有很大的提升空间。我刚才讲完所有前面的故事，你就能理解为什么在那个时间点Manus发了这样一个公告。

第四章：Manus的使用体验

好，进入我们的第四部分，我们就来用一用这个Manus。我找了一些身边朋友的案例，刘飞老师、俊玉、李继刚、大聪明、澜兮兮，跟我所有人都在集客上，所以马总要记得给我打钱。

先看刘飞老师，刘飞老师做了几个案例，我挑了两个。第一个是他希望让Manus给当下的AI大模型打分，然后并且产出了一个报表，看上去就像模像样。第二个需求是做一个播客行业的总结，平台、份额、内容分布。这种偏我叫基础信息的收集跟整理。对于Manus而言，今天来看是一个相对门槛比较低的事情，做得比较好。

然后我们再来看看区域的这个demo，均匀的公众号叫猫窝的，还是你可以去看他对Manus的体验。他做的几个案例当中有几个比较有代表性的是我叫复杂信息的收集能力，就不是简单的信息整理。比如说他有一个任务是让他收集几个APP的官方图标。然后从这个结果来说，可能只完成了70%。因为有一些图标，比如说格式不对，然后模型会偷懒的把自己把那个文件名的拓展名改掉。然后他第二个任务是让他到海关的官网获取一些贸易伙伴的月度的出口额。从执行情况来看，他找错了地方，他没有真正意义上去海关的官网去找这些东西。所以从数据来讲不是特别理想。所以从总结来看Manus的案例来说，就是复杂信息的收集整理对于Manus而言可能还不那么容易，或者说你需要给Manus更明确的目的地的指示。比如说海关那个案例，你就要告诉他，你就来这儿找。

然后李志刚老师作为提示词之王对吧？他做了两个测试，一个是比如说中国的古代的京剧的PDF制作，这个任务完成的非常好。京剧的制作包括作为PDF的格式的展现非常好。然后他让我用HTML加一些可视化的图片去讲解强化学习。从做出HTML网页讲解一个概念，这个任务本身而言是完成的。但是你会发现那些图跟图标还是有待加强的。

然后大聪明就是赛博陕西，他给了一个更狠的测试，让他做了一个Doom。Doom就是最原始的那个射击游戏。最后跑出来一个东西，这个东西可以运行。除了没有枪械的这个图的这个枪之外，它可以左右移动，可以用键盘去控制。有地图这东西能跑出来其实就已经非常不错了，这是大聪明的案例。

我想多讲一点的是我和蓝溪老师的这个案例。我们俩用的是一个案例，而且我们俩之前是没有沟通的，是不约而同给了Manus这样一个任务。这个任务是什么？很有意思，这个也就是在前几天H6Z发布了每半年更新一次的Top 100 AI应用榜单。它分Top 50的网页AI应用跟Top 50的移动APP AI应用。然后这个榜单发出来之后，我们同时给了Manus几个任务，是什么呢？去看这个榜单当中有多少是中国公司或者中国团队做的。

大家细想一下这个任务，首先这个榜单是刚刚发出来的，暂时在那个时间点还没有专业的媒体做分析。当然今天已经有了，在那个时间点是没有的。你想这个任务的执行过程，首先Manus要识别这些应用图标跟名字。然后去搜索对应公司官网或者新闻报道，然后再去确认是否是中国团队，并且要一个一个的筛。同时更重要的是我刚才讲过这个100的榜单是有50个web跟50个APP。但你要知道50个web跟50个APP里面是有重复的。比如说ChatGPT，一定它既在web里面也在APP里面，所以模型还要去核对外部的APP的重复，再最后整理在一起给我结果。

所以如果没有完全公开的确认信息，还要做一些模糊的判断。比如团队可能在新加坡对吧？那这些团队怎么算呢？然后现实世界里如果这个任务专门看AI出海，或者看这个方向的投资人跟媒体，人人肉是可以做出这样标注的对吧？但你觉得这样人有多少？在中国或者说如果你希望找到这样人请教需要付出什么样的成本？如果你给一个实习生来做这个工作，你觉得他需要多长的时间来把这个工作做完？我觉得这道题按照刚才我们聊的那个GIA的测试库的标准，应该已经算L3了。

我们看结果，我觉得这啊我们先不看结果，我同样的把这个问题甩给了今天这个时间点的AI搜索工具。比如说我给了腾讯的元宝，给了豆包，给了DeepSeek，给了夸克。表现最差的是腾讯的元宝，他告诉我十个，但是细看他给的十个九个里面有六个并不在那一百的榜单里，他胡说八道了六个。

数字层面，结果给的最多的石头包给了19个，但是里面也有六个并不在那个榜单里，甚至是张冠李戴的。DeepSeek跟夸克也不是特别理想。大家也在想为什么会有错误，为什么会胡说八道，对吧？幻觉。

那Manus做到什么程度呢？我第一次交给他的任务，给我返回的结果，这个数字是九个。九个是怎么来的？特别简单。H6Z发布这个榜单的时候是配了一篇文章的那篇文章里是关于这个榜单的解析跟描述的。那个榜单里提及的中文应用19个。Manus第一次给我任务的返还是一个偷懒的结果。我看到这个结果，我说你要一个一个排查，所以我给了第二次的提示，就是第二次的任务的追加。然后他说好，我一个个查。然后第二次给我返回的结果是16个。第三次我说你要继续查，肯定还有他又去查。第三次给我返回了21个，那个时候问了。第四次我说他确定没有了吗？然后他又去查了，最后给我返回了23个。

到这一步的时候，系统提示上下文的长度受限了。从结论上来说，真实的数字应该比23还要多，但应该已经是非常接近的数字了。所以你看到这个过程会有什么感觉？

刚才那些似乎都是好的结果，对吧？那有什么不好的吗？有，当然了。比如说在我跟李继刚老师的这个任务当中，我们都发现，比如说我们都希望让他做一些示意图，但是我没有告诉他应该去哪儿做这些图，所以他就用简笔画的方式画了一些简笔画的图，非常的难看，非常的简易，对吧？比如说我做了一个类似军运去海关数据，我是让他找春运数据，同样他找错了地方，给我的结果不好。然后比如说我让他做一个PPT，我希望他有截图跟那个来源的网页的内容，他就直接把一个网页截截过来。结果那个网页上是没有登录的，有二维码贴在上面的。然后所有的图的位置也不对，也没有太多的排版信息，这都不是一个理想中的结果对吧？但你看上去他在认真的干活，只不过做的不太好，那有没有更差呢？

当然也有了。最常见刚才我说上下文的限制是受到大模型本身的限制的。所以经常会发现一个任务执行多次之后，它会提示你特别长的上下文当中，你最好用新的对话。比如说虚拟机可能会有一些问题，虚拟机需要重启，重启不起来它就一直重启。然后可能因为用户的负载过高，他就需要歇几分钟再试。所以他不是完美，他没有他甚至很不完美，他有很多的问题，成功率也没有那么高。

因为你像GAIA的标准L3的题，它大概只有57%的成功概率，所以还有40%多的是不成功的对吧？所以到底我们该如何理性的看待这件事情，或者说看待Manus呢？我用一个也是一个这一波比较早测试Manus的自媒体博主一泽的观点。他说就是一个实习生的水平，缺乏实战经验，缺点灵性，是一个24小时高吞吐量干活的在校大学生。最终产物的水平取决于作为Agent内核的水平和可接触的数据质量。这就是一个相对我觉得理性的评价。

第五章：对Manus的争议和思考

好，我们聊完使用，聊到今天的最后一章，我叫“暴力输出全是死货”。列了几个关键词，第一个关键词“干啥啥不行”。第二个关键词“不就是Talk”。第三个关键词“开源，三小时复现”。第四个关键词“没有技术创新”。第五个关键词“肯定是炮灰”。第六个关键词“营销肯定花钱了”，我们一个一个来讲。

“干啥啥不行”。确实你会发现今天这个时间点，对于一个通用的或者定义叫通用Agent的产品而言，你很难在每一个垂类的，尤其是特别垂直的场景下要求他做的尽善尽美。但这里面出现一个问题，这个问题是一个或者这个场景是一个很有意思的场景。

Manus火的当天，有一位记者朋友打电话跟我聊，跟我问，因为他知道我有邀请码，他知道我在用。他是一个没有那么关注科技行业的，算是一个大众媒体的记者。所以上来他的第一个问题是一个非常朴实的问题，“好用吗？”我听到这个问题的第一反应是我先要想怎么去回答这个问题。我先停顿了一下，然后我叠了个甲，这个甲是什么呢？就是说我跟他说，我说现在的很多测试案例都会有更好的解决方案，所以这个问题的答案只能代表我自己。但请记住他们所强调的“

通用”是什么意思？就是说比如今天让它做个PPT，专门做PPT的工具一定有比它更好的方案。但它不是专门为PPT准备的，对吗？

这就引发了一个其实我95年比尔·盖茨去上一个节目讲述互联网的那个故事。主持人问说，听说前两天互联网发生了一个重大的新闻，是可以直播听到棒球比赛的现场的比赛。然后别人说“是啊”，然后那个主持人问，“那我的收音机是干嘛的？”然后他又说，最近什么上了一个汽车网站，可以查各种各样汽车的数据。主持人又问，“那我的汽车杂志是干嘛的？”我觉得是一样的。

“不就是Talk”？

“通用”之后，第二个关键词是“不就是Talk”。这个应该是太多次的出现在过去这一段时间的各种各样的地方，不就是套壳吗？我的答案特别简单，“不就是三个字”是一种偷懒的说法，甚至有点傲慢。

什么叫“Talk Popularity”？是不是Talk Seek，是不是Talk Yuanbao，以及一堆接了DeepSeek的应用？是不是Talk。针对这个话题，我在推特上和极客公园找了三个我的同行投资人的观点。

首先是宇森，宇森是Manus的投资人，所以他是利益相关方。他发了这样一段话，他说2013年1月我看到一个产品叫Pop Lexi，用起来觉得挺有意思，于是立刻去问了一位对搜索和AI都很有经验的大牛朋友。他看了一眼说“有点意思，但这个没有壁垒，我周末可以搓出一个出来。”后来他周末还真的发了一个原型给我。

2023年中，一位好朋友问我，有机会小几亿美金估值投Pop Lexi感兴趣吗？我那时已经经常使用，但想起那位大牛说的话，于是我礼貌地拒绝了。“套壳应用是不是没有壁垒啊？”然后光速的一位合伙人在推特上也是这样说的，技术可能很多时候都不是绝对意义上的终极的指标。真正能够形成护城河的，是产品、是网络效应、是销售渠道、是品牌，是这些东西。

另外一个做美元基金的合伙人更直接，他说“科Sir Gan Process Move Works好像都是套壳，但是他们已经5000万美金的A2了，他们已经估值10亿美金了。”当然也会有人说，“你们这帮做投资的懂个屁。” Anyway，当然就是纯正意义上的套壳还是依然非常热火的。同样在H6Z的这一期的Top 50的APP榜单上，有六个是纯正意义上的套壳。就是APP的图标也很像ChatGPT，提供的功能也是大模型的真正意义上的套壳。

“开源复现3小时”？

第三个关键词是“开源复现3小时”。对，3小时开源复现Manus的开源方案跟得很快，对吧？现在最有名的是两个：Open Manus和OW。强吗？很强。但是我想说的是，对于一个用户而言，想要用起来这些开源的方案，你首先要在GitHub上下载这些代码，要在本地进行环境的搭建，要在云端做服务器的部署，要去调用各种各样模型的API，最后可能还要用命令行的方式做执行。听起来门槛似乎有点过于高了，对吧？

然后我再引用歌飞的一句话，他说“手搓个demo很快，运营好一个产品是很难的。”自己也能守错的，只考虑到了424时间分配原则里的2。第一个是什么呢？第一个是挖掘需求，在别人挖掘出这个需求，做出这个产品之前，他没有去搓一个出来。在别人发布之后照虎画猫当然会容易。第二个二，他也只是实现了最核心的一点功能而已，别人背后做的大量细节工作他没有看到，也没有去复现，所以画虎不成反类犬。第三个四是宣传推广，当下没有考虑到这是一项长期的工作。

“没有技术创新”？

第四个关键词是“没有技术创新”。那创新到底是什么？我们只看过去这两年的AI大模型行业，似乎只有一个局势是：大模型才叫底层技术，才叫创新。所以在之前会有结论会说，“在大模型的技术能力没有收敛之前，大家应该谨慎做引流。”我就想问了，产品又是什么呢？不是大家都在期待2025年是AI产品、AI应用、AI Agent爆发的一年吗？

再举两个更现实的案例，一个也是一个极客网友在回复一条Manus评论里说，“我问了一下平时不关心AI的做财务负责人的朋友，他看了Manus说‘这就是我期待的AI的样子。’”我的另外一个好朋友是做大学老师的。他说“我昨天回复旦和老师们吃饭，我就给他们安利各种AI的用法。老师们说他们已经跟不上时代了，但是很想试试。Manus就是那种傻瓜一点的，没有什么干预能力的，完成质量差一点也没关系的人。”更重要的是，第三条是一位Manus团队的前员工发的。他说“从我的视角上，Manus就是Monica这个公司抓住机会能力上最好的体现。但这么解读Manus太浅薄了，因为他们的工程实践和Agent workflow的积累是实实在在的。”

我参与到的只有2023年9月到10月首次在国内推出Agent，这里面to do list都是当时学习了各家Agent的方案之后的最佳实践。再到2024年3月做GPT S平台，2024年初开始一直就在做浏览器的技术积累，积累大量对浏览器context的利用的理解。2023年11月开始做搜索，对Agent联网获取信息的能力也是需要积累的，我没有参与的部分。2024年7月份通过Rost获取社交流量的增长经验。2024年11月Coding产品中对于各模型Coding能力的理解，确实每件事都是相对薄的一层。但是这些积木在这个窗口形成的组合创新足够强也是事实。但也就是他们可能既有认知又有足够的工程能力在这个小窗口实现空袭。

“营销肯定花钱了”？

第五个关键词是“营销肯定花钱了”。这应该是这一波关于Manus讨论当中非常重要的一个话题。我举一下时间线：

3月5日中午12点，张涛老师给我发了一条微信。他说“我们晚上十点会发布他们新的产品。明天也就是3月6日的十点半，会向朋友们进行第一轮交流沟通。如果你有兴趣，我把腾讯会议的号码发给你。”

3月5日晚上，创始人小红和张涛老师在即刻上发布了这条视频。小红是3月5日晚上11点发的，张涛老师是3月6日凌晨0点17分发的。

3月5日晚上9点10分到11点50分，赛博禅心的大聪明公众号转发了Manus的官方视频，又在3月6日早上7点发了一个测试，就是他测试的那几个demo。

卡兹克是在3月7日早上6点，他通宵没睡做了一期体验的内容。

这是第一波的传播的所有内容仅此而已。截止到这个时间点，我们能看到的介绍全部来自于这两条即刻以及两个公众号的推送。然后其实视频发出来之后就爆了，然后就是第二天的那个演示会。所以第二天的闭门会是早就预期好的，不是一个澄清会。他是早就想给朋友们介绍一下他这个东西的。

参与现场我可以列几个我身边比较好的朋友。比如说曲凯老师在、柯基在、花生在、特工宇宙在，一泽在，黄叔也在，我也在，还有一些朋友我们都会在，有人在北京的线下，有人在线上。我可以保证的是，我们所有这些人，没有任何人收了Manus的钱。没有。所以在那个时间点，Manus也发了个公告说“我们从未开设任何付费获取邀请码的渠道，我们从未投入任何市场推广预算。”作为亲身参与其中的个体，我绝对的相信这个团队的这个公告。

从结果来看，花生那条极氪也很有代表性。他说“其实一切的开始就是团队做了一个挺好的产品，拉圈子里的朋友们聊了聊，请大家测一测。事情的发展，应该是完全超出他们的预期和控制，仅此而已。”那为什么大家愿意呢？我用了两个字的关键词叫“善缘”。也是在我上一期DeepSeek的PPT里，我推荐大家如果对DeepSeek的技术实现想要了解的话，去看一个2个小时的视频。那个视频的名字叫《最好的致敬是学习》。那个视频是谁做的？是张涛老师做的。更重要的是在我的博客里，上期内容关于DeepSeek的《遥远与误解》，是我和丽丽以及张涛还有另外一个老师做的。

在过去这一段时间里面，张涛老师通过这种方式，某种意义上说接了足够大的善缘。我们这些对技术理解没有那么深的非技术人员，是要感谢张涛老师的布道的。所以为什么会有第一批那么强的自来水？是因为善缘。

当然很多人可能不信，那我用另外一个反过来的方式去说。因为在3月6日早上8点，知乎上就有问题问Manus。当时排名第一的答案是说“第一款自媒体比技术从业者先发现和评测的AI产品没有错。”他说在Hacking News和V2EX上没有热度，因为他们的朋友不是技术圈的，他们的朋友是我们。

再举个例子，这波的传播从极客公众号小宇宙作为开始。3月6日早上从这一个最小的圈子开始，先拖到了核心的科技媒体圈，然后拖到了财经媒体圈。到当天有一些党媒央媒报道。如果你想一下这个营销是设计过的，你得用多少钱，前期得铺多少的关系。我知道有很多大厂的公关是听我播客的，今天我给你足够多的预算，你能复现这样的传播吗？答案不言自明，对吗？

还有人会说推特上根本没有讨论，因为他们没有给在第一时间给外面的人，外国的推特上的用户测试，所以怎么会有讨论呢？直到后来推特上出了很多讨论，所以我想说的说，大家一定要用出口转内销的方式来验证一些事情。就没有自己独立判断的方式跟逻辑吗？最后。AI Agent的年代真的要来了吗？

总结：AI Agent时代的到来

我用下来，我的感受是这样的。我说我更清楚的知道如何面对这样一个时代。你要学会做一个好的老板，提出好的问题，分配好的任务，给予充分的信任和授权，过程中及时的调整，收到结果后给予反馈，如此反复。这是我作为一个非技术从业者，但对于行业感兴趣，毕竟用了很多AI工具的人的一个切身的感受。然后同时我更想引用玉帛老师对于Manus的评价，他是这么说的：

“最近好多人问我如何评价Manus，我会尝试反向的问对方是什么感受，得到一个很有意思的观察。大厂人往往会把其归结为过度的营销，投资人则关注壁垒是什么，商业模式是啥，创业者大多会兴奋，看到了机会，用户会迷茫这是啥，媒体人更直接，有没有码细思。这背后其实都是在看自己。大厂人担心丢了尊严，用营销解释容易心安。投资人是formal，担心没投错过，投了又亏钱。创业者是羡慕，希望下一个是自己。用户最朴实，这是啥？是最客观的评价者。媒体人是在想着怎么获取图和流量，忙忙碌碌皆是围绕自己，只有用户保持着朴素的好奇心，这是啥？”

所以最后一页我想说的是什么？第一，在过去两年多的时间里面，在AI这个我叫黑暗森林年代。但凡有人踏出一步，踏对了市场，总会给你比你预期多的正反馈。这件事情已经被无数次证明了，我们要感谢Manus在2025年出的爆火。2025年这一年会越发的具有挑战，与诸君共勉。感谢收听这期播客，我的PPT在小宇宙里有需要可以下载，感谢。
获取《Manus没有秘密》PDF原文件，扫码关注回复： 20250314
March 14, 2025
如何用AI把长文一键生成可视化网页，附提示词
在数字化时代，信息的呈现方式正发生着翻天覆地的变化。传统的文件，如PDF文档和PPT演示虽然在信息传递中占据重要地位，但局限性也日益凸显。本文将介绍如何用AI把文档一键变成可视化网页，基于AI技术，可以将PDF文档一键转化为交互式的可视化网页，让信息传递变得更加生动、有趣且高效。

传统文件的局限性
- 阅读体验不佳：面对密密麻麻的文字，读者很容易感到疲惫和走神。
- 信息传递效率低：线性的阅读方式限制了读者对信息的快速理解和吸收。
- 缺乏互动性：读者只能被动地接收信息，无法主动探索和互动。
可视化网页的优势
- 提升阅读体验：通过丰富的视觉元素和交互设计，让阅读变得更加轻松愉快。
- 增强信息传递效果：以更直观的方式展示数据和概念，帮助读者快速理解和记忆。
- 激发主动探索：提供多种交互方式，鼓励读者主动探索信息，满足不同学习风格的需求。
所需工具和资源
- AI模型：目前，Claude 3.7 Sonnet是实最佳选择。能根据给定的提示（Prompt）生成高质量的可视化网页代码。可以选择支持Claude 3.7 Sonnet平台（如Claude官网、trea海外版、cursor等）
- 文本编辑器：用于编辑和修改提示（Prompt）。
- 图床服务：用于托管图片并生成公网链接，如https://sm.ms/。
- 代码部署平台：用于部署生成的代码并获取可分享的链接，如https://www.yourware.so/。
步骤详解
- 准备文件：选择你想要转化的文件，可以是PPT或PDF文件等，确保其内容清晰、完整。
- 编辑提示（Prompt）：使用文本编辑器，复制并粘贴提供的基础提示（Prompt）模板，根据文件信息进行调整。
- 修改信息：修改作者信息区域，填写你的姓名、社交媒体链接（如Twitter/X、GitHub等）以及版权信息和年份。
- 调整媒体资源：根据文件内容，调整媒体资源部分。如果是图片，使用图床服务生成公网链接，并以Markdown格式添加到提示中；如果是视频，找到公网视频地址并获取嵌入代码，粘贴到提示中。
- 生成可视化网页代码：将编辑好的提示（Prompt）粘贴到Claude 3.7 Sonnet支持的平台（如Claude官网、trea海外版、cursor等）。点击生成按钮，等待模型根据提示生成可视化网页代码。
- 部署和分享：将生成的代码复制到代码部署平台，点击“deploy code”，等待部署完成。部署完成后，点击“copy link”，获取可视化网页的链接，可分享给他人。
基础提示词模板（Prompt）

我会给你一个文件，分析内容，并将其转化为美观漂亮的中文可视化网页：

## 内容要求
– 所有页面内容必须为简体中文
– 保持原文件的核心信息，但以更易读、可视化的方式呈现
– 在页面底部添加作者信息区域，包含：
* 作者姓名: [作者姓名]
* 社交媒体链接: 至少包含GitHub、Twitter/X、LinkedIn等主流平台
* 版权信息和年份

## 设计风格
– 整体风格参考Linear App的简约现代设计
– 使用清晰的视觉层次结构，突出重要内容
– 配色方案应专业、和谐，适合长时间阅读

## 技术规范
– 使用HTML5、TailwindCSS 3.0+（通过CDN引入）和必要的JavaScript
– 实现完整的深色/浅色模式切换功能，默认跟随系统设置
– 代码结构清晰，包含适当注释，便于理解和维护

## 响应式设计
– 页面必须在所有设备上（手机、平板、桌面）完美展示
– 针对不同屏幕尺寸优化布局和字体大小
– 确保移动端有良好的触控体验

## 图标与视觉元素
– 使用专业图标库如Font Awesome或Material Icons（通过CDN引入）
– 根据内容主题选择合适的插图或图表展示数据
– 避免使用emoji作为主要图标

## 交互体验
– 添加适当的微交互效果提升用户体验：
* 按钮悬停时有轻微放大和颜色变化
* 卡片元素悬停时有精致的阴影和边框效果
* 页面滚动时有平滑过渡效果
* 内容区块加载时有优雅的淡入动画

## 性能优化
– 确保页面加载速度快，避免不必要的大型资源
– 图片使用现代格式(WebP)并进行适当压缩
– 实现懒加载技术用于长页面内容

## 输出要求
– 提供完整可运行的单一HTML文件，包含所有必要的CSS和JavaScript
– 确保代码符合W3C标准，无错误警告
– 页面在不同浏览器中保持一致的外观和功能

请根据上传文件的内容类型（文档、数据、图片等），创建最适合展示该内容的可视化网页。
March 13, 2025
浙江大学DeepSeek系列专题讲座课件第三期（PDF文件） – AI教程资料
《走向数字社会：从DeepSeek到群体智慧》和《语言解码双生花：人类经验与AI算法的镜像之旅》来自浙江大学人工智能教育教学研究中心，围绕人工智能技术及其在语言理解和教育领域的应用展开讨论。主要探讨了从图灵机到大模型的发展历程，以及DeepSeek大模型的构建与应用，强调了群体智慧在应对大模型挑战中的重要性。聚焦于人类经验与AI算法的关系，探讨了语言解码的奥秘、AI语言理解的发展路径，以及大语言模型的构建与进化，特别关注了推理模型的诞生与突破及其在教育领域的应用。

获取《走向数字社会：从DeepSeek到群体智慧》

《语言解码双生花：人类经验与AI算法的镜像之旅》

PDF原文件，扫码关注回复： 20250221

《走向数字社会：从DeepSeek到群体智慧》

简述人工智能的发展历程，从图灵机到大模型的演变。人工智能在数字社会中的作用，以及群体智慧在应对大模型挑战中的重要性。
- 人工智能的诞生与符号主义
  
  讨论达特茅斯会议及其对人工智能的定义，符号主义在早期人工智能中的应用。
- 从生物神经网络到人工神经网络
  
  探讨生物神经网络的启发如何推动人工神经网络的发展，以及深度学习的兴起。
- 生成式模型与大模型
  
  介绍生成式大语言模型的原理及其在人工智能中的重要性。
- DeepSeek的意义
  
  分析DeepSeek大模型的开发背景、技术挑战及其对现有大模型的改进。
- 人工智能促进社会数字化转型
  
  探讨人工智能在网约车需求预测、机房节能、疫情传播预测和智能康复训练等领域的应用。
- SCISpace、NotebookLM和Co-Scientist
  
  这些工具如何利用人工智能技术提升科研和教育效率。
《语言解码双生花：人类经验与AI算法的镜像之旅》

强调语言对人类的重要性，以及理解语言在实现通用人工智能中的关键作用。
- 语言的奥秘：人类如何解码世界
  
  探讨人类大脑如何通过词语的组合和上下文信息理解语言。
- DeepSeek-R1：推理模型的诞生与突破
  
  介绍DeepSeek-R1推理模型的开发过程及其在复杂推理任务中的应用。
- 从符号到智能：AI的语言理解之路
  
  分析AI从符号处理到深度学习的发展路径，以及词向量和注意力机制在语言理解中的作用。
- 智能体时代：AI如何重塑教育未来
  
  探讨AI如何通过苏格拉底式教学法等方法改变教育模式，推动从知识本位向能力本位的转变。
- DeepSeek-V3：大语言模型的构建与进化
  
  详细介绍DeepSeek-V3大语言模型的架构、训练方法及其在不同领域的应用。
获取《走向数字社会：从DeepSeek到群体智慧》

《语言解码双生花：人类经验与AI算法的镜像之旅》

PDF原文件，扫码关注回复： 20250221

往期文章：

浙江大学DeepSeek系列专题讲座课件第二期（PDF文件） – AI教程资料

浙江大学DeepSeek系列专题讲座课件第一期（PDF文件） – AI教程资料
March 12, 2025
怎么申请Manus邀请码，附Manus邀请码申请技巧
Manus是什么

Manus是Monica团队推出的全球首款通用型AI智能体，Manus与传统AI助手不同，能提供建议或答案，直接交付复杂任务的完整成果。 Manus在GAIA基准测试中取得了SOTA（State-of-the-Art，当前最优水平）的成绩，超越了OpenAI的Deep Research等竞品。能独立思考、规划并执行复杂任务，如筛选简历、生成代码、创建演示文稿、规划旅行等。Manus支持云端异步处理，用户可在任务执行过程中关闭设备，任务完成后会收到通知。

怎么申请 Manus 邀请码

通过Manus官网申请

访问Manus官网：manus.im

在登录页面找到“Get Started”点击按钮，再点击“Apply for access”，进入申请页面。

或者点击直接进入申请页面。

填写邮箱地址和简要说明你希望如何使用Manus。这里的说明越详细越好，邀请码会更快申请到。

看到这个页面就是提交成功了，提交申请后请耐心等待，关注邮箱消息，也可以访问Manus的官网先体验一下。

注意事项与申请技巧
- 建议使用常规邮箱即可，edu 邮箱更佳。或者谷歌gmail、outlook、其他外网邮箱，国内邮箱可能无法正常接收相关验证邮件和通知。
- 官方从未开设任何付费获取邀请码的渠道，任何声称可以“付费购买邀请码”的都是骗子。
- 不要通过非官方渠道购买邀请码，以免上当受骗。
- 申请理由建议使用英文回答，尽量详细、真诚，突出自己对Manus的需求和使用场景。
- 由于申请人数较多，可能会出现链接无法打开的情况，建议多试几次。
申请理由提示词（英文）

提示词：Generate a concise and compelling English response for the Manus AI invitation request form’s second question: ‘What Use Case Would You Like Manus to Execute for You?‘. The response should highlight a creative, practical use case (e.g., automating a complex task like market research or content creation), explain why this task is important to the user, and demonstrate a clear need for Manus’s autonomous execution capabilities. Keep the answer under 100 words.

申请理由：I would like Manus to automate comprehensive market research for my startup. This involves analyzing consumer trends, competitor strategies, and emerging market segments. This task is crucial as it helps us make informed decisions, allocate resources efficiently, and stay ahead of competitors. Manus’s autonomous execution capabilities would save time, reduce human error, and provide real-time insights, making it an invaluable tool for our growth.

申请理由模板示例

示例1：申请Manus邀请码（产品运营）

Dear Manus Team,

Hello! I am a professional in product operations, currently serving as the Product Operations Manager at [Company Name]. I specialize in enhancing the market performance and user satisfaction of products through data analysis, user growth strategies, and content operations. I am extremely interested in the powerful capabilities and efficient execution of Manus, and I believe it can bring significant improvements to my work.

My Professional Background

Field of Work: Internet Product Operations

Work Experience: [X] years, during which I have been responsible for product operations in [list some important projects or partner brands]. I have accumulated extensive experience in user growth, retention optimization, and content ecosystem development.

Work Process: My daily responsibilities include product data analysis, user feedback collection and analysis, strategy formulation and execution, as well as content planning and promotion. Currently, the main challenges I face are how to more efficiently integrate data resources, accurately identify user needs, and rapidly iterate operational strategies to adapt to market changes.

What I Hope Manus Can Provide

Data Analysis and Insights: I hope Manus can help me quickly analyze product data, extract key metrics, and generate visual reports to more intuitively understand user behavior and product performance.

Operational Strategy Optimization: Based on market dynamics and user feedback, I would like Manus to provide suggestions for operational strategies, such as user growth channel analysis and user retention optimization plans.

Content Planning and Generation: I would appreciate it if Manus could assist me in formulating content operation plans and generating high-quality copywriting and event planning proposals to enhance the appeal and dissemination of content.

Task Automation: For example, automatically organizing user feedback and generating daily operation reports to reduce repetitive work and allow me to focus more time on core strategy development.

My Expectations for Manus

I believe that Manus’ efficient execution capabilities and powerful tool integration functions can help me better manage product operations, improve work efficiency, and provide a better user experience. I look forward to becoming an early adopter of Manus, exploring its potential in the field of product operations, and providing feedback and suggestions for its development.

Thank you for taking the time to read my application. I am eagerly awaiting your invitation code to embark on this collaborative journey with Manus.

Best regards!

[Your Name]
[Your Email]
[Your Contact Information]

示例2：申请Manus邀请码（前端工程师）

Dear Manus Team,

Hello! I am a Front-End Engineer, currently working at [Company Name] as a Front-End Developer. I specialize in Web front-end development, user interface design, and interaction optimization. I am very interested in the powerful capabilities and efficient execution of Manus, and I believe it can significantly enhance the efficiency and innovation of my development work.

My Professional Background

Field of Work: Web Front-End Development

Work Experience: [X] years, during which I have been responsible for front-end development in [list some important projects or partner brands]. I have accumulated extensive experience in HTML/CSS/JavaScript development and am familiar with mainstream front-end frameworks such as React and Vue.

Work Process: My daily responsibilities include page layout and styling development, implementation of interactive features, integration with back-end APIs, performance optimization, and code maintenance. Currently, the main challenges I face are how to quickly produce high-quality front-end code while optimizing user experience and improving development efficiency.

What I Hope Manus Can Provide

Code Generation and Optimization: I hope Manus can help me quickly generate high-quality front-end code templates, such as React components or Vue page structures, to reduce repetitive code writing tasks.

Performance Optimization Suggestions: I would like Manus to analyze existing front-end code and provide performance optimization recommendations, such as reducing loading times and optimizing resource management.

Interaction Design Support: Based on design drafts or requirement specifications, I hope Manus can generate pseudo-code or implementation ideas for front-end interaction logic, helping me better understand user interaction needs.

Tool Integration and Automation: For example, automatically detecting code standards and generating documentation comments to improve development efficiency and reduce manual operations.

My Expectations for Manus

I believe that Manus’ efficient execution capabilities and powerful tool integration functions can help me better manage front-end development work, enhance code quality and development efficiency, and provide users with a smoother interactive experience. I look forward to becoming an early adopter of Manus, exploring its potential in the field of front-end development, and providing feedback and suggestions for its development.

Thank you for taking the time to read my application. I am eagerly awaiting your invitation code to embark on this collaborative journey with Manus.

Best regards!

[Your Name]
[Your Email]
[Your Contact Information]

示例3：申请Manus邀请码（产品经理）

Dear Manus Team,

Hello! I am a Product Manager, currently responsible for the product planning and management of [Specific Product Name] at [Company Name]. My work involves market research, product design, feature iteration, and cross-departmental collaboration to ensure that the product meets market demands and achieves business goals. I am very interested in the powerful capabilities and efficient execution of Manus, and I believe it can significantly enhance the efficiency and innovation of my product management work.

My Professional Background

Field of Work: Internet Product Management

Work Experience: [X] years, during which I have served as a Product Manager in [list some important projects or partner brands]. I have accumulated extensive experience in designing products from scratch (0 to 1) and iterating products from initial versions to maturity (1 to N).

Work Process: My daily responsibilities include market research, user requirement analysis, competitive analysis, product feature planning, writing Product Requirement Documents (PRDs), designing prototypes, and collaborating with development teams. Currently, the main challenges I face are how to more efficiently integrate requirements from various parties, optimize the product planning process, and quickly validate product hypotheses.

What I Hope Manus Can Provide

Requirement Analysis and Prioritization: I hope Manus can help me quickly organize user requirements, combine them with market trends and business goals, and provide data support and suggestions for prioritizing these requirements.

Competitive Analysis and Report Generation: Automatically generate competitive analysis reports, extracting key features, strengths, and weaknesses to provide references for product differentiation.

Product Documentation Writing: Assist me in writing high-quality Product Requirement Documents (PRDs), user stories, feature descriptions, and other documents to reduce the time spent on documentation.

User Journey and Process Design: Based on product goals, generate user journey maps and suggestions for interaction process design to help me better plan the user experience.

Data Analysis and Insights: Analyze product data and generate visual reports to help me quickly understand product performance and user behavior, providing a basis for iteration.

My Expectations for Manus

I believe that Manus’ efficient execution capabilities and powerful tool integration functions can help me better manage the product lifecycle, improve work efficiency, and provide users with a better product experience. I look forward to becoming an early adopter of Manus, exploring its potential in the field of product management, and providing feedback and suggestions for its development.

Thank you for taking the time to read my application. I am eagerly awaiting your invitation code to embark on this collaborative journey with Manus.

Best regards!

[Your Name]
[Your Email]
[Your Contact Information]

用AI辅助写申请内容

模板示例列举有限，不过你可以让AI来辅助输出，像Kimi，DeepSeek，豆包，腾讯元宝都可以。

Prompt（提示词）：（可以根据实际情况调整）

Please generate an application instruction for Manus invitation code based on the following information. The content should include the following parts:
- Subject: Application for Manus Invitation Code ([Specific Job Title])
- Work Background
  
  Field of Work: [Specific Job Title]
  
  Work Experience: [X] years, during which I have served as a [Specific Position] at [list relevant work experience or company names]. I have accumulated extensive experience in [core skills or experience].
  
  Work Process: My daily responsibilities include [list main work content]. Currently, the main challenge I face is [specific pain point or challenge].
- What I Hope Manus Can Provide
  
  Specific Need 1: For example, help me [specific task or goal], providing [specific functionality or support].
  
  Specific Need 2: For example, automatically generate [relevant documents or reports] to provide references for [specific goal].
  
  Specific Need 3: For example, optimize [work process or task] to reduce [specific cost or time].
  
  Specific Need 4: For example, analyze [data or information] and generate [visual reports or insights].
- Expectations for Manus
  
  I am looking forward to the efficient execution capabilities and tool integration functions of Manus. I believe Manus can help improve work efficiency, optimize work processes, and enhance user experience. I am eager to become an early user of Manus and am willing to provide feedback and suggestions for its development.
- Closing
  
  Thank you for taking the time to read my application. I am eagerly awaiting the invitation code. I hope to start using Manus soon.
  
  Best regards,[Your Name],[Your Email],[Your Contact Information]
March 7, 2025