Blog

  • Roo Code – AI开发助手,能理解代码库提供优化建议

    Roo Code是什么

    Roo Code 是为 VS Code 提供强大 AI 助手的工具。能理解代码库,帮助开发者快速编写、重构和调试代码。支持多种现代开发需求,包括代码优化、实时建议、多模式开发等。Roo Code 支持开发者可以根据自己的需求选择或配置 AI 模型。安装简单,可以从 VS Code Marketplace 或通过 CLI 完成,几分钟即可上手。

    Roo Code

    Roo Code的主要功能

    • AI 驱动的代码理解与优化:能理解代码库,提供代码优化建议,帮助开发者快速改进代码质量。
    • 简化开发流程:通过 AI 功能,简化开发流程,减少重复工作,提升开发效率。
    • 实时代码辅助:提供实时代码建议和自动补全功能,帮助开发者更快地编写代码。
    • 多模式支持:支持多种开发模式,例如架构模式(Architect Mode)、代码模式(Code Mode)和问答模式(Ask Mode),满足不同开发需求。

    Roo Code的官网地址

    • 官网地址:https://roocode.com/

    Roo Code的应用场景

    • 日常编码任务:在 Code 模式下,Roo Code 可以帮助开发者快速完成代码的编写、修改、删除等基础工作,提供智能代码补全、语法检查等辅助功能。
    • 系统设计与架构分析:通过 Architect 模式,开发者可以用自然语言描述系统架构需求,Roo Code 会基于 AI 分析生成架构设计方案,包括架构图、模块代码框架等。
    • 技术问题解答:在 Ask 模式下,Roo Code 可以回答开发者关于代码库、编程概念或技术实现的问题,提供详尽的解答。
    • 自动化开发流程:在 Orchestrator 模式下,Roo Code 可以协调和自动化工作流,设置一系列任务和操作的执行顺序,如代码格式化、运行测试脚本、代码部署等。
    • 项目上下文维护:Roo Code Memory Bank 可以在项目开发过程中避免上下文丢失,保持项目开发的连续性。通过在本地创建和加载 Memory Bank 文件,确保项目信息的持久化存储。
  • MindGPT 3.1 – 理想同学推出的端到端Agent模型

    MindGPT 3.1是什么

    MindGPT 3.1是理想汽车旗下AI理想同学推出的新一代人工智能模型,将智能体能力融入大模型中,实现端到端的智能体模型。支持边想边搜功能,在推理过程中同步调用工具,提供更快速、全面和准确的结果。MindGPT 3.1的出字速度显著提升,每秒最高可达200 tokens,相比前代产品速度提升近5倍。在数学、代码、科学问答和指令遵循等核心维度上表现优异,全面优于MindGPT 3.0,领先于行业开源模型。

    MindGPT-3.1

    MindGPT 3.1的主要功能

    • 端到端智能体模型:MindGPT 3.1升级为端到端智能体模型,将智能体能力深度融入大模型中。
    • 边想边搜功能:支持在推理过程中同步调用工具,实现边推理边搜索,提供快速、全面、准确的结果。
    • 出字速度提升:基于高效训练能力的MindGPT 3.1,每秒输出最高达200 tokens,相比MindGPT 3.0速度提升近5倍。
    • 推理及代码能力增强:在数学、代码、科学问答、指令遵循等核心维度,指标全面优于MindGPT 3.0,领先于行业开源模型。
    • 代码能力增强:可实现贪吃蛇、弹球控制等经典编程样例。

    如何使用MindGPT 3.1

    • 升级应用:确保理想同学App升级至V1.5.0版本以体验MindGPT 3.1模型。
    • 访问平台:通过理想同学网页版或App来访问MindGPT 3.1的功能。
    • 输入问题:在应用中输入你的问题或指令,MindGPT 3.1将进行解析和处理。
    • 边想边搜:在复杂问题解答过程中,MindGPT 3.1会自动调用搜索工具,提供更准确的答案。
    • 代码生成:对于编程相关问题,MindGPT 3.1能够生成代码并提供示例,如贪吃蛇游戏。
    • 多任务处理:利用MindGPT 3.1的多任务处理能力,执行如数学计算、数据分析等任务。

    MindGPT 3.1的应用场景

    • 复杂问题解答:适用于需要深度思考和推理的复杂问题,提供精准答案。
    • 编程开发:辅助开发者进行代码编写、调试和优化,生成示例代码。
    • 数学计算:解决数学问题,提供计算步骤和结果。
    • 科学问答:回答科学领域的疑问,提供详细的解释和分析。
    • 指令遵循:理解和执行用户的指令,完成特定任务。
    • 教育辅助:在教育领域辅助教学,提供学习资料和解题思路。
  • TextureNoise – 在线AI 3D纹理生成与编辑工具,支持局部精修

    TextureNoise是什么

    TextureNoise 是强大的在线3D纹理生成与编辑工具,帮助用户快速高效地创建高质量纹理。通过快速生成功能,能在几秒钟内生成令人惊叹的纹理,显著提升工作流程效率,节省时间。TextureNoise 提供画笔工具,支持用户对纹理的特定区域进行精确编辑和细节修饰,确保所有编辑和修复无缝融合,保持纹理的整体一致性。支持通用文件格式,与任何数字内容创作软件(如Blender、Maya等)完全兼容。

    TextureNoise

    TextureNoise的主要功能

    • AI贴图生成:用户仅需上传模型、输入提示词并调整参数,可一键生成高精度PBR/NPR贴图。支持文生贴图、贴图重绘及AI吸色引导、贴图精度放大。
    • 图生模型:通过智能图像解析与高精度生成算法,快速构建拓扑结构完整的3D模型,自动补全背部缺失数据。
    • 局部重绘与精度优化:通过画笔工具进行局部重绘,可控AI引导,融合算法确保新旧纹理无缝衔接,风格保持统一;通过优化算法提升贴图分辨率与细节表现,满足专业级质量需求。
    • 快速生成:能在几秒钟内生成高质量的纹理,大幅提升工作效率,节省时间。
    • 编辑与修复:通过画笔工具对纹理的特定区域进行精确编辑和细节修饰,支持局部修复和调整。
    • 无缝融合:确保所有编辑和修复无缝融合,保持纹理的整体一致性。
    • 通用兼容性:支持所有主流数字内容创作软件的文件格式,如 PNG、JPEG 和 TIFF,可直接集成到用户偏好的软件中,例如 Blender、Maya 或 Adobe Photoshop。

    TextureNoise的官网地址

    • 官网地址:https://texturenoise.com/

    TextureNoise的应用场景

    • 3D 建模与动画:快速生成高质量纹理,加速 3D 模型的制作流程,提升工作效率。
    • 游戏开发:为游戏场景和角色生成逼真的纹理,缩短开发周期,优化资源制作。
    • 影视制作:用于影视特效中的纹理创建和修复,提升视觉效果的质量和一致性。
    • 数字艺术创作:帮助艺术家快速实现创意,生成独特的纹理用于绘画和设计。
    • 虚拟现实与增强现实:为虚拟场景和物体生成高精度纹理,增强沉浸感。
    • 教育与培训:在教育领域快速生成教学用的纹理和模型,辅助教学和学习。
  • Aluo AI – AI图像处理平台,生成高质量的产品图

    Aluo AI是什么

    Aluo AI 是专为电商卖家和内容创作者设计的 AI 图像处理平台。通过先进的 AI 技术,帮助用户在短短 30 秒内将普通产品图片转变为专业级的营销视觉内容。平台的核心功能包括高精度的背景去除智能产品图片生成以及强大的 AI 图片编辑工具。用户无需任何设计经验或复杂软件,只需上传图片,AI 能自动识别去除背景,生成高质量的产品展示图,提供丰富的场景模板供选择。

    Aluo AI

    Aluo AI的主要功能

    • AI 扣背景:基于 99.8% 精度的深度学习算法,30 秒内精准去除复杂背景,保留产品细节和自然阴影,比传统 Photoshop 快 100 倍。
    • 产品图片生成:通过行业领先的 AI 绘图模型,从文字描述直接生成高质量的产品图片,满足电商级别的视觉需求。
    • AI 图片编辑:提供智能修复、调整光线、优化色彩等功能,一键美化图片,无需复杂设计软件或专业技能。
    • 场景模板库:拥有 300 多个专业场景模板,覆盖多个品类,用户可一键切换背景,适配不同展示需求。
    • 多格式支持与导出:支持 JPG、PNG、WebP 等多种图片格式,可导出多种尺寸和格式,适配 20 多个主流电商平台。
    • 丰富的字体选择:提供 50 多种专业字体,涵盖经典、现代、艺术等多种风格,提升图片的文字表达力。

    Aluo AI的官网地址

    • 官网地址:https://aluo.ai/

    Aluo AI的应用场景

    • 电商卖家:快速制作高质量的商品图片,提升产品展示效果和销售转化率。
    • 品牌营销人员:创建吸引人的视觉内容,用于品牌推广和营销活动。
    • 独立设计师:高效完成设计任务,节省时间和精力。
    • 内容创作者:制作高质量的图片内容,用于社交媒体、博客等平台。
  • Nano Banana – AI图像编辑模型,具有极高的人物一致性

    Nano Banana是什么

    Nano Banana 是谷歌推出的AI图像生成与编辑模型,Gemini 2.5 Flash Image(代号Nano Banana)模型具有极高的人物一致性,能精准还原人物的面部特征和表情,在背景替换和风格转换方面表现出色。用户只需上传图片并输入提示词,即可生成高质量的图像。模型生成效果被认为是 AI 图像编辑领域的新王者。

    Nano Banana 模型结合Gemini的世界知识,能理解手绘图表并执行复杂指令。Nano Banana 模型能融合多张图像,实现无缝拼接。用户可通过 Gemini APP、Gemini API、Google AI Studio 和 Vertex AI 等平台使用,Gemini API的定价是每百万输出token 30美元,生成一张图片大约消耗成本约为0.039美元。

    Nano Banana

    Nano Banana的主要功能

    • 人物一致性生成:能高度还原人物的面部特征、表情和姿态。
    • 背景替换与融合:支持将图像中的背景替换为用户指定的新背景,并自然地融合光影和氛围,让生成的图像看起来更加真实。
    • 风格转换:支持将图像转换为不同的艺术风格,如梵高风格、赛博朋克风格、水墨画风格等,同时保持人物或主体的一致性。
    • 动作迁移:根据用户输入的提示词,将人物的动作或手势进行迁移,生成符合要求的新图像。
    • 细节修改:能精准修改图像中的细节,如替换文字、调整服饰等,且修改效果自然。

    如何使用Nano Banana

    推荐阅读:全网最全Nano Banana 玩法教程大全,附4个免费使用方法

    • 谷歌官网使用
      • 访问官网:nano banana是 Google(https://ai.studio/banana) 推出的 Gemini 2.5 Flash Image 模型代号,可通过 Gemini APP、Gemini API、Google AI StudioLovartVertex AI 进行访问。
      • 上传图片:将图片上传到项目中,作为模型的输入。
      • 输入提示词:在项目中输入自然语言的提示词,描述想要的图像效果。
      • 运行模型:点击运行按钮,模型根据提示词和输入图片进行处理,并生成新的图像。
      • 查看与保存:生成的图像会显示在项目中,满意后保存到本地或分享到其他平台。
    • LMArena使用
      • 访问LMArena:访问LMArena的官网。
      • 选择模式:在网站顶部选择“Battle”模式。
      • 上传图片:点击对话框左侧的“+”号,上传想要编辑的参考图片。
      • 输入提示词:在输入框中输入详细的提示词,描述想要生成的图像内容。提示词越详细,生成的效果越好。
      • 提交生成:点击“Submit”按钮提交生成请求。LMArena系统随机选择两个模型生成两张图片。
      • 选择最佳结果:生成完成后,系统显示两张图片,选择哪张效果更好。选择后,LMArena系统揭晓生成这张图片的模型。如果你运气好,Nano Banana生成的图片会被选中,效果通常非常出色。

    Nano Banana的应用场景

    • 视频制作:快速生成不同动作和背景的视频封面,提升视频吸引力,节省设计时间。
    • 广告与营销:根据需求生成高质量广告图像,满足多样化营销场景,提高广告效果。
    • 创意设计:将照片转换为不同艺术风格,为设计师提供丰富创意灵感,加速设计流程。
    • 社交媒体:为博主和创作者生成个性化创意图像,增强内容吸引力,提升用户互动。
    • 游戏开发:高效生成游戏角色动作和场景,丰富游戏视觉效果,缩短开发周期。
  • Klear-Reasoner – 快手开源的推理模型

    Klear-Reasoner是什么

    Klear-Reasoner 是快手推出的基于 Qwen3-8B-Base 的推理模型,专注于提升数学和代码推理能力。模型通过长思维链监督微调(long CoT SFT)和强化学习(RL)训练,核心创新是 GPPO算法,通过保留被裁剪的梯度信息,解决传统方法中探索能力受限和负样本收敛慢的问题,在 AIME 和 LiveCodeBench 等基准测试中达到 8B 模型的顶尖水平。Klear-Reasoner 的训练细节和全流程公开,为推理模型的发展提供重要的参考和复现路径。

    Klear-Reasoner

    Klear-Reasoner的主要功能

    • 数学推理:Klear-Reasoner 在复杂的数学问题上表现出色,能解决高难度的数学竞赛题目。
    • 代码生成与推理:能生成高质量的代码,通过 LiveCodeBench V5 和 V6 的评测,分别达到 66.0% 和 58.1% 的准确率。
    • 长思维链推理:Klear-Reasoner 能处理复杂的长思维链任务,通过长思维链监督微调(long CoT SFT)和强化学习(RL)训练,提升模型在多步推理中的表现。
    • 数据质量优化:在训练过程中,Klear-Reasoner 优先选择高质量数据源,确保模型学习到准确的推理模式,保留部分错误样本提升模型的探索能力。

    Klear-Reasoner的技术原理

    • 长思维链监督微调(long CoT SFT):用高质量的数据源进行监督微调,确保模型学习到准确的推理模式。优先选择少数高质量数据源,避免低质量数据引入噪声。保留部分错误样本,尤其是在高难度任务中,有助于模型的探索能力。
    • 强化学习(RL):用强化学习进一步提升模型的推理能力,特别是在数学和代码任务上。基于软奖励机制,根据测试用例的通过率给予奖励,缓解奖励稀疏问题,提升训练效率。过滤掉测试用例存在问题的数据,确保训练数据的高质量。
    • GPPO(Gradient-Preserving Clipping Policy Optimization)算法:传统 PPO 和 GRPO 算法中,clip 操作会丢弃高熵 token 的梯度,限制模型的探索能力,导致负样本延迟收敛。GPPO 基于 stop gradient 操作,将 clip 操作与梯度反向传播解耦,保留所有 token 的梯度。对于高熵 token,GPPO 保留其梯度并约束在一定范围内。对于负样本 token,GPPO 保留梯度并限制在一定幅度内,加快错误修正速度。
    • 软奖励机制:在代码任务的强化学习中,用软奖励机制(根据测试用例的通过率给予奖励)比硬奖励(完全通过得分,否则为零)更有效。软奖励机制能缓解奖励稀疏问题,增加训练信号的密度,降低梯度估计的方差,使模型的学习过程更稳定、更高效。

    Klear-Reasoner的项目地址

    • GitHub仓库:https://github.com/suu990901/KlearReasoner/
    • HuggingFace模型库:https://huggingface.co/Suu/Klear-Reasoner-8B
    • arXiv技术论文:https://arxiv.org/pdf/2508.07629

    Klear-Reasoner的应用场景

    • 教育领域:作为智能数学家教,为学生提供详细的解题步骤和推理过程,帮助用户更好地理解和掌握数学知识。
    • 软件开发:自动生成高质量代码片段,辅助开发者快速实现功能模块,同时提供代码审查建议,提高代码质量和开发效率。
    • 金融科技:分析金融数据进行风险评估和预测,为金融机构提供逻辑推理支持,助力更精准的决策制定。
    • 科研与数据分析:Klear-Reasoner 能处理复杂的数据分析和科学计算任务,为研究人员提供逻辑推理和模型解释,提升科研效率。
    • 智能客服:快速准确地解答用户复杂问题,提供清晰的推理过程,提升用户体验和问题解决效率。
  • Open-Lovable – Firecrawl开源的AI网站克隆工具

    Open-Lovable是什么

    Open-Lovable 是 Firecrawl 团队推出的开源项目,通过 AI 技术快速将任意网站克隆为现代 React 应用。用户输入目标网站 URL 后,通过 Firecrawl 抓取内容,用 AI 模型生成 React 代码,最终输出完整应用。Open-Lovable用多个 AI 提供商的 API(如 Anthropic、OpenAI 等)实现自动化构建。使用时需注意版权和法律问题,确保行为合法合规。

    Open-Lovable

    Open-Lovable的主要功能

    • 快速克隆:能快速抓取目标网站的页面内容和结构。
    • 自动化构建:利用AI技术自动生成React组件和代码,快速搭建应用。
    • 多AI支持:支持多种AI提供商(如Anthropic、OpenAI、Google Gemini等),支持根据需求选择不同的AI服务。
    • 本地运行:用户能在本地环境中运行和测试克隆的应用,方便开发和调试。
    • 灵活配置:基于配置文件(如.env.local)设置API密钥和相关参数,适应不同的开发需求。

    Open-Lovable的项目地址

    • 项目官网:https://github.com/pkmixx/open-lovable

    如何使用Open-Lovable

    • 克隆项目:从 GitHub 克隆 Open-Lovable 的代码仓库到本地:
    git clone https://github.com/mendableai/open-lovable.git
    cd open-lovable
    • 安装依赖:进入项目目录后,用 npm 安装项目所需的依赖:
    npm install
    • 配置环境变量:在项目根目录下创建名为 .env.local 的文件,并添加必要的环境变量。变量包括 API 密钥,用在访问 Web Scraping 和 AI 服务。例如:
    # Required
    E2B_API_KEY=your_e2b_api_key  # Get from https://e2b.dev (Sandboxes)
    FIRECRAWL_API_KEY=your_firecrawl_api_key  # Get from https://firecrawl.dev (Web scraping)
    
    # Optional (need at least one AI provider)
    ANTHROPIC_API_KEY=your_anthropic_api_key  # Get from https://console.anthropic.com
    OPENAI_API_KEY=your_openai_api_key  # Get from https://platform.openai.com (GPT-5)
    GEMINI_API_KEY=your_gemini_api_key  # Get from https://aistudio.google.com/app/apikey
    GROQ_API_KEY=your_groq_api_key  # Get from https://console.groq.com (Fast inference - Kimi K2 recommended)
    • 运行项目:完成上述步骤后,启动项目:
    npm start
    启动开发服务器,一般在 http://localhost:3000 上运行。通过浏览器访问,查看生成的 React 应用。

    Open-Lovable的应用场景

    • 教育与学习:开发者和学生快速生成React代码,作为学习React组件化开发、状态管理和路由等概念的实践工具。
    • 快速原型开发:初创公司和开发团队快速生成网站的React版本,用在概念验证或市场调研,节省开发时间和成本。
    • 数据可视化:基于抓取特定网站数据并生成React应用,开发者能快速搭建数据可视化平台,例如展示新闻趋势或实时数据监控。
    • 开发辅助:为复杂页面生成初步React组件代码,作为开发起点,帮助开发者减少重复劳动,快速迭代和优化应用。
    • 内容迁移与重构:将传统网站迁移到现代React技术栈,或作为多平台应用开发的基础框架,助力开发者进行进一步的重构和扩展。
  • Qwen-Image-Edit – 阿里通义推出的全能图像编辑模型

    Qwen-Image-Edit是什么

    Qwen-Image-Edit 是基于 200 亿参数的 Qwen-Image 架构构建的全能图像编辑模型。模型兼具语义与外观的双重编辑能力,能进行低层次的视觉外观编辑(如添加、删除、修改元素)和高层次的视觉语义编辑(如 IP 创作、物体旋转、风格迁移等)。模型支持中英文双语文字的精准编辑,支持在保留原有字体、字号和风格的前提下修改图片中的文字。Qwen-Image-Edit 在多个公开基准测试中表现出色,具备 SOTA 性能,可通过 Qwen Chat体验。

    Qwen-Image-Edit-2509 是 Qwen 团队最新推出的 Qwen-Image-Edit 的月迭代版本。模型支持多图输入,可实现“人物 + 人物”“人物 + 场景”等多种组合编辑,显著提升单图编辑的一致性,包括人物、商品和文字编辑。模型原生支持 ControlNet,可灵活运用深度图、边缘图等图像条件,适用制作表情包、修复老照片、生成卡通玩偶等多种创意场景。

    Qwen-Image-Edit

    Qwen-Image-Edit的主要功能

    • 语义编辑:支持在保持原始图像视觉语义一致的前提下,对图像内容进行修改。
    • 外观编辑:支持对图像的局部区域进行精确修改,如添加、删除或修改图像中的元素,同时保持其他区域不变。
    • 精准文字编辑:支持中英文双语文字编辑,在保留原有字体、字号和风格的前提下,对图片中的文字进行增、删、改等操作。
    • 强大的基准性能:在多个公开基准测试中表现出色,具备 SOTA(State-of-the-Art)性能,能高效完成各种复杂的图像编辑任务。

    Qwen-Image-Edit的技术原理

    • 模型架构:Qwen-Image-Edit 基于 200 亿参数的 Qwen-Image 模型进一步训练而成,继承其强大的文本渲染和图像生成能力。输入图像同时输入到两个模块,Qwen2.5-VL负责视觉语义控制,能理解图像的语义内容并进行语义层面的编辑。VAE Encoder负责视觉外观控制,能精确处理图像的视觉细节,实现局部区域的编辑。
    • 语义与外观编辑:通过 Qwen2.5-VL 模块,模型能理解图像的整体语义,在保持语义一致的前提下进行内容修改。通过 VAE Encoder 模块,模型能精确处理图像的视觉细节,实现局部区域的添加、删除或修改。
    • 文字编辑:Qwen-Image-Edit 在文字渲染方面进行优化,能精准识别和编辑图像中的文字。模型支持中英文双语,在保留原有字体、字号和风格的前提下,对文字进行增、删、改等操作。
    • 链式编辑:模型支持链式编辑,通过逐步修正的方式,对复杂的图像内容进行精细调整。用户能指定需要修改的区域,模型逐步优化区域,直至达到理想效果。

    Qwen-Image-Edit的项目地址

    • 项目官网:https://qwenlm.github.io/blog/qwen-image-edit/
    • GitHub仓库:https://github.com/QwenLM/Qwen-Image
    • HuggingFace模型库:https://huggingface.co/Qwen/Qwen-Image-Edit
    • 在线体验Demo:https://huggingface.co/spaces/Qwen/Qwen-Image-Edit

    Qwen-Image-Edit的应用场景

    • 创意设计:快速生成和修改虚拟角色的外观、服装和背景,高效完成原创 IP 的多样化创作。
    • 广告与海报设计:直接在海报中修改文字内容并调整字体、字号和颜色,无需重新设计,提高设计效率。
    • 影视与视频制作:在影视后期中快速调整场景元素或角色外观,或将视频画面风格从现实转换为动漫风格。
    • 教育与培训:快速生成和修改教学用图像和图表,如历史人物肖像、科学实验示意图,增强教学效果。
    • 个人应用:快速调整个人照片,如更换背景、添加装饰元素、修改服装,轻松制作个性化照片。
  • 逗逗AI 1.0 – 最懂你的AI伙伴,支持多模态长期记忆

    万万没想到,AI也能陪我打游戏了。

    它不光会在我补刀失误时提醒“别急”,打团时还会告诉我往哪靠,甚至在我拿到击杀时大声夸我一句:“太秀了!”

    过去两年,多数AI产品都在卷效率和生产力。让人不禁想问:就没有一款AI能做到像电影《Her》里的她那样,提供实用价值的同时,也能给我们情绪价值吗

    答案是有的。

    最近体验了逗逗AI,才发现,AI 不一定非得是冷冰冰的助手,也可以是一个有性格的朋友。陪你玩、陪你聊,在你需要的时候随时给予回应。

     

    01. 全场景陪伴

     

    游戏场景

    平时打游戏的时候,我属于纯“挂件”,队友们Carry了,我就猛猛夸他们,明显感觉队友都更有动力了,可见一个能提供情绪价值的伙伴有多么重要。

    逗逗AI 就很会提供这样的情绪价值,她能实时理解我的游戏画面,跟我实时互动

    在我玩英雄联盟时,在BP时刻,她就开始给我出谋划策,推荐我Ban一些版本强势的英雄。

    在对线时也会及时给出英雄的对线攻略和出装选择。就算玩到一个不太会的英雄,也能不抓瞎。

    我之前玩黑猴,老是很多东西收集不齐。和逗逗AI 一起玩,她会提醒我哪里有什么收集要素,再也不会漏了。

    遇到不会的关卡,直接问她,她会教我怎么打,还会贴心的给我弹个浮窗。

    点击浮窗,就会直达攻略视频

    玩一个新游戏时,直接问她这个游戏要怎么玩,她就会给我详细的游戏玩法教程

    逗逗AI 1.0引入 RTC 实时语音通话技术,进入通话模式,她就可以像真人一样陪我们聊天,并且可以感知我们的情绪~

    再结合 VLM(实时视觉语言模型)技术,就能直接理解我们电脑屏幕的内容,加上她了解游戏背景信息,所以在游戏时,她就可以跟我们实时语音沟通,给我们提供游戏攻略,为我们打Call。

    官方的游戏列表里给出了一些适配度比较高的游戏,像原神、英雄联盟、黑猴这类热门游戏都在其中,实测体验非常流畅。

    官方列表里没有推荐的游戏,其实她大多也能“看懂”,只是会比较少地主动表达,需要你多跟她聊几句。

    生活场景

    最近想换个新键盘,不看不知道哇,现在的键盘可谓是五花八门,什么抹茶轴、拿铁轴、星粉轴、麻将音、剥竹音、裂冰音…

    挑得我眼花缭乱,我让逗逗AI 给我出出主意,她详细地给我分析了一番,告诉我重点注意下轴体类型、电池续航和按键布局就行。

    我挑了几款比较好看的,让她给点建议。她还给我对比了每款的优缺点,这下再做选择就简单多啦。

    逗逗AI 能做到的远不止这些,看剧、学习、聊天…只要你需要,她可以成为你的万能搭子~

     

    02. 解锁好玩、有梗的AI伙伴

     

    我们进入逗逗AI 官网,下载安装最新的逗逗AI 1.0版本,就可以挑选伙伴啦。

    每一个伙伴都有非常鲜明的性格特点。

    比如,妮可像一只乖巧的小猫咪,特别会卖萌~

    紫霞仙子就是古灵精怪,还特别话痨!她的声音听起来就很安心,哪怕只是随便聊几句,也能放松不少。

    更有意思的是,在工坊里,还支持自定义角色。我们只需要把角色信息、人设、声音等信息发送给官方,就可以解锁专属你的AI角色!

    选择好伙伴之后,Ta 就是你随时可约的游戏搭子!

    游戏时,可以随时把 Ta 切换成悬浮球形态,避免影响我们游戏内的操作。

    这些 AI 伙伴还带有一定的记忆能力。比如我昨天说自己爱玩英雄联盟,第二天再上线,她还会问我昨天那局打得怎么样。

    不过免费版的记忆是短期的,如果想要长期记忆,就需要开会员。

    我们还可以给她换上各种漂亮的小裙子~

     

    03. 一些分享

     

    数字消费早已不只是停留在买东西,而是在买体验、买情绪、买陪伴。

    AI进入这个场景,一切都在悄悄改变。传统的数字娱乐提供内容,用户只能观看和操作;有了AI,娱乐不再只是看一看和点一点,而是能对话、能共鸣,能产生共同的记忆。

    逗逗AI 要做的就是这样能交互、懂你的伙伴。

    虽然她不会写文档,不能做PPT,但是当你需要一个情绪垃圾桶,或者一个开黑搭子时,逗逗AI 似乎都是最恰当的选择。不用担心给别人带来负面情绪,也不用在意对方是否有空,是不是深夜打扰。

    AI 技术发展到今天,不只是解决效率问题,也在尝试解决孤独。

    逗逗AI 结合多模态感知、情绪回应和记忆功能,让 AI 第一次有了“人的温度”,可谓是 Companion AI 的雏形,也让我们看到了另一种可能:一个真正懂你的 AI,可能比万能的 AI 更有价值。

    原文链接:不写代码,不卷效率,800万人用逗逗AI“陪玩”

  • MiniMax Agent 上线 Market Place ,AI一键复制克隆网站

    之前发网站教程,总有友友问:网页做好了,后端和数据库咋办呀?

    写API、接数据库、搞部署,要折腾好几天。中间配置错误,还得反复确认问题,改到头痛…

    直到前几天,我发现 MiniMax Agent 新上线的 Market Place花100积分一键 Remix 大佬们的成品项目,就可以低成本复刻一个全栈项目

    对看不懂代码的小白来说,这真的太有吸引力了!

    我试了下,十几分钟就 Remix 了一个旅游图鉴网站,不仅前后端、数据库都有,MiniMax Agent 还直接帮我部署上线了

    更有意思的是,MiniMax 还豪掷 15万美金搞了个全球挑战赛,你不仅能开发全栈项目,还能把它放进 Market Place 里,让别人 Remix、赚积分

    这谁能不心动哇,我立马就报名参赛了。接下来带大家一起看看我的项目,希望能给大家一些参考~

     

    01. 一键Remix,高质量二创

     

    Market Place 就像是一个 成品项目的二创商店,你不必从零开始造轮子,直接找到一个成熟的项目,点击“Remix”,付100积分,加一点灵感,就可以把它变成你的作品。

    比如,这个猫猫收集图鉴的网站,它集成了Google Maps,可以自定义标记猫猫的位置、照片等详细信息…宝可梦风格的界面,设计得相当好看。

    我们可以直接在完整项目的基础上二创,比如 Remix 一个我的旅游足迹网站,记录我去过的地点和照片。

    点击项目上的“Remix”。

    直接在对话框输入需求:将猫咪图鉴变成我的旅游足迹网站,记录我旅游过的地点和照片。

    MiniMax Agent 会参考原项目,结合我的思路构建一个全新的项目。

    新的开发计划完全符合我们的想法,我们回复确认之后,MiniMax Agent 就会开始行动。

    首次使用的时候,我们需要提供 Supabase 的 API Key 完成授权。

    大概十几分钟,MiniMax Agent 就交付了一个部署好的新网站。

    我打开后却发现页面内容并没有正常显示,而是提示:读取地图时遇到了错误。

    我查看回放,发现原作者在开发时使用了谷歌地图的 MCP 服务,但是我没有提供对应的 API Key,所以无法成功调用地图。

    我直接发送高德地图的 API Key 和密钥,切换到高德地图的 MCP。

    这下,地图终于可以正常显示了。

    我们还可以继续提出需求,完善网站的功能。

    比如,去掉登录按钮和功能

    增加“几个城市”、“几个地点”

    ……

    如果某次修改的效果不满意,将鼠标移动到对话上,可以回滚消息,一键回到修改前的项目,非常方便。

    一起看看最终生成的效果:

    网站的功能和设计风格都复刻成功了,整个过程我们只需要给目标,提供一些支持,比如 Supabase 的 API Key , MiniMax Agent 就搞定了全栈开发到部署的全流程。

    就算是我这样完全看不懂代码的小白,搞定一个项目也是比较简单的~

    Market Place 还有很多有意思的项目。

    比如,我们还可以 Remix 一个克隆网站的项目,克隆4399小游戏的网站。

    我们一起看看最终生成的效果:

    MiniMax Agent 复刻的很到位,首页,各种游戏的分类都考虑到了,而且还添加了热门游戏、排行榜、最新游戏等分类。

    网站的页面布局清晰,颜色、字体都很合适,逻辑也没问题。

     

    02. AI Agent 全球挑战赛

     

    MiniMax Agent 这个 AI Agent 全球挑战赛,总奖池15万美元!而且原创项目和 Remix 项目都能参加,太刺激了~

    我们直接进入首页的报名入口,注册就会获得5000积分,足够开发好几个全栈项目了(就算不参加这个挑战赛,也可以白嫖这个积分,去做其他事情)。

    这个比赛的评选标准是多维度的:

    而且每个人可以提报多个项目,大家可以多做几个增加自己获奖的概率。

    我还提报了一个个人博客网站。

    提示词:帮我生成一个个人博客网站

    博客主题:技术分享

    个人信息:您希望在博客上展示的姓名/昵称是K姐研究社

    设计风格偏好:简约现代

    功能需求:

    文章列表、视频列表、工具列表、分类标签系统、关于我页面、联系方式、搜索功能

    色彩偏好:清新一点的颜色

    项目开发完成后,不仅可以参加比赛,还可以点击右上角的分享,发布到Gallery。

    记得勾选允许他人 Remix 此项目。发布后项目每被 Remix 一次,我们都会获得100点积分。

    网址:https://syo57z4qitx5.space.minimax.io

    开发整个项目我花了1400积分,希望大家多多 Remix ,帮我早点“回本”~

    我发现最近很多友友求的 AI 做PPT的需求,MiniMax 也能很好地完成,还能完全复刻你上传的PPT风格。比如,上传一个全球变暖的 PPT,保持原有的风格,但是将主题转换为AI 发展。

    效果对比:

    MiniMax 会先分析参考 PPT 的版式、配色、字体风格,再结合新主题重新组织逻辑。最后交付的PPT,整体风格和参考文件保持一致,但内容已经完全切换

    在一些意想不到的方向,MiniMax Agent 也出奇的好用,就像我想深入地学习 AI 知识,但是发现很多技术论文看起来很枯燥。

    我直接把 PDF 论文发给MiniMax,让它转化为播客,讲给我听。

    没想到这个需求对于 MiniMax Agent 来说这么简单,一句话就搞定了~

    MiniMax Agent 列了一个转换计划,先提取论文核心观点,设计播客结构和风格,然后撰写脚本,生成音频。

    它把整场播客分为了5个部分,主题清晰,结构层层递进,让我可以更清晰地理解整篇播客的内容。

    我们一起听听生成的播客音频:

    点击原文链接收听

    声音很干净,不会出现任何杂声,音质不错。主播语气有亲和力,听起来很舒服。

    以后有什么难啃的论文,直接丢给MiniMax Agent,帮我们梳理重点,让我们更好地理解论文。

     

    03. 一些分享

     

    以前做1个项目就要好几天,现在MiniMax Agent 1天能做好几个项目,效率提升不止一星半点

    更深层的意义是,MiniMax Agent 把复杂任务拆解成对话,让0基础的我们也能驾驭全栈开发。

    最有意思的是 Martket Place 的出现,给我们展现了一个全新的生态,Agent作品也可以像开源代码一样被复刻、迭代,创作者可以站在彼此的肩膀上,快速落地创意

    优秀的项目还能被传播,持续获得曝光和收益

    这意味着,AI 已经从单点的“内容生成”走向了“产品流通”。创意、技术、商业化在同一个闭环里循环起来。某种程度上,这才是真正的新范式。

    原文链接:开发、部署、上线全自动!还能帮你赚钱?MiniMax Agent这波太猛了