Category: AI教程

AI工具集提供各种热门AI教程与学习资源,帮助你安装、运行、测试和使用各大热门AI工具。快速学习AI产品工具的使用技巧,掌握各种AI产品工具有趣又有用的玩法。

  • 《GEO白皮书:AI搜索时代的品牌增长新范式》

    《GEO白皮书:AI搜索时代的品牌增长新范式》普及 GEO 相关知识,涵盖基础学习、科普资料、实践案例与论文解读,遵循持续更新、重底层原理与实践等原则。内容以学习指南为框架,分五部分展开:首部分阐述 GEO 基础与背景,含定义、与传统 SEO 对比等;第二部分揭秘 GEO 方法,涉及核心技术等;第三部分聚焦 GEO 内容,探讨权威性等要点;第四部分通过问答解答多维度问题;第五部分收录相关论文,为 GEO 学习提供全面参考。白皮书为企业在 AI 搜索时代的营销提供新思路,帮助企业精准触达用户、提升品牌影响力,是企业应对 AI 搜索变革的重要参考资料。

    白皮书的主要内容

    GEO 基础认知

    • GEO 定义与核心目标

    GEO 即生成式引擎优化,主要针对 AI 答案引擎进行内容优化。核心目标是让内容契合 AI 答案引擎的抓取和理解逻辑,增加被选中的机会,进而借助 AI 生成的回答,将品牌信息、产品价值等精准传递给目标用户,提升品牌曝光度与影响力 。例如,当用户在 AI 搜索工具中询问某类产品的选购建议时,经过 GEO 优化的品牌内容,就更有可能出现在 AI 给出的答案里。

    • GEO 与传统 SEO 的对比
    对比维度 传统 SEO GEO
    核心目标 提升网页在搜索引擎结果页的排名,吸引用户点击进入网页获取信息 让内容直接被 AI 答案引擎整合到生成式回答中,用户无需跳转网页
    优化对象 搜索引擎算法,侧重于关键词排名、外链数量、网页权重等因素 AI 答案引擎的内容理解和生成算法,更注重内容的权威性、准确性和结构化程度
    用户触达路径 用户搜索→查看搜索结果→点击链接→进入网页查看内容 用户搜索→AI 直接生成包含目标内容的回答→用户直接获取信息
    内容呈现形式 完整的网页,包含标题、正文、图片、导航等多种元素 碎片化、具有高价值的核心信息,如关键知识点、解决方案、产品核心优势等
    • GEO 的商业价值与趋势

    在 AI 搜索日益普及的当下,GEO 的商业价值愈发凸显,帮助品牌抢占 AI 答案引擎这一重要流量入口,当用户搜索相关内容时,优化后的品牌内容能优先展示,获取更多流量。同时,减少用户获取信息的成本,提升用户对品牌的好感度。从长期来看,持续输出优质的 GEO 内容,有助于品牌在 AI 答案引擎中树立权威形象,沉淀品牌认知度和信任度。随着 AI 技术的不断发展,GEO 在未来的商业活动中将发挥更为关键的作用。

    • 行业影响与挑战

    GEO 的兴起给各行业带来新的机遇和挑战。一方面,推动行业内容质量的整体提升,促使品牌提供更权威、准确的内容;对于中小品牌而言,更是提供凭借优质内容快速获得曝光的机会。另一方面,AI 答案引擎算法的不透明性,使优化工作需要不断尝试和探索;若众多品牌采用相似的 GEO 策略,容易导致内容同质化,难以形成差异化竞争优势。

    GEO 方法解析

    • 核心技术揭秘

    AI 答案引擎在工作时,首先通过爬虫技术抓取内容,倾向于抓取来源权威(如官方网站、行业知名平台)、格式清晰(如结构化文档、分点论述的内容)的信息。接着,用自然语言处理(NLP)技术分析内容,提取核心信息,判断准确性和相关性。依据 “优先级规则” 筛选内容,将满足权威性高、信息准确、贴合用户需求的内容整合到生成式回答中。用户在进行 GEO 优化时,应着重提升内容的可抓取性、可理解性和优质性。

    •  AI 答案的生成过程

    AI 答案的生成包含信息整合、逻辑组织和语言生成三个阶段。在信息整合阶段,AI 根据用户搜索关键词筛选相关信息,符合权威、准确、相关特点的内容会被优先选取。逻辑组织阶段,AI 按照用户需求逻辑对信息进行排序。语言生成阶段,AI 将组织好的信息转化为自然流畅的回答,简洁精准的内容更易被引用或改写。要使内容更好地融入 AI 答案,需在这三个阶段提高适配度。

    • 法律与道德考量

    在实施 GEO 策略时,必须严格遵守法律规定和道德准则。法律方面,要注重版权保护,不能抄袭盗用他人内容,引用时需注明出处;涉及品牌宣传和产品推广的内容,要符合《广告法》要求,不得使用绝对化用语和进行虚假宣传。道德层面,不能为了被 AI 选中而生成低质、重复的内容,干扰 AI 回答的准确性;内容要真实客观,尊重用户权益,特别是在医疗等特殊领域,要确保信息的专业性和安全性。

    GEO 内容创作

    • 权威性与 E-E-A-T

    E-E-A-T 是评估内容质量的重要框架,同样适用于 GEO。E(Experience)代表经验,创作者最好具备相关领域的实践经验;E(Expertise)表示专业度,内容应体现专业知识;A(Authoritativeness)指权威性,内容来源要可靠;T(Trustworthiness)是可信度,内容要有事实依据。提升内容 E-E-A-T 的方法包括添加创作者介绍、引用权威来源、加入真实案例等。

    •  内容结构与格式

    为让 AI 能轻松读懂内容,创作时要注意结构和格式。标题应清晰包含核心关键词,明确内容主题。采用分点论述的方式组织内容,避免大段文字堆砌。通过加粗、下划线等方式突出关键信息,且不要过度装饰。保持格式统一,减少 AI 理解内容的干扰因素。

    • 内容差异化策略

    在众多 GEO 内容中,实现差异化能提升竞争力。从角度差异化入手,选择小众但有价值的内容角度;尝试形式差异化,采用 AI 偏好的新型内容形式,如流程图、对比表等;或提供价值差异化,分享独家信息,如实践总结的技巧、内部数据统计的行业趋势等。

    GEO 问答

    按 “认知 – 方法 – 技术 – 应用 – 效果 – 挑战 – 趋势” 7 个维度,回应实践中常见问题。
    • 基础认知:“所有行业都需要做 GEO 吗?”“GEO 会取代传统 SEO 吗?”;
    • 方法论与实践:“如何判断内容被 AI 收录?”“内容更新频率如何设定?”;
    • 技术与工具:“新手适合哪些 GEO 工具?”“无技术基础能做 GEO 吗?”;
    • 效果与衡量:“GEO 效果用什么指标衡量?”“多久能看到效果?”;
    • 挑战与误区:“如何应对 AI 算法不透明?”“避免哪些内容优化误区?”;
    • 未来趋势:“GEO 技术会如何发展?”“行业应用方向有哪些?”。

    GEO 论文

    以核心论文《GEO:生成式引擎优化》为切入点,解读 GEO 的底层逻辑,例如:GEO 的本质是 “人机协同”(AI 需优质人类内容作为素材)、“语义相关性比关键词匹配更重要”(AI 更看重内容贴合用户需求而非关键词堆砌)、“品牌信息一致性助力长期权威”(多平台内容一致可提升 AI 对品牌的信任度),为深度研究者提供理论参考。

    白皮书关键内容提炼:必掌握的 10 个核心要点

    • GEO 的核心: “让内容进入 AI 回答”,而非 “让网页排到搜索结果前列”;
    • 与传统 SEO 的核心差异:优化对象从 “搜索引擎算法” 变为 “AI 内容理解 / 生成算法”,用户触达从 “跳转网页” 变为 “直接读 AI 回答”;
    • 商业价值核心:抢占 AI 搜索流量入口、降低用户决策成本、长期沉淀品牌权威;
    • AI 选内容的三大偏好:来源权威、结构清晰、信息优质;
    • E-E-A-T :内容权威度的核心标准,四要素缺一不可;
    • 内容结构化是 AI 适配的关键:分点、标题、突出重点,格式统一;
    • 差异化是 GEO 内容突围的关键:角度、形式、价值三方面找差异;
    • 效果衡量三指标:曝光量(被 AI 引用次数)、转化率(引导用户行为)、权威度(被引用 / 优先选择频率);
    • 新手实操门槛低:无需复杂技术,掌握 “权威 – 结构化 – 差异化” 原则即可入门;
    • 长期趋势:GEO 将与品牌营销深度融合,技术会更适配垂直行业、服务更轻量化。

    白皮书的地址

    • 地址:https://yaojingang.feishu.cn/docx/Jv85dXAeZoKJ7exJi4Yc4Edrnhf

    白皮书的适用人群

    • 企业决策者与管理者:需要了解 GEO 行业发展现状、核心技术,以便为企业制定战略决策,在复杂的 AI 生态中精准定位,实现可持续增长。
    • 市场营销人员:掌握 GEO 优化实战方法,可优化内容表达方式,让 AI 主动推荐企业内容,在微信、抖音、知乎等 AI 对话场景中精准触达用户,提升品牌影响力与营销效果。
    • 中小企业从业者:中小企业预算有限、技术资源匮乏,白皮书提供的轻量化 GEO 服务相关信息,能帮助用户用较低成本快速验证 GEO 效果,探索适合自身的发展路径。
    • 行业研究人员:借助白皮书对 GEO 行业的深度剖析,了解行业动态、技术发展趋势以及市场参与者的情况,为研究提供参考依据。
  • 谷歌推出Nano Banana官方使用指南,6条提示词模板

    prompting-nano-banana

    认识一下Nano Banana(又名Gemini 2.5 Flash Image):这是我们最新、最快速且最高效的模型。其原生多模态架构可同步处理文本和图像,解锁对话式编辑、多图像组合与逻辑推理等强大功能。

    您可以通过官方文档中的代码尝试这些功能,或立即登录Google AI Studio(ai.studio/banana)开始创作。

    您可以通过以下核心功能实现创作:

    • 文本生成图像:根据简单或复杂的文字描述生成高质量图像。
    • 图像+文本编辑:上传图像并结合文本指令添加、移除或修改元素、改变风格或调整色彩。
    • 多图融合与风格迁移:通过多张输入图像组合新场景或将某种风格迁移至其他图像。
    • 迭代优化:通过多轮对话逐步调整图像细节,直至完美呈现。
    • 文字渲染:生成包含清晰精准文字的图像,特别适用于标志、图表和海报设计。

    推荐阅读:全网最全Nano Banana 玩法教程大全,附4个免费使用方法

    本指南将教您如何编写提示,并提供一些说明,帮助您从 Gemini 2.5 Flash 中获得最佳效果。一切都遵循一个基本原则:

    描述场景,不要仅仅列出关键词。模型的核心优势在于其深厚的语言理解能力。与一连串不相关的字词相比,叙述性描述段落几乎总是能生成更好、更连贯的图片。

    从文本创建图像

    生成图像的最常见方式是描述您想要看到的内容。

    1.逼真的场景

    对于逼真的图片,请使用摄影术语。提及拍摄角度、镜头类型、光线和细节,引导模型生成逼真的效果。

    模板:以[环境]为背景的[主题]、[动作或表情]的逼真[镜头类型]。场景由[灯光描述]照亮,营造[情绪]氛围。使用[相机/镜头细节]拍摄,突出[关键纹理和细节]。图像应采用[宽高比]格式。

    示例提示:一张写实的特写肖像,描绘了一位年长的日本陶艺家,他脸上挂着温暖而睿智的微笑,脸上布满了深深的皱纹。他正仔细地端详着一只刚刚上釉的茶碗。背景是他那充满乡村气息、阳光普照的工作室。柔和的金色阳光透过窗户洒进画面,照亮了画面,凸显了陶土的细腻质感。这张照片使用85毫米人像镜头拍摄,背景虚化效果柔和,显得格外模糊。整体氛围宁静而精湛。竖向人像拍摄。

    一位年长的日本陶艺家的照片级写实特写肖像…

    2. 风格化插画和贴纸

    如需创建贴纸、图标或素材资源,请明确说明样式并要求使用透明背景。

    模板:一个 [主题] 的 [风格] 贴纸,包含 [主要特征] 和 [配色方案]。设计应包含 [线条样式] 和 [阴影样式]。背景必须为白色。

    示例提示:一张卡哇伊风格的贴纸,画着一只戴着小竹帽的快乐小熊猫。它正在咀嚼一片翠绿的竹叶。该设计采用大胆清晰的轮廓、简单的卡通渲染和鲜艳的配色。背景必须为白色。

    一张可爱风格的贴纸,上面是一只快乐的小熊猫…

    3.图片中的文字准确无误

    Gemini 在渲染文本方面表现出色。清楚说明文字、字体样式(描述性)和整体设计。

    模板:为[品牌/概念]创建[图片类型],并在[字体样式]中添加[待渲染文本]文本。设计应为[样式描述],并搭配[配色方案]。

    提示:为一家名为“The Daily Grind”的咖啡店设计一个现代简约的标志。文字应采用简洁、粗体的无衬线字体。设计应以简洁、风格化的咖啡豆图标为特色,并与文字无缝衔接。配色方案为黑白。

    为一家名为“The Daily Grind”的咖啡店设计一个现代简约的徽标…

    4.产品模型和商业摄影

    为电子商务、广告或品牌宣传制作清晰专业的商品照片。

    模板:一张高分辨率、工作室灯光下的产品照片,照片中[产品描述]位于[背景表面/描述]之上。灯光采用[照明设置,例如三点柔光箱设置],以达到[照明目的]。拍摄角度采用[角度类型],以展现[特定功能]。超逼真,清晰对焦[关键细节]。[宽高比]。

    示例提示:一张高分辨率、工作室灯光下的产品照片,展现了一个极简主义的哑光黑色陶瓷咖啡杯,放置在抛光混凝土表面上。灯光采用三点式柔光箱设置,旨在营造柔和的漫射高光,并消除刺眼的阴影。相机角度略微抬高了45度,以突出其简洁的线条。画面极其逼真,清晰地聚焦于咖啡升腾的蒸汽。方形图像。

    一张极简陶瓷咖啡杯的高分辨率产品照片,采用工作室灯光…

    5.极简风格和负空间设计

    非常适合用于创建网站、演示或营销材料的背景,以便在其中叠加文字。

    模板:极简主义构图,单一[主体]位于画面[右下/左上/等等]。背景是一块巨大的空白[彩色]画布,营造出显著的负空间。柔和细腻的灯光。[宽高比]。
    示例提示:一幅极简主义的构图,画面右下角是一片精致的红色枫叶。背景是一块巨大的空白灰白色画布,为文字营造出明显的负空间。柔和的漫射光从左上角照射进来。方形图像。
    一幅极简主义构图,画面中只有一片精致的红枫叶…

    6.连续艺术(漫画分格 / 故事板)

    以角色一致性和场景描述为基础,为视觉故事讲述创建分格。

    模板:采用[艺术风格]风格的单幅漫画画板。前景为[人物描述和动作]。背景为[场景详情]。画板内有一个[对话/标题框],其中包含[文本]文字。灯光营造出[氛围]氛围。[宽高比]。
    示例提示:一幅漫画书,采用粗粝的黑色艺术风格,以高对比度的黑白墨水绘制。前景中,一位身穿风衣的侦探站在闪烁的路灯下,雨水浸湿了他的肩膀。背景中,一家荒凉酒吧的霓虹灯招牌映照在水坑中。顶部的标题框写着“这座城市曾是一个难以保守秘密的地方”。光线刺眼,营造出一种戏剧性而忧郁的氛围。风景。
    采用粗犷的黑色电影艺术风格的单幅漫画书画面…
  • 全网最全Nano Banana 玩法教程大全,附4个免费使用方法

    谷歌最新发布的AI图像生成模型 Google Gemini 2.5 Flash Image (Nano Banana),靠一致性和飞快的生图速度,在各大平台持续霸屏。

    我也每天都收到群友催更:K姐快介绍 Nano Banana 玩法啊,这个太牛了。

    这篇我们就一起来聊一聊 Nano Banana。内容主要包含3个部分:Nano Banana 核心团队的技术解读、Nano Banana 的种玩法,以及可以免费用 Nano Banana 的5种方法。

    欢迎大家评论区补充、交流~

     

    01. Nano Banana 技术揭秘

     

    在最近《Release Notes》的访谈里,邀请到了 Nano Banana 的4位核心团队成员,帮助我们更好地了解 Nano Banana 关键功能背后的技术:

    原生图像生成

    Nano Banana 的核心突破是原生图像生成,能在生成过程中不断参考上下文,一步步完成复杂任务。

    和传统的文生图工具不同的是, Imagen 更像是单点高手,而 Nano Banana 是全能型选手,可以跨模态、支持复杂交互。

    这也将是团队的发展方向:未来模型不仅要画得漂亮,还要有更强的理解和推理能力。

    角色与场景的一致性

    一致性是 Nano Banana 的另一个亮点。过去的模型在编辑图像时常翻车,比如我只是想换个窗帘,结果床和沙发也跟着变了,又或是给人物图像换个角度,就换了张脸。

    这次团队现场演示了一个案例,用主持人的脸部特写,生成一张他穿着巨大香蕉服的全身图像。

    prompt:zoom out and show him wearing a giant banana costume.keep his face visble.

    提示词:拉远镜头,展示他穿着巨大的香蕉服装,确保脸部可见。

    Nano Banana 一致性保持得非常好,脸依旧是那张脸,但场景、服装都完全换掉了,画面还非常自然,整个生成过程也就十多秒。

    另一个细节是,Gemini 团队和 Imagen 团队的合作,让图像更自然。以前的结果有时像“贴上去”的,现在已经能做到整体连贯。

    文本渲染

    很多人可能觉得“在图里写几个字”没什么大不了,但 Nano Banana 把文本渲染当做长期的核心指标。他们认为:文字是结构化的内容,如果模型能够学会如何处理文本,也能掌握图像中的纹理等更复杂的结构。

    目前 Nano Banana 对一些简单的文字渲染效果很好,但是也存在一些不足。

    prompt:now write”Gemini nano”on the image.

    提示词:在图片上写“Gemini nano”

    几年前几乎没有模型能把文字处理好,哪怕是很短的提示词都经常崩。于是 Nano Banana 团队决定长期跟踪这个指标,无论做什么实验,只要持续观测,就能避免性能退步。他们发现,很多看似无关的改动,也会在文本渲染上产生提升。

    团队其实是从“找模型的短板”开始,慢慢摸索出一条能推动整体质量进步的路径。

    理解力与创造性

    Nano Banana 具备世界知识,能够理解模糊的指令,还能发挥一些创造力。

    团队在访谈中提到一个很有意思的概念——报告偏差(reporting biases)。比如,当你去朋友家做客,回来后和别人聊天,几乎不会提到他们家里那张普通的沙发。但如果给别人看照片,画面是有沙发的。

    所以,我们想真正了解世界,通过文本可能需要更多描述,而视觉信号就像是理解世界的捷径,可以直接把环境、物体、关系展现出来,不需要额外解释。

    理解和生成就是这样相辅相成的。模型在读懂图像和语言的过程中,积累了更扎实的世界知识,也因此能在创作时更稳定、更自然。有时候甚至能生成超出用户预期的内容

     

    02. Nano Banana玩法大全

     

    从热门玩法、单图、多图以及生成视频的多种玩法。欢迎补充~

    热门玩法

    1.将任意图片变成手办

    prompt:turn this photo into a character figure. Behind it, place a box with the character’s image printed on it, and a computer showing the Blender modeling process on its screen. In front of the box, add a round plastic base with the character figure standing on.

    将这张照片转化为一个角色形象。在其背后放置一个盒子,盒子上印有该角色的图像,盒子上方的电脑屏幕上显示Blender建模过程。在盒子前方添加一个圆形塑料底座,角色形象站立其上。

    2.根据地图画出真实场景

    prompt:draw what the red arrow sees.

    提示词:画出红箭头所看到的东西。

    Draw a DEM with contour lines.

    draw the real world view from the red circle in the direction of the arrow.

    绘制带有等高线的数字高程模型

    从红圈处沿箭头方向绘制真实世界视图。

    以上案例来自X博主 @Simon

    3.卡通变现实

    prompt:Depict as a live big budget costume test on set, shot on film.

    Variant Prompt: For easier additional editing.Depict as a live big budget costume test on set, shot on film against green screen.

    描绘成在片场进行的大预算服装试穿,使用胶片拍摄。

    变体提示:为了更轻松地进行额外编辑,描绘成现场的大预算服装测试,在片场拍摄,使用胶片对绿幕拍摄。

    以上案例来自 X 博主@Brent Lynch

    4.360度产品展示

    prompt:This exact car in this exact environment.

    Change Perspective: Perfect side angle view.

    这辆汽车及其确切环境。

    改变视角:完美的侧面角度视图

    生成不同视角的图片后,用可灵2.1通过首尾帧生成视频。

    以上案例来自 X 博主@Rory Flynn

    5.修复老照片

    prompt:Restore and colorize the picture without altering, removing, or adding any detail or element.

    提示词:恢复图片着色,但不要改变、删除或添加任何细节或元素。

    以上案例来自X博主 @Rodrigo Bressane

    6.等距3D视图

    将设计图纸变为3D视图。

    以上案例来自X博主 @levelsio

    从2D图纸到3D模型,看起来挺惊艳的。不过目前反馈生成的图像还不够精准,比如会比较模糊、窗户的位置会不准确。

    7.切换视角

    prompt:aerial perspective of a camera behind the blurry ceiling fan looking down at the girl sitting in an hospital waiting room.

    一个模糊吊扇后面的相机从上方俯视坐在医院候诊室的女孩的空中透视。

    单图编辑

    1.改文字

    提示词:把图片中的文字改为:你为什么不问问神gemini呢

    2.改服饰

    提示词:把人物的衣服改为羽绒服。

    3.参考人物生成场景

    提示词:让图中人物与海绵宝宝共进晚餐。

    4.消除

    提示词:移除图片左边的人物。

    5.更改元素

    提示词:把图片背景中Twitter的旧logo换成现在的X形状logo。

    6.模糊指令理解

    提示词:让图片中的人物看起来像印第安人。

    7.换背景

    第一步用绿幕替换背景,后续更换背景效果会更好。

    prompt:Replace the background with a solid color green screen

    提示词:用纯色绿色屏幕替换背景

    prompt:replace the background with the attached image.  Make sure [subject] is lit to match the image;

    replace the background with [describe your scene].  Make sure [subject] is lit to match the scene.

    提示词:用附加的图片替换背景。确保[主体]的照明与图片匹配。

    用[描述你的场景]替换背景。确保[主体]的照明与场景匹配。

    8.用 Nano Banana 做室内设计

    原图:

    Nano Banana “装修”后:

    9.真实场景变成游戏素材

    prompt:Concisely name the key entity in this image (e.g. person, object, building). Create 3d pixel art of the isolated key entity in isometric perspective, 8-bit sprite on a white background. No drop shadow.

    提示词:简洁地命名图片中的关键实体(比如,人物、物体、建筑。)以等视角创建独立的3D像素元素,8-bit透明图,没有阴影效果。

    10.将城市建筑变成3D

    【】中的内容根据实际城市修改即可。

    prompt:Turn this photograph of a 【Parisian building】 into a isometric tile, in the style of the five other 3D.

    提示词:将这张图片中的巴黎建筑转化为3D等距模型。

    以上案例来自 X 博主@Emm | scenario.com

    多图修改

    1.姿态参考

    Prompt: take the anime man and woman in the first image and put them in the poses of the stick man in blue and stick woman in red. erase the stick figures.
    提示词:将第一张图中的动漫男性和女性放置成蓝色小人男和红色小人女的姿势,并擦除小人。

    以上案例来自 X 博主@Justine Moore

    prompt:Model pose like the sketch.

    提示词:模特姿势变得像草图一样。

    2.图像位置参考

    直接在图中标记位置,Nano Banana 就可以生成准确的图像。

    3.漫画
    准备角色参考的图片,三视图缺一不可。 

    标记分区

    在图中加入提示词,生成漫画:

    以上案例来自 X 博主@けいすけ / AIマンガ&開発

    4.元素融合
    使用 Nano Banana 将 13 张图像合并成一张图像。

    prompt:A model is posing and leaning against a pink bmw. She is wearing the following items, the scene is against a light grey background. The green alien is a keychain and it’s attached to the pink handbag. The model also has a pink parrot on her shoulder. There is a pug sitting next to her wearing a pink collar and gold headphones.

    提示词:一个模特靠着粉色的宝马,浅灰色背景,她穿戴着以下物品:绿色外星人是钥匙扣,挂在粉色的手提包上,模特肩上还站着一只粉色的鹦鹉。旁边有一只贵宾犬,它带着粉色的项圈和金色的耳机。

    此案例来自X博主 @Travis Davids

    系列IP/动漫角色

    比如,我们有这样一张角色图像。

    prompt:First, please set up the basic color palette and the shadows and saturation.

    提示词:首先,请设置基本色板和阴影与饱和度。

    prompt:Next, please do the character model sheet.

    接下来,请制作角色模型表。

    prompt:Next, please provide the [basic action set].

    接下来,请提供基本动作集。

    prompt:Please give me the costume design set.

    提示词:请给我服装设计套装。

    prompt:Please make an expression sheet.

    提示词:请制作表情表。

    将图像转为线稿,再使用品牌色上色

    步骤:

    – Prepare the original image

    – Convert to line art

    – Color the line art with a color palette

    – Change the character to brand colors

    – 准备原始图像

    – 转换为线稿

    – 使用调色板为线稿上色

    – 将角色改为品牌色

    视频(分镜)创作

    1.第一人称骑马漫步二十世纪。

    先用 Nano Banana 生成各种场景:

    prompt:dashcam google street view shot | Hobbiton streets | hobbits carrying out daily tasks like gardening and smoking pipes | sunny day.

    提示词:行车记录仪谷歌街景拍摄丨霍比特镇街道丨霍比特人进行日常任务,比如园艺和抽烟丨晴天

    prompt:dashcam google street view shot | Seat of Seeing on Amon Hen | Ruined pavilion atop the hill, a hobbit-like figure from behind climbing the steps, the winding path down visible overlooking the river and lands beyond | panoramic view under emerging stars at dusk.

    提示词:行车记录仪谷歌街景拍摄丨阿蒙·亨的观视之座山顶残破的亭阁,一个霍比特人般的身影从后面攀爬台阶,可见蜿蜒下行的路径,俯瞰着河流及远处的土地,傍晚时分,星光初现下的全景视角。

    用提示词创建骑马的第一人称视角图片:

    prompt:dashcam google street view shot

    提示词:第一人称视角在草地上骑马。十二世纪

    用可灵2.1的首尾帧动画来生成视频片段。

    prompt:”scene_description”: “The rider gallops out from the ruins of the ivy-covered statues, leaving the storm-lit plains behind. The path winds through rugged terrain as the pace remains fast. Ahead, a towering dark castle glows with eerie green light atop jagged cliffs, its spires piercing the stormy sky. Cloaked figures march steadily toward the fortress across a massive stone bridge.”,  “visual_style”: “dark epic fantasy, cinematic, continuous POV”,  “camera_movement”: “smooth forward gallop, first-person view without cuts, transitioning naturally from the ruined statues across the plains to the castle bridge”,  “main_subject”: “the white horse’s head and rider’s gloved hands, centered as they race toward the looming fortress”,  “background_setting”: “storm-darkened mountains and cliffs, a vast stone bridge spanning a deep chasm, leading to the glowing green-lit castle”,  “lighting_mood”: “ominous twilight with green highlights from the fortress and flashes of distant lightning”

    prompt:”scene_description”: “The rider gallops out from the ruins of the ivy-covered statues, leaving the storm-lit plains behind. The path winds through rugged terrain as the pace remains fast. Ahead, a towering dark castle glows with eerie green light atop jagged cliffs, its spires piercing the stormy sky. Cloaked figures march steadily toward the fortress across a massive stone bridge.”,  “visual_style”: “dark epic fantasy, cinematic, continuous POV”,  “camera_movement”: “smooth forward gallop, first-person view without cuts, transitioning naturally from the ruined statues across the plains to the castle bridge”,  “main_subject”: “the white horse’s head and rider’s gloved hands, centered as they race toward the looming fortress”,  “background_setting”: “storm-darkened mountains and cliffs, a vast stone bridge spanning a deep chasm, leading to the glowing green-lit castle”,  “lighting_mood”: “ominous twilight with green highlights from the fortress and flashes of distant lightning

    将这些视频剪辑到一起,就生成了这条长穿越效果的视频。

    此案例来自X博主 @TechHalla

    2.涂鸦-3D图像-视频

    此案例来自X博主 @Alex Patrascu

    3.让名画中的人物在现实世界中相遇

    此案例来自X博主 @Alex Patrascu

    4.AI动漫

    此案例来自X博主 @Framer

     

    03. 怎么使用Nano Banana

     

    谷歌Gemini(需要Pro会员)

    Gemini 官网首页,选择 Gemini 2.5 Pro 模型,在对话框中选择 Tool 中的 Create images。

    此时默认使用的就是 Nano Banana 模型。

    上传图片,输入提示词,即可使用。

    谷歌 AI Studio(免费)

    打开Geogle AI Studio 网站,点击右上角的设置。

    在设置中选择Nano Banana。

    上传图片,并输入提示词,就可以啦。

    LMArena(免费)

    LMArena 首页上方选择 Direct Chat 模式。

    继续选择 gemini-2.5-flash-image-preview(nano-banana)模型,就可以直接使用啦。

    Lovart(限时免费)

    点击 Lovart 首页的 Nano Banana 模型入口。

    就可以直接使用 Nano Banana 模型啦,不过免费有期限,9月2日截止。

    Freepik

    首页轮播图有 Google Nano Banana 入口,直接点击进入。

    官网:Freepik

    选择 Nano Banana 模型,即可免费使用,每天可以免费生成10张图片。

     

    04. 一些分享

     

    以往做一套高质量、细节统一的图,得有专业技能,还要花大量的时间。

    现在用 Nano Banana,只用一句简短的指令,你说的,它十几秒都能联想并复现出来。

    受冲击最大的,是内容行业。现在真正敢用 AI 来做广告创意的公司还不多,但这之后,可能就大不一样了。

    品牌一句 prompt,几小时内就能生成几十版广告创意。

    动漫、短剧也是一样,过去得靠整个团队几个月才能磨完的细节,以后可能一个人就能边改边出片。

    未来可能会“按需生成”的剧情——观众一刷弹幕,模型立刻接着往下编。

    内容创作都会进入一种全新的生产方式。

    原文链接:Nano Banana全网最全玩法大全(附4个免费白嫖方法)

  • 如何用AI生成小程序/APP/网站,码上飞一句话自动开发上线

    有的时候时候想卖一点二手的东西,但是看遍各种平台,不是要手续费就是要各种入驻费,主流平台对虚拟商品也有限制。

    我决定自力更生,教大家做一个卖货平台,可以省一笔平台手续费,卖个人的知识与服务也更方便。

    虽然我是个小白,不会敲代码,也不懂前后端架构设计,不过我发现了一个特别适合我的开发工具——码上飞。

    我只需要像聊天一样说出需求,码上飞就能自动生成完整的应用、小程序或H5页面,做出来的效果真的超乎我的想象。

     

    01. 用手机开发小程序

     

    打开码上飞平台(手机端和电脑端都能用),每天有免费开发次数。

    我们在对话框中直接输入我想要的功能。比如:

    做一个个人商店,用户可以通过商店,购买我上架的商品。 包含实物:水果; 虚拟货物:我提供的个人服务,比如30分钟咨询;一对一教学;资源资料。

    码上飞会立马化身产品经理,给我整理出需求文档。设计风格、功能、交互逻辑都理得清清楚楚。

    我觉得内容非常符合我的需求,而且特别全面,就可以确认让码上飞开始开发。

    码上飞会提供一整个项目组,从产品经理、测试经理到架构师都有,他们会帮我从各个方面完善应用。

    只需要几分钟,码上飞就完成了架构设计、开发、测试的一系列工作。

    我们点击立即体验,看看实际效果。

    首页做了热门推荐,商店内产品有水果和服务两个分类,可以加车或者下单。

    我想要的功能基本都实现了,但是排版和商品的细节需要再完善一下。

    我们可以通过对话让它优化功能和排版

    比如首页的热门推荐和为您推荐内容重合了,我们可以直接让他去掉热门推荐。

    码上飞会先理解我的需求,然后整理成清晰的修改方案,让我确认。再次生成后,页面就从左边变成右边的样子。整体改变很符合我的要求。

     

    02. 提供运营管理后台

     

    码上飞不止会给我们生成前端,同时也会给我们生成运营后台。

    在后台我们可以看到在线商品、订单等信息,编辑商品信息、修改库存之类的都很方便。

    应用做完之后,我们点击右上角的发布,就可以一键发布为小程序、应用或者手机网页。

    可以通过二维码分享,让更多人为你的应用提出建议,从而优化的更好。

    运营后台和发布需要在电脑网页端操作~

    (扫一扫,即可体验)

     

    03. 一些分享

     

    传统开发需要学习复杂的编程语言、配置繁琐的开发环境等等,码上飞的出现,普通人都能用手机开发APP,直接打破这层技术壁垒,开发APP也像手机P图一样,人人可用了

    未来开发的核心竞争将从“能否实现”转变为“创意是否足够好”。想法有多妙,做出来的东西就有多妙。

    每个人都能是开发者:

    • 老师可以为自己班级快速开发一个背单词的小程序;
    • 咖啡店店主可以为自己店铺做会员积分APP;
    • 设计师可以为自己做一个展示作品集的H5网页;

    就像以往只有出版社才能出书,而现在每个人都能用手机发文章。这并不意味着专业作家会消失,但整个出版业、传媒业和我们信息获取方式都彻底改变了。

    APP开发的未来,也正是如此。

    原文链接:用手机开发APP ?我用码上飞做了一个“K姐小卖部”

  • 如何自定义AI配音音色,MiniMax语音“音色设计”一句话生成

    最近我发现了一个给视频配音的邪修思路。用 AI 就能生成真人感满满的声音。

    事情是这样的——前几天我终于有时间,抽空剪了第一条视频,信心满满地发给朋友帮我把把关。

    他看完沉默半天,只回了两句:很牛逼!就是普通话…差点意思。

    谁懂啊!作为一个从小到大N、L不分、平翘舌不分的湖北人,我已经反复练过几遍,还特地放慢了语速,结果听起来还是不对。

    俺是真没招了。

    就在这时,我想到了一个邪修思路——既然真人发音练不明白,那就干脆交给 AI 吧。

    笑死,用 MiniMax语音配完音之后,朋友居然完全没听出来这是 AI 的声音。

    普通的 AI 配音人机味太重!MiniMax语音发音的抑扬顿挫、情绪就拿捏得很到位,听起来就像是真人在说话。

    今天就跟大家分享一些我自己摸索出来的邪修配音小技巧~无论是自己录视频、博客,语音相关的内容,都能派上用场。

     

    01. 一句话捏一个专属声音

     

    月初的时候,MiniMax发布了他们最新的语音生成模型Speech 2.5,主要升级了2个点:语言表现力更强,多语种能力更全面。

    用法很简单,我们打开MiniMax语音首页,直接输入文本,几秒钟就可以生成一段非常逼真的音频。

    MiniMax语音内置了300多种预设音色,各种语种、口音、性别、年龄几乎全覆盖。从广告旁白到儿童动画,都能找到合适的声音。

    但真正吸引我的,是它的音色设计功能。

    只需要一句话描述,就能生成一个有情绪、有特点的 AI 声音,开口就是满满的真人感。

    关于音色设计提示词,有一个万能公式:[角色身份] + [声音质感] + [语速/节奏] + [情绪状态] + [场景/用途]

    比如输入:

    提示词:儿童动画片中的活泼小朋友,声音清脆稚嫩,语速轻快跳跃,充满好奇与快乐,用于演绎卡通冒险故事。

    一个适合儿童动画角色的声音就生成好啦。

    儿童故事

    声音清脆稚嫩,语速轻快,短短一句话里,就把惊讶、开心、兴奋的情绪变化自然串联起来,让角色听起来生动有趣,充满感染力。

    我们经常刷到的yxh视频、影视解说配音,其实都可以直接用 MiniMax 语音生成。生成的声音情绪很饱,不会有那种死气沉沉的人机味。

    如果不想自己写提示词,也可以直接点击首页导航栏的对话,让 MiniMax M1 帮我们生成提示词。

    提示词:我要设计一个用于解说古装大女主剧的音色,女声,请根据这个提示词生成公式,为我生成一句话提示词:[角色身份] + [声音质感] + [语速/节奏] + [情绪状态] + [场景/用途]。

    比如,市井集市中热情吆喝的小贩,声音响亮,带地方口音,充满生活气息。

    从 MiniMax M1 生成的提示词中,挑选一个觉得比较合适的,就可以直接用于生成音色。

    提示词:宫廷贵妃雍容华贵的独白,声音华丽而富有磁性,带有轻微的回音效果,语速缓慢而优雅,节奏舒缓,富有韵律感,情绪高贵而从容,带有淡淡的忧伤和沉思,用于角色内心独白或回忆往昔。

    每次它会生成3种音色供我们选择,我们可以分别试听,如果对3种音色都不满意,可以选择重新生成,直到我们满意为止。这个过程是完全不消耗积分的哦!

    我用这个声音做一个热播剧的解说视频,一起试听一下音色效果:

    确认选择一种音色之后,我们给音色命名,打上标签。

    之后每次使用文本转语音功能,都可以选择用这款音色生成配音。音色一致性的问题就这么轻松搞定~

    相当于每个人都可以拥有随时在线、能模拟各种人声音色的声优伙伴!

    不管是做自媒体视频,还是广告配音、广播播音…这都是实打实的降本增效。

    配音时,打开长文模式,单次最多能生成200000字符的音频,相当于可以把《三体·地球往事》这样一部长篇小说,一次性转为有声读物。

    我就很喜欢一边干活一边听悬疑故事,感觉比刷短视频还上头。

    悬疑故事

     

     02. 让声音更自然的小技巧

     

    MiniMax语音有一个调试台,同样的音色,我们可以通过调试台做出不同的声音效果,让音频与使用场景更贴合。

    语速、声调、音量这些算是最基础的调整了,我也摸索出一些小经验~

    比如,年轻人的声音语速可以稍微加快一些,听起来更贴近现实,也比较适合当下短视频这样快节奏的内容。

    老人说话语速可以放慢一些,娓娓道来,更有故事感。

    更牛的是,MiniMax语音能让声音拥有情绪,即使是同一个音色,也能表达出开心或悲伤;

    提示词:

    开心: 哇塞,这也太棒了吧!我等这一刻等好久了!

    难过: 唉,咋会这样啊,我真有点撑不住了……

    生气: 你到底要我说几遍?别再这样了!

    害怕: 刚刚那扇门自己动了一下,我觉得背后凉飕飕的……

    厌恶: 哎呀,这味儿太冲了,我闻着都想吐。

    惊讶: 啊?你开什么玩笑?这事居然是真的?

    我们还可以对声音做更细微的调节,比如让声音更低沉,或者更柔和;还可以配合各种场景特效,电音、空旷回声等。

    MiniMax语音不光能说普通话,还能切换粤语,甚至四十多种语言。

    一个音色,可以演绎完全不同的“表演效果”。

    顺带提一句,MiniMax 的积分还挺耐用的。现在注册就可以白嫖 1w 积分,我跑这么多 case 也才花几百积分。

    不过要注意,商用许可是需要会员才能解锁的,如果打算把作品对外发布或者生成商业内容,这一步是必须的。

    会员价格也不高,差不多一顿外卖的钱,就能解锁全部功能,还是挺划算的。

     

    03.一些分享

     

    MiniMax 语音 让声音也能可控可设计,降低了创作门槛,同时也在重塑声优的职业边界。

    未来,声音也会成为创作者经济的重要组成部分。

    就像做海报需要设计师,拍视频需要导演,配音也不再是附属品,而是作品里独立、核心的表达维度。

    MiniMax 语音在做的,不只是一个会读稿的AI机器,而是一个声音调音台。创作者可以随心所欲地捏音色、调情绪,就像调色、剪辑一样,把声音当作创作素材。

    声音的可控化,意味着未来播客、小说、虚拟人,甚至音乐创作,都会有一套全新的玩法。

    声音,正在从工具变成内容本身。

    原文链接:苦练普通话,不如用AI配音邪修

  • a16z发布第五版《全球前100名Gen AI消费级应用》榜单

    a16z第五版《全球前100名Gen AI消费级应用》榜单发布。总结了过去两年半生成式AI应用的发展,包括中国AI应用的强势崛起,如多款应用跻身榜单前列且大量出海;谷歌AI产品矩阵的逐渐形成,多款产品上榜且增长迅速;通用LLM助手竞争加剧,ChatGPT虽仍领先但差距在缩小;Vibe Coding赛道兴起,用户粘性高且带动周边工具发展;榜单生态趋于稳定,新上榜应用数量变化体现这一点;及通用聊天助手、创意工具、AI陪伴三类产品在榜单中主导等趋势。

    Andreessen Horowitz( a16z )第五版《全球前100名Gen AI消费级应用》榜单出炉。

    • 网页端50强

    • 移动端50强

    这是第五版《全球前100名Gen AI消费级应用》榜单,横跨两年半的用户日常AI使用行为数据。从生态来看趋势逐渐趋于稳固。

    Web端新上榜应用仅11款,较上期(17款)显著减少。

    移动端因应用商店严打“ChatGPT套壳应用”,为新玩家腾出空间,新进入者数量(14位)略高于Web端。

    谷歌全面出击

    谷歌共计4款产品强势入围Web端Top 50:

    • Gemini:网页端排名第2,其Web流量约为ChatGPT的12%,但在移动端的差距大幅缩小(MAU约为后者一半),尤其在Android端占据绝对优势。

    • AI Studio(第10名):面向开发者的Gemini模型沙盒平台,首次亮相即冲入前十,彰显谷歌强大的开发者生态号召力。

    • NotebookLM(第13名):从Google Labs独立后,凭借其扎实的AI笔记助手定位,用户规模持续稳健增长。

    • Google Labs(第39名):作为消费者体验谷歌前沿AI(如Veo 3视频模型、Doppl试衣、Mariner智能体浏览器)的主站,在Veo 3发布后流量单月暴涨13%。

    ChatGPT领先,Grok和Meta AI奋力追赶

    在通用助手战场上,ChatGPT虽仍领先,但Grok和Meta AI正奋力追赶。

    • Grok(Web第4,移动第23):凭借Grok 4模型发布与“动漫AI伴侣”等出圈功能,移动端MAU从零激增至超2000万,展现出强大的产品与流量爆发力。
    • Meta AI(Web第46):表现相对平淡,因隐私争议导致增长乏力,未能进入移动Top 50。
    • DeepSeekClaude:移动端增速放缓,DeepSeek 较峰值下滑 22%,网页端跌幅更超 40%;Perplexity 和 Claude 仍在稳步增长。

    中国力量崛起

    中国已成为全球AI应用版图中不可忽视的一极,其影响力呈现双重路径:

    • 本土巨头主导内需市场:三款主要服务中国用户的应用跻身Web端Top 20(夸克豆包Kimi)。凭借语言、文化和合规优势,在庞大的内需市场中占据主导地位。
    • 新锐玩家“出海”征服全球:更值得关注的现象是“中国开发,全球使用”。榜单中另有约7款中国背景的应用,其绝大多数用户来自海外,甚至部分应用在中国境内无法使用。它们精准切入全球性需求,在视频生成(如KlingHailuo)、图像编辑(SeaArt, Cutout Pro)、生产力工具(Monica) 等垂直领域展现出极强的竞争力。

    Vibe Coding从概念走向成熟

    Vibe Coding(低代码/自然语言生成应用)从不温不火走向核心赛道。继上次仅有Bolt上榜后,本次LovableReplit两款主流平台双双强势入围主榜单。

    数据显示,头部平台的美国用户群展现出超100%的月度收入留存率,意味着用户持续增加付费,生态健康度极高。

    它们不仅自身成功,更带动了整个技术栈的繁荣(如数据库服务商Supabase流量随之飙升),一个崭新的开发者生态正在形成。

    全明星阵营,14家公司五期联榜

    在五期榜单中始终屹立不倒的14家“全明星”公司,横跨通用助手、陪伴、图像生成、视频编辑、语音合成、生产力工具等多个赛道。

    在这14家中,仅5家拥有自研模型,其余9家通过调用API、集成开源模型或采用聚合模式获得成功,为创业者提供多元化的成功路径。

    值得注意的是,14家公司仅来自5个国家(美、英、澳、中、法),且其中12家已获得风险投资。

    如不计入首期榜单,另有五家公司也能入选“全明星”,包括:Claude和DeepAI(通用辅助)、JanitorAI(陪伴)、Pixelcut(图像编辑)和Suno(音乐生成)。

  • TabTab邀请码 – 如何获取TabTab邀请码?附免费领取方式

    TabTab是什么

    TabTab 是全球首个全链路AI数据分析Agent,通过自然语言交互,用户只需简单描述需求,可完成从数据采集到深度分析的全流程自动化操作。支持多源数据整合,涵盖公域、私域和垂直领域数据,自动完成数据清洗、基础建模和图表绘制,显著节省时间和精力。智能多代理架构能高效调度任务,精准理解用户意图,生成详细的模型解释性报告和直观的可视化图表,如桑基图、柱状图等,帮助用户快速识别数据中的关键信息。TabTab AI 支持将分析结果导出为 Excel、PPT 和网页格式,方便用户进一步编辑和汇报。

    如何获取TabTab邀请码

    方式一:微信领取

    微信扫码关注回复: TabTab ,免费领取TabTab邀请码

    方式二:官网申请

    • 访问平台:访问TabTab官网:https://tabtabai.com/
    • 注册或登录:点击登录,进行注册或直接登录。
    • 加入等候名单:没有邀请码可点击加入等候名单,等待官方发送邀请码。
    • 填写邀请码:有邀请码可直接填写邀请码,体验使用。

    TabTab官方示例

    示例一:提取商品名称为“B商品”所有数据,把处理好的表格文件给到我

    提取前:

    提取后:

    示例二:深入分析AI玩具(如智能陪伴机器人、编程机器人、AI学习辅助玩具)在全球儿童和成人市场中的增长潜力,洞察目标用户的购买动机、偏好及对AI交互的接受程度。

  • 阿里Qoder怎么样?实测对比TRAE SOLO 和 CodeBuddy IDE

    这半年,AI IDE 的竞争越来越激烈,几乎每个月,都有人想重新定义“AI Coding”。

    这次是阿里,他们最近做了个新的AI Agentic IDE,叫 Qoder

    可以理解整个代码库,理解项目结构、抓住上下文,再根据团队的习惯和规范,给出最适配的代码。

    最关键的是,现在是预览阶段,可以免费使用,不需要邀请码!

    那如果,把同样的任务交给阿里的 Qoder、字节的 TRAE SOLO 和腾讯的 CodeBuddy IDE ,会怎么样呢?

    我用三个相同的提示词跑了一遍,一起来看看对比吧。

     

    01. Qoder——懂项目的IDE

     

    Qoder 原生支持中文,小白用户也很好上手。整体布局和VS Code 、TRAE 差不多,但真用起来,我发现 Qoder 有几个地方很不一样。

    官网:Qoder

    自动选模型

    Qoder 集成了Claude 、GPT 、Gemini 等国际主流模型,并且会根据我们的任务,自动调用合适的模型。

    预览阶段,每个人都有2000积分的免费额度,用完之后还可以继续免费使用,不过会自动切换成普通的大模型。

    三种任务模式

    用过通义灵码的友友们肯定会觉得很熟悉~

    智能问答模式下,Qoder 回答我们的问题时,不会对工程文件进行任何修改,这个模式很适合让 Qoder 给我们提供一些灵感和建议,或者做代码解读。

    智能体模式中,Qoder 会主动修改代码和执行任务,包括制定 To-do 计划、使用工具、使用 MCP 等。

    除此之外,Qoder 还有一个 Quest(AI 自主编程)模式,是专为团队解决复杂、长期的任务而设计的,适合大型任务

    支持Repo Wiki

    传统的代码库里,架构、接口设计等等信息大多是隐性的,要么是记在脑子里,要么零散地分布在各个文档里。

    Qoder 引入的 Repo Wiki,就是把这些隐性知识显性化。

    它会在读完整个代码库后,自动生成一份“项目百科”,把工程结构、依赖关系、API用法、技术债、关键决策脉络都梳理清楚。

    更方便的是,Qoder 还会生成明确的 To-do清单,随着项目演进,Wiki还能不断更新,保持和代码库保持同步。

     

    02. 实测对比

     

    月初的时候,K姐就实测对比过TRAE SOLO 和 CodeBuddy IDE。TRAE SOLO 和 CodeBuddy IDE 谁更强?编程小白上手实测

    今天咱们把同样的提示词发给Qoder,看看这三款国产 AI IDE 到底谁更强。

    小游戏

    提示词:生成一个像素风的贪吃蛇小游戏

    这个小游戏界面做得和 TRAE SOLO 风格很像,玩起来也是很流畅的。

    参考图生网页

    提示词:生成和图片一样的购物网站,风格要求柔和、舒缓、果冻感,色调以奶白、雾紫为主,整体让人有放松的感觉,动效柔和自然。

    Qoder 这个网页做得很棒,我觉得是这三个里面对原模板还原和优化最好的。

    Qoder 对页面的理解很透彻,通过静态图片就还原了网页顶部的 Banner 页设计,三大主题 Banner 页可以自动和手动切换。

    下拉页面后,精选分类、精选推荐等这些分区的设置,三者做出来都差不多。

    不同的是,TRAE SOLO 是用不同的 Emoji 图标代替了商品展示;CodeBuddy IDE 部分模块用 Emoji 代替商品图,另一部分仅保留图片占位符,没有实际渲染图片。

    Qoder 直接在页面中加载了真实的商品图,与购物网站的整体定位更加契合。

    社区小饭桌订餐网页

    提示词:帮我生成一个社区小饭桌的网页。

    用户选择自己想要的菜品、甜点、水果和饮品等等,放在自己的饭盒中。

    下单可以选择配送时间(日期和午/晚餐),填写地址;

    下单成功后会有动画显示,正在制作中…祝你用餐愉快!

    Qoder 生成的页面布局都很好看,我要求的分类和下单的交互逻辑都实现得不错!不过,页面并没有加载配套的商品图片。

    全栈开发

    提示词:做个腾讯视频首页

    首页的布局很不错,各个视频的分类也都很齐全。视频的位置都用占位符显示了。

    我们继续生成后端和数据库,方便管理网页内容。

    提示词:为我的网站匹配后端和数据库,方便我管理网站。

    Qoder 给我生成了一个后端界面,可以看到各个版面有哪些内容,但是还是不能编辑。

    我们可以继续让它一步步修改,比如,允许编辑轮播图。

    我们在后端添加一个“K姐研究社”的轮播页面展示,可以看到,我们在后端编辑后,前端页面也会实时更改。

    这下我们就可以通过后端界面,把我们想要展示的内容传到网站上啦。

    整体用下来,我感觉 Qoder 确实挺强大的,这些小项目几乎都是一次成功,而且能让我们看清它执行的每一步,很靠谱。

    这种感觉,就像身边多了一位既懂项目、又能干活的同事。

    不过,它也有一些不完美的地方,比如,有时候改一个任务会花很久,很多步骤都需要你逐个确认,也偶尔会出现交付的项目和预期不完全一致的情况,需要我们指出问题,给出明确的调整方向。

     

    03. 一些分享

     

    2年前,IDE 还只能补几行代码。

    23年下半年,IDE 有了对话式交互,可以解释bug,回答问题。

    24年11月,Anthropic 提出了 MCP,让 AI IDE 理论上能直接调用外部工具和数据库,但配置复杂,接入门槛高,很少有人真正用起来。

    再到今年5月,MCP 接口统一,只需要填个 API Key,AI IDE 就能直接调用外部工具。“一句话生成应用”、“一句话部署”慢慢成为常态。

    短短两年,AI IDE 已经翻天覆地。

    Qoder 的出现,把这场进化推向了新高度。它不再满足于“写得更快”,而是让 AI 先理解,再执行。

    这不仅仅是更聪明的 IDE,更像团队里多了个能独立负责模块的虚拟工程师。

    Qoder 代表的,是开发范式的切换。未来的团队,可能不是“人用 AI 写代码”,而是“人和 AI 并肩开发产品”。

    原文链接:横评国产AI IDE:Qoder完胜TRAE SOLO和CodeBuddy IDE吗?

  • MIT《生成式AI鸿沟:2025年商业人工智能现状》(PDF文件)

    MIT《生成式AI鸿沟:2025年商业人工智能现状》报告,基于对300多个AI项目、52个组织访谈和153位高管的调查,揭示一个核心矛盾:企业对生成式AI(GenAI)抱有极高热情并投入巨资,绝大多数(95%)都无法将其转化为真正的业务价值和转型。 普遍失败与少数显著成功之间的巨大落差,被报告定义为 “GenAI鸿沟”(The GenAI Divide)。报告系统地剖析了鸿沟的成因、表现,为组织(买家)和供应商(构建者)如何跨越这条鸿沟提供清晰的路线图。

    获取《生成式AI鸿沟:2025年商业人工智能现状》报告PDF原文件 扫码关注回复: 20250821

     GenAI鸿沟的现状

    • 高采用、低转型:像ChatGPT这样的工具被广泛试用,但能深度融入核心业务流程、引发真正变革的企业级应用寥寥无几。大多数行业并未出现预期的结构性颠覆。
    • 试点到生产的巨大落差:企业定制化的AI工具从试点到全面部署的成功率极低(仅5%),绝大部分项目停滞不前。
    • 投资错配:大部分资金流向了容易看见的前台功能(如营销),真正的投资回报(ROI)却隐藏在后台运营的自动化中(如财务、采购)。
    • “影子AI”的盛行:90%的员工私下用个人AI工具完成工作,效果和满意度远高于企业官方采购的系统,暴露了正式项目的失败。

    GenAI鸿沟的根本原因

    报告认为,鸿沟的根源不是技术、数据或法规,是“学习差距”。

    • 现有的企业AI工具大多无法学习和适应。它们没有记忆,不能从反馈中改进,无法融入具体的工作流程,每次都需要人工重新引导,显得非常“笨拙”。
    • 用户需要的是能积累知识、持续进化的智能伙伴,不是每次都要从头教起的工具。这种能力的缺失,是导致大多数项目无法规模化的核心障碍。

    跨越GenAI鸿沟的解决方案

    对于AI供应商(构建者)

    • 聚焦深度而非广度:不要做万能工具,专注于解决某个狭窄但高价值的业务痛点,并做深度定制。
    • 构建“有记忆”的系统:开发具备持续学习能力和记忆功能的Agentic AI(代理型AI),让系统越用越聪明。
    • 借助信任渠道:通过合作伙伴、系统集成商和行业推荐来建立信任,比单纯推销产品功能更有效。

    对于企业(买家)

    • 转变采购思路:不要像买软件一样买AI,应像采购业务服务一样,要求供应商深度定制并对业务结果负责。
    • 赋能一线业务团队:让最懂业务的部门主导AI项目选型和落地,不是由中央IT部门包办。
    • 瞄准真实ROI:将投资重点转向后台职能的自动化,关注如何替代外部外包成本和代理费用,不是减少内部员工。

    未来展望

    • Agentic AI和代理网络:报告预测,AI的下一波演进将是 Agentic Web(代理网络,一个由众多能自主发现、协商和协作的AI系统组成的互联生态,将从根本上改变企业运作的方式。
    • 跨越GenAI鸿沟的窗口:跨越GenAI鸿沟的窗口正在关闭。成功不再属于拥有最先进模型的公司,是属于能构建出最能学习、最懂业务的系统的组织。企业必须停止购买“愚蠢”的静态工具,转而选择能共同进化的智能伙伴。

    获取《生成式AI鸿沟:2025年商业人工智能现状》报告PDF原文件 扫码关注回复: 20250821

     

  • 《动手学AI:人工智能通识与实践》 – 阿里云推出的免费AI公益课

    《动手学AI:人工智能通识与实践》是什么

    《动手学AI:人工智能通识与实践》是阿里云、超星尔雅联合北京大学、南京大学、复旦大学、上海交通大学、浙江大学五所高校名师共同推出的AI通识公益课程。将于9月1日上线,面向全国高校师生免费开放。课程结合理论与实践,涵盖AI发展历程、核心技术、伦理安全等内容,提供8个在线实验,让学生边学边练。课程有三个版本(人文艺术版、社科版、理工版),满足不同专业需求。阿里云提供技术支持和算力券,助力学生掌握AI技术,成为复合型人才。

    「动手学AI:人工智能通识与实践」

    《动手学AI:人工智能通识与实践》的主要功能

    • 理论教学:由五所高校名师讲授AI发展历程、核心技术、伦理安全等内容,构建系统知识框架。
    • 实践教学:基于阿里云平台,设计8个在线实验,提供免费算力券,让学生边学边练。
    • 教学服务:超星尔雅提供一站式服务,整合理论学习、实验操作、成绩管理,解决实践难题。
    • 资源共享:依托华五高校名师和阿里云技术,提供权威教学内容和强大技术支持。
    • 人才培养:结合理论与实践,培养既懂AI技术又懂行业应用的复合型人才,提升未来竞争力。
    • 公益开放:面向全国高校师生免费开放,降低学习门槛,促进教育资源公平分配。

    《动手学AI:人工智能通识与实践》的课程设计

    • 3个标准版本:理工版、人文艺术版和社科版
    • 课程目录
      • 第一章 — AI的发展历程
      • 第二章 — 搜索与优化算法
      • 第三章 — AI如何学习:机器学习原理
      • 第四章 — AI如何学习:深度学习基础
      • 第五章 — AI如何对话:自然语言处理
      • 第六章 — 大语言模型
      • 第七章 — 生成式人工智能
      • 第八章 — AI如何看世界:计算机视觉
      • 第九章 — 数据应用与可视化
      • 第十章 — 驾驭AI:智能体
      • 第十一章 — AI发展与行业趋势
      • 第十二章 — AI伦理挑战与治理

    如何获取《动手学AI:人工智能通识与实践》

    访问报名登记官网 https://survey.aliyun.com/apps/zhiliao/uNThqfHB-?sessionid=,填写报名信息等待开课。

    《动手学AI:人工智能通识与实践》的应用场景

    • 高等教育:为大学本科生和研究生提供人工智能基础知识和实践技能的培训,为未来的职业生涯打下坚实的基础。
    • 职业培训:为在职专业人士提供AI相关的继续教育,使用户掌握最新的AI技术和应用,提升职场竞争力。
    • 跨学科研究:支持不同学科背景的研究者用AI技术进行创新研究,如在医学、金融、教育等领域的应用。
    • 产业升级:帮助企业员工了解和应用AI技术,推动企业数字化转型和智能化升级。
    • 创新创业:为有志于在AI领域创业的个人或团队提供必要的知识和技能,促进创新项目的孵化和发展。