Skip to main content

Author: Chimy

Code Researcher – 微软研究院推出的深度研究Agent工具

Code Researcher是什么

Code Researcher是微软研究院推出的深度研究Agent工具,专门用于处理大型系统代码库及其提交历史,自动化修复系统代码崩溃问题。通过三个阶段工作:分析(Analysis)、合成(Synthesis)和验证(Validation)。在分析阶段,Code Researcher基于多步推理策略,结合代码语义、模式和提交历史信息,收集上下文并存储在结构化内存中。合成阶段基于收集到的上下文生成修复补丁,验证阶段通过外部工具验证补丁的有效性。

能深入探索代码库和提交历史,挖掘与崩溃相关的全局上下文信息。支持多种推理策略,如控制流和数据流分析、模式搜索以及基于历史提交的因果分析,通过正则表达式搜索代码库和提交历史,高效定位问题根源。

Code Researcher

Code Researcher的主要功能

  • 深度代码分析:Code Researcher能通过多步推理,结合代码的语义、模式和提交历史,逐步收集上下文信息,全面理解崩溃的根本原因。
  • 上下文收集:通过结构化内存存储分析过程中收集的信息,确保在生成修复补丁时有足够的背景信息支持。
  • 代码搜索:支持通过正则表达式搜索代码库中的特定模式,快速定位相关代码片段。
  • 提交历史分析:能搜索历史提交记录,找到与当前崩溃相关的变更,基于过去的开发经验辅助修复。
  • 因果分析:分析历史提交对当前问题的影响,识别引入问题的根源。
  • 智能合成:基于收集到的上下文信息,生成针对崩溃问题的修复补丁。能识别修改多个文件中的代码片段,生成高质量的修复方案。
  • 过滤与优化:在合成阶段,Code Researcher会过滤掉无关信息,专注于与崩溃修复直接相关的上下文,确保生成的补丁精准有效。
  • 外部工具集成:用外部工具验证生成的补丁是否能有效防止崩溃的发生,确保修复的准确性和安全性。
  • 自动化验证流程:通过自动化测试验证补丁的有效性,减少人工干预,提高修复效率。
  • 泛化能力:Code Researcher适用于Linux内核等大型系统代码,能在其他系统代码库(如FFmpeg)中快速适应并生成有效的修复补丁,展现出良好的泛化能力。
  • 提供修复建议:在某些复杂情况下无法完全修复问题,Code Researcher能提供有价值的调试信息和修复建议,加速问题解决。

Code Researcher的技术原理

  • 多步骤推理与语义分析:Code Researcher通过多步骤推理逐步收集代码的语义信息、模式和提交历史的上下文。基于大型语言模型(LLM)的语义分析能力,深入理解代码逻辑和结构,更准确地定位崩溃的根本原因。
  • 代码提交历史分析:创新性地挖掘代码提交历史,通过分析漏洞在开发过程中的演化轨迹来理解问题本质。这种时序分析方法使能处理百万行级别的超大规模代码库。
  • 全局上下文收集:Code Researcher在分析阶段会收集全局上下文信息,包括代码片段、过去的提交记录以及符号定义等。被存储在结构化内存中,用于后续的补丁生成。
  • 深度探索与智能合成:Code Researcher能深入探索代码库,平均每个轨迹可以探索10个相关文件。在合成阶段,会过滤掉无关信息,基于收集到的上下文生成修复补丁。

Code Researcher的项目地址

Code Researcher的应用场景

  • Linux内核崩溃修复:通过深度分析代码的语义、模式和提交历史,Code Researcher能够自动定位崩溃的根本原因,生成修复补丁。
  • 企业级软件维护:Code Researcher能自动化处理企业级软件中的崩溃问题,通过深度研究代码库和提交历史,快速生成修复补丁。
  • 开发者辅助工具:Code Researcher可以作为开发者辅助工具,提供崩溃的根本原因分析和修复建议。
  • 自动化测试与持续集成:Code Researcher可以集成到自动化测试和持续集成环境中,自动检测和修复崩溃问题。

iMeanAI Coyage – 浙江大学团队推出的AI旅行WebAgent

iMeanAI Coyage是什么

iMeanAI Coyage 是浙江大学95后团队推出的AI旅行WebAgent,为用户提供一站式旅行解决方案。通过自然语言交互,用户只需简单描述旅行需求,如目的地、时间、预算等,Coyage能快速生成包含航班、酒店和行程安排的完整旅行方案。强大的实时信息挖掘能力,能在30秒内搜索并比对全球航班和酒店的实时价格,筛选出性价比最高的选项。Coyage不站队任何预订平台,完全基于算法为用户推荐最优方案,确保旅行规划的客观性和高效性。

iMeanAI Coyage

iMeanAI Coyage的主要功能

  • 智能全局旅行规划:用户可以输入复杂的旅行需求,如多个目的地、多日期区间等,Coyage能快速规划出合理的旅行顺序和行程安排,避免不合理路径,在30秒内返回结果。
  • 实时航班与票价智能搜索、比价:Coyage能在浏览器环境中自主调取网页,搜索航班与酒店,筛选路线,比较价格,生成可执行的日程安排,帮助用户找到性价比最高的选项。
  • 个性化行程创建:根据用户的兴趣和偏好,创建符合个人需求的定制旅行计划,确保旅程的每个方面都与用户的偏好一致。
  • 预算友好的选择:帮助用户找到实惠的航班和酒店,确保旅行规划在预算范围内,保证质量。
  • 多样化旅行规划:支持家庭旅行、情侣度假、商务旅行等多种旅行风格,提供专业的规划选项。

iMeanAI Coyage的官网地址

iMeanAI Coyage的应用场景

  • 自由行旅行者:对于喜欢自由行的用户,iMeanAI Coyage 可以根据用户输入的目的地、时间、预算等信息,快速生成包含航班、酒店和行程安排的完整旅行方案。
  • 家庭旅行:家庭旅行需要考虑多个成员的需求和偏好。iMeanAI Coyage 可以为家庭用户提供定制化的行程规划,兼顾不同年龄段成员的兴趣
  • 行程调整:旅行中可能会遇到突发情况,如天气变化、交通延误等。iMeanAI Coyage 可以根据实时信息,快速为用户提供行程调整建议。
  • 团队旅行:企业或机构组织团队旅行时,iMeanAI Coyage 可以帮助规划团队行程,确保行程安排合理且符合预算,同时满足团队成员的多样化需求。
  • 旅行产品开发:旅行社或旅游平台可以用 Coyage 的技术,开发个性化的旅行产品,提升客户满意度和竞争力。

德勤人工智能研究院《AI案例精选》(PDF文件) – AI教程资料

德勤人工智能研究院的《AI案例精选》报告,介绍了人工智能(AI)在六大行业中的实际应用案例及其商业价值。报告概述AI创造价值的六种方式,包括降低成本、加快执行、降低复杂性、转变交互方式、推动创新和强化信任。详细分析消费行业、能源/资源/工业、金融服务业、政府/公共服务、生命科学/健康管理及技术/媒体/电信(TMT)等领域的典型AI应用场景,例如物流优化、预测性维护、欺诈检测、精准医疗等,列举了新兴技术趋势(如自动驾驶、数字孪生、生物识别支付等)。强调AI需从小规模试点转向规模化部署才能释放最大价值,建议企业制定清晰的AI战略和数据治理框架。德勤呼吁各行业抓住AI机遇,基于人机协作实现竞争优势。

获取德勤人工智能研究院《AI案例精选》PDF原文件,扫码关注回复: 20250614

AI创造价值的6种方式:

  • 降低成本:基于自动化重复任务提高效率,如自然语言处理实现数据输入。
  • 加快执行:减少延迟,如预测性洞察加速药物审批。
  • 降低复杂性:通过预测性分析优化决策,如预测机械维护需求。
  • 转变交互方式:改善人机交互,如情绪感知的对话机器人。
  • 推动创新:挖掘数据开发新产品,如社交媒体驱动的产品推荐。
  • 强化信任:预防风险,如提前识别网络攻击。

消费行业

  • 消费行业AI档案:消费行业企业积极探索AI应用,但面临数据质量、组织结构、人才匮乏等问题,导致AI应用和成熟度差异较大。企业需解决数据不一致、质量差等问题,实现业务与技术的整合,建立信任并大规模部署AI。AI系统将更自主,改变货物运输、员工管理等方式,提升企业运营效率和客户体验。
  • 案例
    • 车队网络优化:AI优化物流路线,减少空车率。
    • 连接客户:个性化客户服务,如智能聊天机器人。
    • 商品分类优化:AI预测需求,优化库存。
    • 数字呼叫中心:自然语言处理提升客户满意度。
  • 新兴案例:自动驾驶商店、时尚科技(3D扫描匹配服装)、健康监测可穿戴设备。

能源、资源和工业(ER&I)

  • 能源、资源和工业AI档案:ER&I领域AI应用不够广泛和成熟,主要集中在小规模试点和概念验证阶段,面临数据获取和整合的挑战。企业需建立AI专业团队,协调AI活动,制定战略和路线图,重点关注机器维护、客户互动和应对极端事件等领域。
  • 案例
    • 预测性机器维护:AI分析物联网传感器数据,预测机器故障,优化维护计划,减少停机时间和维护成本。
    • 边缘AI:利用边缘计算和AI技术处理网络边缘数据,提高数据安全性,降低成本,加快决策速度。
    • 现场传感器数据分析:AI实时分析现场传感器数据,监控生产资产,评估勘探机会,提高监测和预测能力。
    • 现场劳动力支持和安全:AI通过自然语言处理和机器学习为现场工作人员提供信息支持,提高工作效率和安全性。
    • 公用事业服务中断预测:AI预测能源需求和停电时间,主动提醒客户,优化客户服务,降低运维成本。
  • 新兴案例:数字孪生工厂、算法供应链规划、虚拟工厂操作员。

金融服务业(FSI)

  • 金融服务业AI档案:大多数FSI公司处于AI采用和投资的早期阶段,需从试点项目转向大规模部署,建立企业级AI能力。AI将广泛应用于改善客户体验、自动化关键流程、推动产业融合和打破部门竖井,提升企业竞争力。
  • 案例
    • 银行欺诈分析:AI实时监测交易,识别可疑活动,减少欺诈损失,提高客户信任度。
    • 会话AI:AI驱动的聊天机器人和虚拟助手提供个性化金融服务,自动化收债活动,提升客户体验。
    • 360°客户体验:AI分析客户数据,提供个性化建议,预测客户流失,优化营销策略,提高客户参与度。
    • 保险核保:AI自动化核保流程,简化风险评估,提高效率,降低成本。
    • 交易操作自动化:AI和机器学习自动化交易对账和异常处理,提高效率,减少错误。
  • 新兴案例:生物识别支付(微笑付款)、基于行为的保险定价、房地产估值AI。

AI案例精选

政府和公共服务(GPS)

  • 政府与公共服务AI档案:政府机构AI应用因机构不同而异,面临法律、风险约束和预算限制,需在法律和道德框架内谨慎推进。AI将广泛应用于社会政策制定、医疗保健、法律判断等领域,提升公共服务效率和质量。
  • 案例
    • 索赔处理后台办公自动化:AI通过机器人流程自动化、自然语言处理和计算机视觉,加快书面材料处理,提高效率。
    • 人口风险支持:AI预测社会问题风险,为政策制定提供数据支持,优化社会资源分配。
    • 生物医学数据科学:AI分析生物医学数据,加速医学研究和药物发现,提高医疗效率。
    • 福利管理:AI优化福利计划,提供个性化建议,提高员工满意度和福利支出效率。
    • 健康与环境预测:AI预测疾病爆发和气候变化影响,支持公共卫生和环境保护决策。
  • 新兴案例:AI军事战略模拟、智慧城市资产管理、法律判决预测。

AI案例精选

生命科学与健康管理

  • 生命科学与医疗保健AI档案:生命科学和医疗保健领域AI应用处于起步阶段,主要集中在管理任务和自动化流程,面临数据获取和整合的挑战。AI将广泛应用于药物研发、精准医疗、患者体验提升等领域,推动医疗保健的个性化和智能化。
  • 案例
    • 临床试验的数字化数据流:AI自动化临床试验数据管理,提高效率,降低成本,加快药品审批流程。
    • 制药情报:AI分析制造数据,预测生产偏差,提高产品质量和产量。
    • 药品营销全渠道参与:AI优化营销策略,预测客户互动方式,提高营销投资回报率。
    • 患者洞察之声:AI分析患者反馈,提供产品改进建议,提升客户满意度。
    • 主动风险和合规性:AI实时监控合规风险,提供改进建议,降低合规成本。
  • 新兴案例:合成生物学、虚拟药物研发、可穿戴健康监测。

AI案例精选

技术、媒体和电信(TMT)

  • 技术、媒体和电信AI档案:TMT领域AI应用因行业而异,电信公司AI应用较为成熟,媒体和电信领域需进一步拓展AI应用。AI将广泛应用于智能工厂、数字供应链、客户互动等领域,提升运营效率和客户体验。
  • 案例
    • 智能工厂和数字供应网络:AI优化生产流程,提高资产效率,降低成本,改善环境可持续性。
    • 直接消费者参与:AI通过自动化客户互动和个性化服务,提高客户满意度和留存率。
    • 数字联络中心:AI构建高效语音虚拟助手,改善呼叫中心体验,减少人工干预。
    • 检测虚假媒体内容:AI检测深度伪造和虚假媒体内容,限制错误信息传播。
    • 客户数据变现:AI分析客户数据,提供个性化服务,提升客户价值。
  • 新兴案例:实时语言翻译、视频内容分析、情绪监测广告。

AI案例精选

结论

  • 核心观点:AI需从小规模试点转向大规模部署,释放真正价值。
  • 建议:结合行业特性,制定清晰的AI战略和数据治理框架。

AI案例精选

获取德勤人工智能研究院《AI案例精选》PDF原文件,扫码关注回复: 20250614

如何用AI制作拉布布(Labubu)风格静态和动态壁纸

最近,全球唯一一只薄荷色Labubu以108万拍卖成交。

Labubu全球爆火,带动母公司泡泡玛特市值一路飙升,突破3500亿港元,创下新纪录。

就连Labubu的壁纸都十分畅销,某音上最高销量超过1万件!

不过说真的,Labubu系列的壁纸是真可爱呀,我看了也是疯狂心动,也想要一个个性化定制“独一无二”的Labubu动态壁纸。

在现在这个AI时代,还花钱买?我不仅一分钱不花就能得到,还能反手卖给需要的人。

今天,就跟大家分享一个免费制作Labubu动态壁纸的方法。

超级简单,小白也能秒上手~

 

01. 生成静态壁纸

 

首先我们在在即梦的灵感广场,搜索“Labubu”。

找到一个我们比较喜欢的风格,点进去。

选择一键做同款,作者同款的提示词、模型、尺寸信息就会复制到我们的提示词框。

查看提示词,我们需要微调一下图片尺寸。因为我们是做手机壁纸,尺寸可以调整到9:16。

提示词我们根据自己的想法再微调一下就可以。

Labubu的形象部分,可以参考原作者同款提示词(颜色可自定义):

提示词:泡泡玛特,拉布布,卡通风格,拟人化角色,兔子耳朵,【米褐色】毛发,大眼睛,黑色瞳孔,尖牙齿,粉红色脸颊,毛绒绒的质感。

技巧1:

在原来的形象描述提示词的基础上,再加上以下这些细节描述,就可以画出一张独属于自己的Labubu。

拍摄角度:描述画面中相机的方向和角度。

设定场景/背景: 描述 Labubu 所处的环境或背景氛围。

指定情绪/动作: Labubu 在做什么?是什么表情?

这是我写的一个提示词:

提示词:俯视Labubu漂浮在水池里,泡泡玛特,Labubu,玩着可爱蓬松的水波,可爱梦幻的颜色,水波折射光线,电影般的镜头,从上到下拍摄,皮克斯风格,Labubu,卡通风格,拟人化角色,兔子耳朵,浅棕色毛发,大眼睛,黑色孔,尖牙齿,粉红色脸颊,毛绒绒的质感,极简主义。

技巧2:

直接参考Labubu图像

把Labubu的图像上传作为参考图,使用图片3.0模型的智能参考。

也可以打开灵感广场中的案例图片,直接将它设置作为参考图。

提示词:俯视视角,高清壁纸,泡泡玛特,Labubu,Labubu躺在黄色的游泳圈上,喝着果汁。从上到下拍摄,Labubu,卡通风格,拟人化角色,兔子耳朵,米褐色毛发,大眼睛,黑色瞳孔,尖牙齿,粉红色脸颊,毛绒绒的质感,极简主义。

有参考图的Labubu,形象变得更可爱了。和参考图毛绒绒的质感一模一样~

技巧3:

灵感案例中的优秀海报,可以把元素替换成Labubu

比如这个微缩视角下的肯德基店铺,看上去很可爱,虽然是微缩视角,但是细节满满。

提示词:场景设定以微缩景观风格呈现肯德基店铺,构建一个卡通化的城市街景背景。画面中央是肯德基标志性红白配色的建筑,外形设计成超大号的肯德基全家桶样式,带有肯德基老爷爷头像和品牌标识。主体元素全家桶顶部堆满色泽金黄、外形诱人的炸鸡块和炸鸡翅,呈现出刚出锅的酥脆质感。桶顶插着肯德基红色品牌标识牌,周围搭配薯条盒、吮指原味鸡标牌等小元素。周边细节店铺周围有微缩的行人、外卖员等人物模型,营造热闹的用餐和外送氛围。附近布置有其他快餐元素,如汉堡模型、肯德基餐车等,强化快餐主题。建筑和街景细节丰富,包括道路、斑马线、路灯、周边店铺等,整体画面色彩鲜艳、饱和度高 。

我们把原提示词中肯德基的相关描述都替换成Labubu。就得到了新的提示词:

提示词:场景设定以微缩景观风格呈现POP MART店铺,构建一个卡通化的城市街景背景。画面中央是泡泡玛特店铺,外形设计成超大号的labubu样式,卡通风格,拟人化角色,兔子耳朵,米褐色毛发,大眼睛,黑色瞳孔,尖牙齿,粉红色脸颊,毛绒绒的质感,极简主义。周边细节店铺周围有微缩的行人、外卖员等人物模型,营造热闹的市区氛围。附近布置有其他时尚元素,如Labubu模型、货架展示等,强化Labubu主题。建筑和街景细节丰富,包括道路、斑马线、路灯、周边店铺等,整体画面色彩鲜艳、饱和度高 。

做法是不是超级简单?

掌握这3个小技巧,你就可以得到超多可爱的Labubu。

 

02. 将静态壁纸转动态壁纸

 

在提示词下方,将图片生成模式切换成视频生成。

上传我们前面做好的静态壁纸图片。

图生视频的提示词结构:运镜方式+主体+运动

例如:

提示词:固定镜头,Labubu在水中漂浮、游动。

提示词:固定镜头,店铺内人来人往,非常热闹。

提示词:跟随镜头,Labubu划船

 

03. 一些分享

 

在实操过程中发现,壁纸制作需要多次尝试。

我们可以根据每一次生成的结果,调整提示词(比如增加/减少细节描述、更换背景关键词、调整风格等),达到更符合我们想法的结果。

学会了你也可以帮别人定制专属壁纸,在闲鱼、小红书、淘宝开启自己的Labubu壁纸副业

一定要多关注灵感市场,可以即时了解比较热门的方向,快速掌握生成同类内容的技巧

不过,想要做出更进阶的作品,边做边思考很重要,在学习热门类型的同时,融入更多自己的思考和灵感。

原文链接:AI一键制作拉布布(Labubu)风格壁纸,某音上卖了1万+件!

Jenius – 通用多智能体AI Agent,完成全链路闭环

Jenius是什么

Jenius 是天聚地合(苏州)科技股份有限公司推出的通用型AI Agent产品。通过多智能体协作架构,将复杂任务分解为多个子任务,由不同的智能体分工完成,例如规划、执行和验证等。模仿了人类处理任务的逻辑,能高效地完成从需求理解到任务执行的全链路闭环操作。Jenius 整合了近千种实时数据接口,涵盖汇率、天气、新闻等多种数据源,结合用户偏好和历史行为,生成高性价比的解决方案。通过 RPA 技术实现自动化操作,例如自动完成旅行预订或报表生成等任务。Jenius 具备自适应学习能力,能根据用户反馈不断优化流程,提供个性化服务。

Jenius

Jenius的主要功能

  • 全链路智能闭环服务:通过独创的“数据 + 智能体 + RPA”三角引擎架构,Jenius 能实现从需求理解到精准执行的全链路闭环。
  • 数据驱动决策:Jenius 整合了近千种实时数据接口,涵盖汇率、天气、新闻等多元化数据源。能结合用户偏好与历史趋势,生成高性价比、可操作性强的解决方案,例如在旅行规划中实时抓取全网数据,生成优化行程方案。
  • RPA 赋能的自动化执行:基于RPA 技术,Jenius 能实现从方案生成到落地执行的全流程自动化。
  • 多智能体协作架构:Jenius 采用多智能体协作架构,不同智能体分工协作,模仿人类的任务分解逻辑。
  • 自适应学习能力:Jenius 能从用户互动中优化流程,提供个性化响应。

Jenius的官网地址

Jenius的应用场景

  • 旅行规划:用户输入简单需求后,Jenius 可基于实时数据生成个性化行程方案,涵盖交通、住宿、景点等全要素,通过比价功能筛选最优资源。
  • 营销活动策划:Jenius 能快速理解活动目标、用户人群、推广渠道等核心要素,自动生成活动方案、亮点提炼、动态海报、裂变 H5 等即用工具。
  • 财务分析:Jenius 面对复杂的企业财报,能快速进行多维度解析、趋势分析与交叉比对,生成带图表的可视化报告,以 PDF 或 PPT 形式输出。
  • 报表生成与分析:Jenius 可以根据用户输入的数据或文档,自动生成详细的分析报告,支持表格、图表等多种形式的输出。

Flowstep – AI设计工具,文本提示生成设计概念和草图

Flowstep是什么

Flowstep是AI设计工具,帮助设计师和创意工作者提升工作效率。工具基于智能算法和AI技术,为用户提供设计灵感、生成草图、优化布局等功能,能快速将想法转化为可视化的设计方案。初学者和专业设计师,都能借助Flowstep提高设计效率,节省时间,是现代设计领域中不可或缺的智能工具,助力用户轻松实现设计目标,提升作品的专业性和吸引力。

Flowstep

Flowstep的主要功能

  • 设计生成与创意激发:根据用户输入的关键词、描述或需求,快速生成设计概念和草图。基于AI算法分析用户需求,提供多种设计风格和布局选项,帮助用户快速找到灵感。
  • 智能布局优化:自动调整设计元素的布局,确保设计在不同设备和屏幕尺寸上保持美观和一致性。基于智能排版和间距调整,提升设计的整体视觉效果。
  • 图像和素材推荐:根据设计主题和风格,推荐相关的图像、图标、字体等素材,帮助用户丰富设计内容,节省寻找素材的时间。
  • 实时反馈与优化:用户在设计过程中,提供实时的反馈和建议,帮助优化设计细节,例如色彩搭配、字体选择等,提升设计的专业性。
  • 协作与分享功能:支持团队协作,用户与团队成员共享设计项目,实时协作提供反馈,方便团队沟通和项目推进。
  • 设计模板与样式库:提供丰富的设计模板和样式库,用户根据项目需求快速选择和应用,支持自定义模板,方便后续复用。

Flowstep的官网地址

Flowstep的应用场景

  • 品牌设计:快速生成Logo草图,助力品牌团队打造独特视觉形象。
  • 网页与界面设计:自动生成网页布局,优化UI/UX设计,提升用户体验。
  • 平面设计:生成海报和宣传册模板,优化图文排版,高效传达信息。
  • 产品设计:快速生成产品外观和包装设计,助力产品开发。
  • 创意概念探索:快速生成多种设计概念,激发团队创意,助力项目启动。

MAGREF – 字节跳动推出的多主体视频生成框架

MAGREF是什么

MAGREF(Masked Guidance for Any‑Reference Video Generation)是字节跳动推出的多主体视频生成框架。MAGREF仅需一张参考图像和文本提示,能生成高质量、主体一致的视频,支持单人、多人及人物与物体、背景的复杂交互场景。基于区域感知动态掩码和像素级通道拼接机制,MAGREF能精准复刻身份特征,保持视频中人物、物体和背景的协调性与一致性,适用内容创作、广告制作等多种场景,展现极强的生成能力和可控性。

MAGREF

MAGREF的主要功能

  • 多主体视频生成:支持单人、多人互动以及人物与物体、背景的复杂场景生成,保持身份特征高度一致,多人同框不串脸。
  • 高一致性与可控性:基于一张参考图像和文本提示,生成身份稳定、动作自然、背景协调的视频,支持精确控制人物动作、表情、环境和光影效果。
  • 复杂场景处理:支持人物与物体交互(如人与宠物互动、人物操作物体)及人物置于复杂背景中(如城市街景、自然环境等),生成语义清晰、风格协调的视频。
  • 高效性和通用性:无需为不同任务单独设计模型,基于最小架构改动和统一训练流程,适配多种参考图配置。

MAGREF的技术原理

  • 区域感知动态掩码机制:在生成空间中构建一块空白画布,将输入的参考图(如人脸、物体、背景等)随机排列其中。为每张参考图生成一张空间区域掩码,指示图像在画布中的语义位置。基于掩码引导模型理解“谁控制哪一块画面”,即使参考图数量和顺序不同,也能保持结构一致、身份不串、关系明确。
  • 像素级通道拼接机制:将所有参考图在特征维度上逐像素对齐拼接,避免传统 token 拼接可能引发的图像模糊或信息混叠问题。增强视觉一致性,保持生成结果对姿态、服饰、背景等细节的精准还原。
  • 三阶段数据处理流程
    • 筛选与字幕生成:从原始视频中切分出语义一致的片段,过滤低质量样本,为每段生成结构化文本。
    • 主体提取与掩码标注:基于标签提取与语义分割识别出视频中的关键物体(如动物、服饰、道具等),进行后处理获得精准遮罩。
    • 人脸识别与身份建模:检测并分配视频中人物身份,筛选高质量面部图像用在参考图构建,确保训练过程中的身份一致性。
  • 基于DiT架构的统一模型:MAGREF构建在Diffusion Transformer(DiT)架构之上,引入掩码引导和通道拼接机制,实现一个统一模型适配多种复杂视频生成任务的能力。无需为不同任务单独设计模型,基于最小的架构改动和统一的训练流程,实现强泛化性与高可控性的平衡。

MAGREF的项目地址

MAGREF的应用场景

  • 内容创作与娱乐:用在个人短视频创作、创意视频制作、虚拟角色生成,及影视特效和游戏开发,激发创意并降低制作成本。
  • 教育领域:帮助学生基于历史重现、科学演示和语言学习视频,更直观地理解知识,增强教学效果。
  • 广告与营销:快速生成高质量的广告视频、品牌推广内容和电商直播素材,提升吸引力和互动性。
  • 虚拟现实与增强现实:增强虚拟现实内容的真实感,及将虚拟元素融入现实场景,提升用户体验。
  • 社交媒体与企业级应用:生成个性化视频、互动视频、企业宣传视频和培训视频,满足个人分享和企业推广需求。

Pollo AI 创始人阿彪深度专访:SEO 怎么做?红人怎么投?付费广告怎么搞?

在 AI 的创业圈子里,有几位极其低调的创始人,他们的产品已达到千万美元甚至更高的年收入,但几乎从不公开分享,十字路口本周的嘉宾阿彪就是其中一位。

阿彪是 AI 效率工具 Hix AI 和 AI 视频工具 Pollo AI 的创始人,这两款产品不管是用户规模、收入规模还是产品体验,都在出海的第一梯队。我们多次邀请阿彪来做客「十字路口」,最近他终于被我们打动了,希望通过分享交些新朋友,招到更多优秀的新人加入他的团队。另一方面,他也希望自己的经验能帮到更多 AI 时代出海的创业者。

 

嘉宾阿彪:快问快答识其人

 

🚥 Koji

我们开始第一个环节,来和阿彪一起做一些快问快答。请问阿彪的年龄是?

👦🏻 阿彪

我是 91 年的。

🚥 Koji

毕业院校?

👦🏻 阿彪

我毕业于中山大学。

🚥 Koji

创业前在哪里工作?

👦🏻 阿彪

万兴科技。

🚥 Koji

你创业几年了?

👦🏻 阿彪

我是 18 年离职出来创业的,然后前两年是自由职业,后面 2020 年就是组建的公司。

🚥 Koji

出海几年了?

👦🏻 阿彪

七年了

🚥 Koji

创业后你们公司做了多少个产品了?

👦🏻 阿彪

不下 20 款。

🚥 Koji

现在在做的产品是什么?

👦🏻 阿彪

现在主要就是大家知道的那几个,比如说 Hix AI 和 Pollo AI.

🚥 Koji

目前公司多少人?

👦🏻 阿彪

90 多个人。

🚥 Koji

方便说一下收入规模吗?

👦🏻 阿彪

千万美金级 ARR。

 

Pollo AI:打造一站式AI创意平台的愿景与挑战

 

🚥 Koji

最近阿彪应该花时间最多的产品是 Pollo,对不对?可不可以给我们来一句话安利一下 Pollo?

因为今天做 AI 视频的产品感觉成千上万,Pollo AI 可谓其中的佼佼者。「十字路口」其实最近也访谈了四五位做 AI 视频的创业者。想听你安利一下 Pollo,给我们讲讲你做出来的 Pollo 它有何不同?

👦🏻 阿彪

我觉得首先来说,我们想把它打造成为一个一站式的 AI 创意创作平台。

什么叫一站式呢?那就是各个模型都只是它的一个工具而已。你所挑选的一个工具,你想要什么就用什么。创意创作平台,我认为它就是包含了素材的管理、社区以及生成和编辑。

🚥 Koji

和其他的在 AI 视频或者 AI 图像领域这样的创意创作的工具产品相比,你觉得 Pollo 最大的不同是什么?

👦🏻 阿彪

最大的不同是全家桶吧,我觉得它几乎什么都能包括,它其实用户分层是比较明显的。

我们想到第一类就是一些专业的创作者,图片视频这一块的。我们打算把它作为 studio 的这种模式,让一些专业的创作者可以在上面进行创作。

同时如果只面向专业创作者,它会比较垂直,同时人群是相对不那么大的。那如果想切更大的市场,那就只能全家桶,只能够更泛一点,做泛娱乐型相关的,也就是说做了一些 AI 图片和视频相关的特效。

🚥 Koji

听起来你又想做普通用户,又想做专业用户,那会不会就是有一种因为用户画像不清晰,导致最后产品做出来变得非常臃肿的风险?

👦🏻 阿彪

它确实可能会有这样的问题。

看产品的终端,其实从目前现有情况来看,其实剪映也存在类似的情况。以 APP 为例,它既有那种想玩一下特效的,也有那些专门想剪一下视频的。在它的 web 端当然就非常清晰,它就只做专业创作者,不做那些特效相关的东西了。

在我们目前现阶段来说,我们 web 端肯定就是两者都会包含。它确实可能会让人觉得臃肿,一下子无所适从。但是我们期望通过一种比较好的用户体验,去尽量满足这两种人群的划分。在我们下一个大版本的迭代里,应该就能够看到这一点。

🚥 Koji

下一个版本大概是什么时候?

👦🏻 阿彪

应该是需要一个半月左右。

🚥 Koji

差不多就是六月份左右了,我们就能看到新的版本,非常期待。

 

Pollo AI 的诞生与迭代:从简单套壳到多媒体平台

 

🚥 Ronghui

可不可以说一说当时你具体做 Pollo 或者是当时在计划这个产品的时候,看到哪些特别具体的机会点?

以及周围的人当时都在干什么?为什么你觉得你选的这个方向是更好的?

👦🏻 阿彪

其实我们当时做这个并没有非常宏大的战略规划,只是觉得我们当时同时在做 AI 音乐和 AI 视频。

最初我们更看好音乐,先做了音乐后做的视频,但后来发现视频跑得更好,这是超出我们预期的。

当时我们的想法很简单,那个时候应该算是非常早期,可能 API 还没有公开,我们就通过内部关系看能不能接入。同时也发现他们正在开发这个 API 并打算发布,所以我们算是最早接入他们 API 的团队。

🚥 Koji

你刚才说接的是谁的 API?

👦🏻 阿彪

可灵。然后我们接了它,就去发布上线。

🚥 Ronghui

当时是哪个时间?

👦🏻 阿彪

应该是 2024 年的 8、9 月份的样子。

当时我们发布的时候,市面上的 AI 视频产品很少,存在的基本都是大模型公司,简单套壳的基本很少。我们的想法也很简单,就套个壳试一下,没有想太多。

产品后来的演变是随着我们对这个领域认知的不断提升,对一些行业和产品的深入了解,逐步进行的。

🚥 Ronghui

就你刚刚提到的,在这个过程中,随着对行业的了解的逐步增加,有哪些你现在回头想是特别重要的一些对行业的了解?

👦🏻 阿彪

首先我们刚开始做第一个版本的时候,其实是单纯套壳,那时候我们还没有在产品里显示出我们用的是可灵的 API。

后来我们的第一个思维路径是发现,好像可以做个视频领域的 POE。所以我们就陆陆续续接入了市面上其他所有开放的视频模型 API,这算是第一个迭代。

第二个迭代,我们发现用户在做视频创作时,他们更多是用图片生成视频,而不是文字生成视频。为了让用户有更好的生成效果,我们就开始做图片生成,接入了市面上所有的图片生成模型。这个时候我们就变成了一个图片和视频的多媒体平台。

在这个基础上,我们想让用户体验更流畅,让他们生成的图片可以顺便生成视频。在生成图片的过程中,用户可能对图片有一些轻量级的 AI 编辑需求,比如超清、擦除某个地方、去背景等等。

我们就做了图片的一些轻量级编辑工具,让用户在处理图片时,可以轻松编辑后直接生成视频。生成视频后也有相关轻量级编辑功能,比如加背景音乐、加音效,或者将视频变成慢动作、视频超清等。

所以我们就做成了目前这个版本。整个过程是根据自己对产品的理解,对用户的理解,对市场的理解,分几个阶段进行产品演变。下一个产品迭代,大家到时候可以看到,它会基于认知的更新来迭代。

🚥 Ronghui

你们当时推出的时候是有特别针对某个市场吗?还是说就先发出来看一下哪个市场反响比较好?

👦🏻 阿彪

因为我一直是做海外,做英语语言市场,所以没有专门针对某一个国家或某几个国家。我一上来就是英语加多语言策略。这是我们这么多年出海经验积累下来的一个常规操作。

其实严格来说,我肯定想主打某一个国家。比如说美国,谁都想吃这块最肥的蛋糕,但它不好打。

美国市场首先竞争激烈。其次,如果想要做很多 KOL 推广,就面临两个问题:

一是我们没有线下的关系基础,别人很可能就不理会我们;

二是用户对产品要求非常高,看到是套壳产品可能就不会关注。

这不是单纯用钱就能解决的事情。就算我想打美国市场,比如砸下去 10 万美金或者 20 万美金找红人,也不是想做就一定能做到的。理论上来说,针对单一国家进行突破肯定会更好。

但还是那句话,这不是我想做就能做到的。目前来说,我们更可行的方式是全面铺开,把能接触到的红人先做一遍,把最低垂的果实先摘一遍。这样每个国家都能有一些收入,加起来效果也不错。等到我们有一定实力,产品真的能够被那些调性和要求比较高的头部 KOL 认可时,我们再去突破他们。

 

Pollo AI 流量增长三板斧:SEO、红人与广告

 

🚥 Koji

其实朋友们知道阿彪要来上十字路口之后,好多人都跟我说特别想从你这里听到一些做流量做 SEO 的经验。因为感觉这个江湖传闻…

🚥 Ronghui

要做这些东西一定要先去阿彪那里学习一下(笑)。

🚥 Koji

对,所以我也很想请教一下,Pollo 问世到现在其实也才几个月不到,已经做到了很稳定的每个月差不多 400 万左右的访问量。

想听你讲一讲这个流量成绩,你是怎么做到的?

👦🏻 阿彪

首先其实 SEO 只是其中的一环。

我们公司目前 SEO、红人和广告都是有在同步推的。这个产品不单纯只是靠 SEO 而起的量。即使是广告,我们也分谷歌广告和 FB 广告。也就是说,这是三板斧齐下的情况下,它才达到这么样的一个水平。

同时也是我们之前出海积累了好几年的经验,才达到这么一个水平。也就是说,当你看到我吃饱的时候,我吃第十个包子吃饱的时候,其实我前面可能已经吃了九个包子了。可能那九个包子是大家没看到的。

如果要具体说是怎么样做到的,那我觉得就是从刚刚这三个维度:SEO、红人和广告。

从 SEO 的角度来说,我觉得如果进行分析的话,其实也很简单。一个是主体的功能,第二个是小工具,第三个是模型,第四个是文章。你把这些页面你都先给它做了,你保证你这个流量过来,你要对应的承载的着陆页。你有了这些着陆页之后,你才有流量过到这里来。

举个例子,比如说你有 100 个页面,每个页面十个流量,那你一天就有 1000 个流量,逻辑是这么个逻辑。所以你得先有这 100 个页面,你才有这一个页面 10 个流量的可能。所以就得先按照刚刚我说的这几个模块去做对应的页面,这是第一个。

第二个的话,你可能还需要做一些 PR 和外链的推广,让这个网站有一些权重,有一些信任背书,从而能够在排名上有所提升。

然后当然还有很多其他的细枝末节。比如说怎么样更好地优化用户体验,怎么样让这个东西更 SEO 友好,更符合爬虫等等。这些是更细节的部分,大概的框架是上面的这个框架。

🚥 Koji

之前有篇公众号的文章转发量还蛮高的。我看到他是专门写 Pollo,然后说你们是谷歌 SEO 的新卷王。

然后在里面分析了一些你们做 SEO 的方法论。我不知道你看没看过那篇文章,你觉得他写的怎么样?准不准确?

👦🏻 阿彪

大体上说的都没有问题。虽然说我们被称为谷歌 SEO 新卷王,但是我觉得这里面卷王中的卷王应该是 Monica。我看他们比我们卷多了,他们在 SEO 这一块我觉得比我们做得更好。

🚥 Koji

这个怎么讲?

👦🏻 阿彪

基本上市面上所有 AI 相关的或者工作场景相关的一些工具,他们都做了,他们比我们更卷。

只要是文章基本上都写,我们没有做得这么彻底,我们没有这么卷,所以我觉得它是真正的卷王,无论是产品功能层面还是 SEO 层面,他们都非常卷。

🚥 Koji

其实聊到这儿,我觉得阿彪之前讲的好像也没有什么特别之处,也没有讲什么大家貌似并不知道的奇巧淫技等等。你讲的更多是基本功,或者刚入行的时候看一些比较入门的教材,好像就知道的一些常识。

是因为你觉得 SEO 就是常识,基本功的不断练习,不断重复,还是说你藏着什么秘密没有给我们讲?

👦🏻 阿彪

其实大的框架大家都是知道的,我觉得主要拉开差距的在在一些很多的细枝末节。

🚥 Koji

那你可以讲一些这样的细节吗?

👦🏻 阿彪

可以,举个例子,比如说在 Pollo 上面做了一个比较小的创新,那就是用户来到这儿,他直接就能看到这个工具是怎么用的。他不需要登录进入后台。而目前其实很多传统的工具或者网站或者产品,前台着陆页就是个展示。

点击 「Try it now」去到后台,再去用。这个时候其实用户如果他想使用 A 功能,但是他去到后台他要找老半天才能找到 A 功能,这是一种比较糟糕的用户体验。但是在我们这儿,用户来到我这儿,A 功能就直接能用。登录前和登录后,它都长这样子,就没有非常明显的前后台的界限。

但是我又为了让谷歌在这个页面上获得更多信息,如果我只有这个功能,没有一些相关的文字介绍,那这个是不利于 SEO 的。所以在登录前他看到这个页面,上面半部分是功能区,下面半部分是文字介绍区,或者是样品展示区,或者怎么用等等相关的一些内容和介绍。如果他登录之后,它就变成沉浸式的功能区,下面的内容就会被隐藏掉。

这个是我认为 Pollo 这个产品非常大的一个创新。在 SEO 层面上,它既兼顾了 SEO 又兼顾了用户的体验。

其实 SEO 的核心也是用户体验,你是否能够给用户很好的体验,你是否能够交付给用户一个满意的答复。这个答复可以认为是他想获取某个信息,可以是使用某个产品,它都是一种交付。

🚥 Koji

前面当你提到 SEO 分四个部分的时候,第三个部分你说的是模型,可以稍微展开讲一讲这个吗?

👦🏻 阿彪

其实这个就是因为市面上视频和图片模型有很多种,比如说可灵、Runway、Sora、Luma、海螺等等。这些模型其实用户会去搜这个品牌词,那我们做一个这样的内页,我们本来也是接了他们的模型的。

用户如果搜可灵 AI,那他可能会去到可灵 AI 的页面,但他也可能会来到我们这个页面去使用。这个就是我说的模型页面。

🚥 Koji

了解了,这其实和做 SEO 经常用的一个手法就是子功能页面,但是感觉竞争应该更激烈。那这么激烈的大词的竞争,你们要怎么才抢得到?

👦🏻 阿彪

其实 SEO 它是个玄学,你很难说我一定能排上去,说实在的我也保证不了。

很多情况其实要去排美国市场是很难的。举个例子,同样是英语语言,可能在其他英语语音国家,比如澳洲、新西兰、新加坡这些区域,Runway 这个词我可能能排到前面去,但在美国我可能排不上去。我吃的可能是这一部分的流量。

或者是因为 Runway 没有做多语言,比如说没有做西班牙语、葡萄牙语,那在这些语言里面搜索时,我是做了多语言的,所以我的排名可能会相对靠前一点,我能够接到这一部分多语言的流量。

🚥 Koji

今天大家都热议的一个新话题,就是用 AI 来写 blog,然后去获得谷歌 SEO 的流量。

这件事情你怎么看?你有实际操作过吗?有拿到什么成绩吗?

👦🏻 阿彪

首先我觉得我们在 AI 写 blog 上面的经验应该算是不多的。我们会用 AI 来进行辅助,一半 AI 一半人工。然后我认为单纯的 blog 来说,用户会更挑剔一点。

目前有了一个新的风潮,那就是写得更像 human,更像人,更像一个朋友。像我跟你对话一样地娓娓道来。举个例子,比如说我要写一篇「十个最好的 AI 视频工具」,我的开头就会说我测试了很多工具,然后我在这方面有很多经验。现在我跟你说他们哪些地方有哪些问题,就是像一个朋友一样写这篇文章,反而会更好更有吸引力。

为什么会这样呢?其实就是跟现在大家吃饭都能吃饱,但我会期望能吃得更好一点。就是用户更挑剔了,用 AI 生成的内容,它都一板一眼的,很机械,很冷血,没有什么人情味儿。那这个时候你有人情味儿,它就是不一样的点,用户挑剔的就是这个点。

🚥 Koji

为什么你没有采取完全交给 AI 写这样的办法呢?

👦🏻 阿彪

它肯定是做不到这种(高标准)的,直接做甩手掌柜不现实。

🚥 Ronghui

有没有什么别人在做的、你看到的,你觉得是一种普遍性的误解或者错误?

👦🏻 阿彪

在 SEO 层面第一个误解和错误就是以为总是不用花钱,其实是要花钱的,只是它是间接式的。

比如说我写文章要钱,我做页面做功能要钱。然后第二个,我做外链的推广,我要提高我的权重和 PR 这些也要钱。

它不是说纯薅羊毛,薅 Google 的羊毛,它不是这个逻辑。还是要花钱的,但它确实是 ROI 相对比较高的一种方式。

 

红人营销与广告投放:时机、爆点与专业团队的重要性

 

🚥 Koji

做外链的时候,在不同的 SEO 微信群讨论组,我听到过很多不同的观点。

有些人是鼓励大家一开始都拿免费的外链,然后也有朋友讲一上来直接就应该买高质量外链才有价值。比如说 1000 美金以上的外链是值得买的,否则就不要看了。

那从你的经验里面,你会建议大家怎么搞外链?

🚥 Ronghui

这个钱怎么花是花在刀刃上?

👦🏻 阿彪

严格意义上来说,谷歌是不允许买外链的。所以对于买外链这事儿,对于一些它可能认为无效的外链,谷歌会让它们不起作用。

这个大概的逻辑,其实我们从一个网站的生命周期去想就可以了。比如说一个刚刚出来的网站,它一下子有个很信任它的人说它很厉害,这样的外链对它来说是不自然的。一个网站刚开始的时候,它一定是很小的。它可能会先有一些比较一般的外链,或者直接就是一些比如说 Medium、Quora 等等这些很普通的外链,这是很常规的。然后慢慢地开始会有更多的人关注它,有一些高质量的外链。

当然这并不意味着说你刚开始做个三两个、三五个高质量的外链,你就会受到惩罚。肯定不会这样子。在谷歌的眼里,你外链要遵循一个自然发展的逻辑,但它也会有一个容忍度。他不是说你做了三五个,那就会怎么样惩罚你。那这样要搞竞争对手太容易了,谷歌肯定不会让这样的事情发生。

比如说你一开始完全没有差质量的外链,全部都是高质量外链,1000 美金以上的。我公司有钱,我土豪,我一下子砸了十万美金下去,那可能这个时候会适得其反,因为这是不自然的。

你做外链时,就想象这是一个正常的网站,它自然发展,它的外链、它的速度质量、它的频次应该是怎么样的一个节奏,你按这个节奏去走。比如说我这一个月做 100 个外链,第二个月我不做了,第三个月我又不做了,第四个月我又做 100 个外链。你这样子是不自然的,对吧?

一个正常的进展和坡度是,我每个月大概二三十个或者十来个,我逐渐地增加,或者我逐步就保持这个量级,不用波动太大,这里一下子有一下子没有,这个就不自然。

🚥 Koji

其实我感觉身边做 SEO 的朋友经常都有一种无力感,就觉得做了好像很久了,也看不到反馈。也不知道自己今天在做的事情会不会在一个月、两个月之后,甚至永远也都不会生效。

那你怎么看呢?你有什么样的建议给这些感到无力的朋友们?

👦🏻 阿彪

首先 SEO 肯定是相对会比较慢的,3 到 6 个月你才能看到效果。

如果中间有一些改动不能得到及时的反馈,你也不知道你做的这个事情是否是正确的。尤其是在你还经验不太够的情况下,很多人可能做了 3 到 6 个月没什么效果,这是有较大可能的。尤其是当他不是一个非常专业的人的情况下。

因为 SEO 是一个非常系统性的工程,它包括了内容,包括了网站结构,包括了 URL 结构、包括了外链等等,包括了关键词的方向以及竞争度。它影响因素非常多,它是比较系统的一个工程。

🚥 Koji

在这个时候往往大家就会想着,我去请一个资深的 SEO 顾问,或者我来招一个有 SEO 经验的一个员工。

不管是请顾问还是招员工,你觉得要去考验一个人做 SEO 做的好不好,那最应该问的关键的考察的问题是哪一个或者哪几个?

👦🏻 阿彪

第一个我觉得应该是看他从 0 到 1 怎么做的。比如说以某一个网站为例,他的思路是怎么样的,就是他脑海里面要有大概的一个思路框架,我觉得这个是非常重要的,大部分的人他其实是没有思路框架的,他只知道其中的某一个模块。

第二个我会问他一下对 SEO 的一些理解和认知。他如果只停留在说找关键词做页面,做外链,那我会认为这种认知是比较浅的。

🚥 Koji

那怎样的回答我们可以认为他的认知算深的呢?

👦🏻 阿彪

看维度。如果说你要再往深一个维度,我觉得最简单的一句话就是满足用户的意图。

🚥 Koji

在 SEO 的这个领域有没有什么你认为是常识,但是有蛮多人都不认可,或者说他们不知道的事儿?有这样的事儿可以给我们讲一些吗?

👦🏻 阿彪

他们总觉得 SEO 是万金油,它能够做很多很多事情。但是 SEO 它有它的瓶颈和天花板,它就只能做这么多量,它不可能撑起来。

比如说你做千万美金甚至更高,这不可能的,肯定还有一些其他的层面在的。所以就是我们要知道每一个营销方式它的天花板能做到多少,它也有它的局限性,不是每个行业都适合。

🚥 Koji

你觉得做 SEO 做的好的人和做的顶尖的人,他们之间的区别是什么?

👦🏻 阿彪

我觉得顶尖的人更加会有架构思维,会有全局思维一点。

第一他需要对这个产品的定位或者未来发展的方向和认知要有一定的了解。

第二个是他还要懂营销,懂 SEO 这一些东西。怎么样去跟自己的产品去进行很好的结合,让它既符合用户的体验,又符合 SEO 这一块。同时它整个的脉络是清晰的,我觉得这个是有一定的难度的。

🚥 Ronghui

你有没有面过什么人,他说了什么对 SEO 的理解,让你觉得非常印象很深,觉得很懂?

👦🏻 阿彪

这个还真没有,我们公司招的 SEO 都是之前没有经验的。然后我们直接自己写了一些培训文档,在内部培训的。

🚥 Koji

如果没有办法加入你的公司,跟着你去学,他必须得在网上自学。那你会推荐他去看什么样的文档,或者看哪里的教程?

👦🏻 阿彪

我觉得这个可以以我自己的亲身经历说一下。

我在万兴工作的时候,首先我很感谢万兴给了我一个平台,让我去实践和操作一些 SEO 相关的东西。同时我自己其实跟其他同事不一样的一个点是在于我看到很多英文 SEO 博客,像 Ahrefs,像 Semrush,像 Authority Hacker,像 Backlinko。他们的 SEO 文章都非常的专业顶级,肯定是最前沿的。他们会时不时的去更新这种材料,在我认为是全球最好的 SEO 学习资料。他们的文章写的非常的通俗易懂,用词都非常的简单,然后图文匹配排版也很非常舒服。

我还记得我当时在万兴工作的时候,我下楼拿盒饭等外卖的时候,都在拿手机看英文 SEO 的文章。我看到那些东西,我都觉得这实在是太干货了,太好了。我如饥似渴的像海绵一样吸取里面的养分。

我觉得如果你看 100 篇文章,基本上理论知识肯定是没有什么太大的问题的。然后你再看一些做得好的 SEO 网站,你看个 50 个到 100 个,你基本上在样板案例上是没有什么问题的。其实好像也没有那么难,看一百篇文章也花不了那么多时间,看一百个网站。你看看他们的架构,看看他们的写法,URL 布局等等。好的东西你看多了,就自然知道该怎么做了。

🚥 Ronghui

有一种熟读唐诗三百首的感觉。

 

Pollo 红人营销为何 「硬推」?「爆点」缺失下的突围之道

 

🚥 Koji

前面我们聊了很多 SEO,接下来我们也想听阿彪讲一讲红人营销。红人营销在 Pollo 里面应该发挥了不小的作用。

👦🏻 阿彪

其实 Pollo 做红人相对来说也不是那么容易做的,属于硬推的方式。

🚥 Koji

是因为刚才提到的 Pollo 并不是一个在技术上或者在产品交互上有非常大的创新的产品,所以它让红人没有兴奋感,没有向往感?是这个原因吗?

👦🏻 阿彪

这个是原因之一。第二个是他没有爆点,没有噱头点。举个例子,比如说我是有自己的大模型,因为你生成的东西是你自己的技术,你厉害是吧?这个是有 buff 的,是能加分的。

但是我们是个套壳的。其实红人营销它就讲究一个爆点所在。就你这个产品是否有噱头点,有争论点,有有趣的点,用户才会去点赞、评论、分享。因为他觉得好玩有趣,或者有争议、有争论,才会爆。要不然干巴巴的去推这个东西,它也很难推。

这里我举个典型的例子,比如说 GPT-4o 它发布了一个图片生成功能,它之前最大的一个亮点就是 Chat。这是一种很大的交互上的更新,一种创新,它确实很好。但是如果它仅有这个,肯定达不到现在的这种传播量级。

它达到了真正的传播量级,是因为它做到了吉卜力风格。这个东西很有趣,大家都玩起来觉得很好玩,这个才让它的传播量级更上一个 level。这个就是它好玩,用户都想要玩,都喜欢有趣。它去刷短视频,他不是来听你正儿八经说你这个东西怎么用,那是很枯燥的,他想要的就是好玩。再举个例子,比如说 Heygen 之前出圈的,它就是因为郭德纲说英语,没说中文,大家觉得这个很有趣、很好玩,大家才知道原来它是做数字人的。

🚥 Koji

我之前其实自己做了一个消费品牌叫「躺岛」,是卖枕头的,躺岛其实取得了还是蛮好的成绩。在天猫、京东我们经常都是在枕头领域这个品类的第一名,直到今天只要是大促也都是在第一。枕头这个品类其实卖了 100 年了。

为什么我们做了一个新的枕头就可以卖到全网第一?背后也有很多差异化,比如说我们这个枕头叫猫肚皮枕。首先很多人听完之后就会感到好奇,就会想要打开看一看这到底是什么。同时我们从色彩上、从视觉上、从材料上、从造型上都和大家常见的枕头们拉开了差距,有非常明显的差异化。

我们把这个问题聊回来,阿彪刚才也提到说推红人的时候是硬推,是因为没有爆点。我刚讲的猫肚皮枕,它有明显的差异化。我也好奇,对于这样的产品硬推要怎么推呢?如果推出去 ROI 不好的话,那你现在的选择又是什么呢?

👦🏻 阿彪

这些东西也不是我刚开始做 Pollo 的时候就知道的,也是交了学费才慢慢逐步有这个感知的。

当时也是硬推,也没有多想,就是让同事去做机械化的工作,大家去硬推这个东西。它的 ROI 肯定也不好,但即使是现在我也不知道 ROI 怎样,因为这很难去衡量。

那我们现在怎么推?我们主要就是推特效了,一些好玩的特效。但是好玩的特效也有问题,用户觉得好玩他点个赞,OK,然后他就跑了,不付钱。

🚥 Koji

其实我看到有一些 KOL 在介绍 Pollo 的时候,会非常强调你们是一个全家桶产品,一站式可以用到最新的视频大模型。

👦🏻 阿彪

这是我们最新在做的一个尝试,因为这确实是它的一个亮点。但是你要说这种尝试效果一定有多好或者怎么样,还是那句话,它会比较难以衡量,或者说我们还没有做到那么精细化地去衡量。

🚥 Ronghui

你会怎么来衡量目前尝试的这个方向的结果呢?

👦🏻 阿彪

我们衡量结果主要是按照 CPM 来,我们也没有衡量结果吧,就是按照预算来衡量,我按 CPM 来计算。如果它的 CPM 比较低,那我就会做。至于做得好还是坏,就看播放量了,看最终的 CPM。

🚥 Koji

你会觉得 Pollo 现在是完全靠营销吗?

因为听起来,至少在目前,这还是一个套壳产品,是一个全家桶 N 合一的产品。所以当我们说到 SEO,说到红人,说到广告,以及你们在今天做到的成绩,你觉得有多大的比例是营销带来的,又有多大的比例是因为你们的产品功能、产品创新所带来的?

👦🏻 阿彪

首先第一个我觉得是时机,时机也是很重要的一个点,我们做的相对早一点点,这是第一个。

第二个是我会觉得营销应该还是能够占一半的比例。我觉得虽然它是个套壳的产品,但是它在交互上还是比较不错的。

包括我们下一个版本的交互,也会有非常大的一个创新。这里我就先卖个关子,先不说了,到时大家可以去体验。就是我们会逐渐地把它真正当做一个产品来做,而不是个套壳工具。

 

复盘产品成败:时机、核心价值与「学费」中习得的认知

 

🚥 Koji

创业的时机选择非常重要,在 AI 时代尤其如此。你有什么技巧去把握时机吗?做了几十个产品,不管是做 Hix 还是做 Pollo,现在回头看当时的时机选择都不错。大家都说唯快不破,但除了快之外,还有哪些把握时机的心得吗?

👦🏻 阿彪

首先我觉得 Hix 肯定是没有把握好节奏的,因为做得晚了一点。它 2023 年 5 月份才开始做,那时 ChatGPT 都已经火过几波了。Monica 才是真正把握好了节奏的那个公司,他们是吃到了这波红利的,我们肯定没有。

然后像你刚刚说的,如何去找到这种新的东西,或者说把握好时间节奏。我觉得就是要时刻去关注最新的一些产品或者技术的动态,或者开源的方案。然后去想它怎样应用在我的产品里面,或者有哪些新的应用场景,要持续不断地去想这些东西。

像我们,我可能和其他公司不一样的是,我们会做很多个产品,我可能就没有那么专注。

🚥 Koji

你觉得这是好事儿还是坏事儿呢?

👦🏻 阿彪

这种方式应该说有好有坏。

比如像我这种情况,我做过这么多产品,却好像没有哪个产品能从 10 做到 100,这是它的坏处。可能因为我不够专注,不够深入。就我整体的性格而言,我应该不会单纯只寄希望于其中某一两款产品。主要是我本身比较喜欢做新东西。

🚥 Ronghui

你比较喜欢从 0 到 1 ?

👦🏻 阿彪

对,我会觉得从 0 到 1 是让我兴奋的。我天生就想去做这些新东西,喜欢去探索,想去尝试。

如果老是盯着同一个东西,可能大半个月、一两个月都没什么新东西可以做,或者做出成果来,我就会觉得没什么意思。当然,理论上我可以把现有的事情做得更好更深入,但我就是没那么专一。

🚥 Koji

你觉得会有一些遗憾吗?就在过去两年,你并没有专注做一件事情,而是把自己的经力给分散掉了?

👦🏻 阿彪

没有,在我目前看来,我认为这是正确的决策。

🚥 Koji

为什么呢?

👦🏻 阿彪

因为如果我只专注在一个上面,我觉得我可能不会有更多新的好的产品思路和或者说产品落地出来。而我如果单纯只垂直在某一个事情上面,可能它也并不会有那么好的成绩出现。

🚥 Ronghui

这个还蛮有意思的。因为我们之前有一个嘉宾 Patrick,他说回头看,觉得应该当时更专注。在他的那期播客里面他聊到他早期也做了挺多尝试。回头看,觉得自己当时有点低估了产品的潜力,应该当时把更多的精力集中在做这件事儿上。

👦🏻 阿彪

其实我觉得还是要具体问题具体分析。

像一些比较偏 B 端的产品,它是可以做得很深入的。而一些比较偏 C 端的产品,其实没啥好做的,你做了一年,基本上产品就做到头了。所以这取决于两个前提:第一是产品的属性,第二是它是否真的有潜力,它的天花板是否足够值得你去专一投入。

🚥 Ronghui

那你创业的话,你给自己定的目标是什么?

👦🏻 夏勇峰

我没有明确的目标,创业就是我的生活。我不创业,不做这些产品,我也没事可干。

如果说要有个目标的话,能够得到一些价值体现,让我有成就感、自豪感、自我满足感,这是比较不错的。同时也能得到一些同行的认可。

🚥 Koji

其实我听你说自己的创业目标时,感觉还蛮松弛的。但会不会有一些 VC 听了之后就会觉得,这个人怎么这么松弛,他好像不是很有野心。

所以我还挺好奇,有一个小问题:你有没有特别喜欢的企业家,或者你希望能够成为的企业家榜样?

👦🏻 阿彪

你说的这种野心要看在什么场合跟谁说。

我肯定不可能在这个场合跟别人说,我要做一家几十亿美金的公司。我觉得我不是这种人,因为这不是我的风格。我更希望有些东西隐藏在自己内心,默默地守护它就好了。我比较喜欢的企业家是雷军,他在功成名就的时候还在一线做汽车。

🚥 Koji

那你买雷总最近的小米汽车了吗?

👦🏻 阿彪

我没有车,我也没有计划买车。如果有计划买车,其实我还挺喜欢那个 SU7 Ultra,尤其是前面两个大鼻孔的那个。

🚥 Koji

你为什么选择不买车?

👦🏻 阿彪

因为我用不到车。我平时我就打车好了,我就走路上下班,也不需要去什么出差、跑商务之类的,用不到车。

 

付费广告投放秘诀:招到「高级投手」就够了吗?

 

🚥 Koji

刚才我们和阿彪聊了营销三板斧当中的 SEO 和红人营销。接下来我们来聊一聊付费投放广告投放。

在广告投放你觉得自己要做好的话,有什么样的心得?

👦🏻 阿彪

我觉得心得就是招一个高级的广告投放,就这么简单。

🚥 Koji

那怎么识别呢?

👦🏻 阿彪

那就是你找一个朋友或者朋友的朋友,你付费让他帮你面试。

以我为例,我就是一个没有做过广告投放的人,我现在也不擅长。你让我说技巧经验,我也不知道怎么弄。我能做的就是招一个厉害一点的人,让他来把控这些。千万不要说自己某一块不懂,然后招一个便宜的,那你只会亏掉更多。我现在越来越有一种非常深刻的理解,是在自己不擅长的领域,一定不要招中级的,一定要招高级。

🚥 Ronghui

在这个点上要舍得花钱。

👦🏻 阿彪

对,不论你是哪一块,你是产品也好,是营销也好,还是广告也好,还是技术也好,还是某一块具体的技术。

比如说你是 Android 还是 iOS,前端还是后端,还是 Java 等等。只要是那块是你不擅长的,你觉得你搞不定,完全空白。那你先招一个高级的,你千万不要招那种水货,他会坑。他交的学费就被你买单了,而你买的高级的,他就是前面的公司已经买过单了。

🚥 Koji

在过去你做的几十个项目里面,应该有很成功的,然后也有可以说非常失败的?我猜也有一些做了之后没有任何的水花。那你会认为在这些产品里面成败的关键是什么?

👦🏻 阿彪

很好的问题。这个成败的关键我感觉就是有几个点。第一个就是选择做某个产品的时机,什么时候做这个产品很重要。它现在是不是好的切入时机。第二个是这个产品最重要的点是什么?

举个例子,以我失败的一个案例来说,我们之前做过电子签名(海外版本)。这个产品用户会比较在乎什么呢?品牌信任度,他会在乎你的合规,会有很大的信任成本。这些在我看来是这个产品的关键点。而我们作为一个创业公司,在这些关键点上很难去实现,那在选择做这个的时候,就基本上已经注定了它是失败的。

但这是做了之后才意识到的,而且我们当时做电子签名也并不是好的时机。这个领域已经发展很久了,DocuSign 都已经上市了,市面上还有 Adobe Sign 还有 HelloSign 等等,很多大公司都在做。我们做这个时间点不行,产品也没有跟别人不一样的切入点。产品成败的关键点,刚刚我说的品牌信任背书、合规这些东西也做不到。随便从哪个层面上来看,它都是一定会失败的。

所以我现在对于做一个新产品,有几个关键点要考虑:第一是时机,第二是切入点,第三是从产品层面上,它的关键点到底是什么?是产品力,还是信任,还是品牌,还是营销,还是广告,还是什么?我觉得得先想清楚。

🚥 Ronghui

你前面说很多这些经验是交了学费的,可以讲讲你交的学费吗?现在回忆起来印象最深或者是最痛苦的一个学费是什么?

👦🏻 阿彪

就是我刚刚说的那个电子签名的软件,我们做了大半年,亏了好几百万,营销投入也不少。

对,我们在这个基础上还开发了一个在线的 PDF 编辑工具,但也不是好的时机,没有什么差异化的切入点,竞争也非常激烈。

当然这里面有个点我得说一下,它有个前提是什么呢?在 AI 没有出现之前,几乎没有什么新的场景,都是老产品、老场景。你很难找到新的东西去做,所以你很难说在时机上能有优势,只能去寻找产品的差异化切入点。

现在不一样了,因为 AI 出现了,这个技术日新月异,新的东西不停地涌现。这就会有一些好的时机点去选择适合的产品方向。

🚥 Koji

你会怎么去寻找新的产品灵感?你做了那么多的东西,而且你也提到自己非常喜欢做新的东西,那你应该每天都有大量的时间在想下一个产品去做什么。

所以我想知道你的一天是怎么度过的,新的产品灵感是用什么样的方式去找到的?

👦🏻 阿彪

其实我觉得国内的 AI 自媒体都做得挺好的,新的技术更新他们都能很快地同步过来。

理论上来说,我应该做一个更高大上的事情,去 GitHub 上面看一些开源的、新的热门项目。但是我又不是技术出身,总觉得它好像隔了一层纱。

我平时闲暇时间也会刷视频,会关注一些 AI 博主,他们非常勤奋,更新也很同步很快。新的 AI 相关的东西,无论是 GitHub 上面的,还是 Twitter 上面的,还是大公司的新闻,他们都会同步过来,给我们做了一道加工。虽然是二次加工的,但在闲暇时间刷手机时,你可能会发现这个东西有点意思,我自己做个记号,回头上班的时候再去深入看一下,这是我平时会做的事情。

🚥 Koji

Pollo 这个产品刚出来的时候,引起了非常大的关注。但同时我也听到有一个声音是说,Pollo 没什么特别的,好像我也能做。好像会有人觉得没有护城河。

在阿彪你看来,在当时你看到了什么非共识的东西?或者说你看到了什么是其他人做不到,但是你和自己的团队就是能做到的?

👦🏻 阿彪

目前没有。确实也有人能做,也拉不开太大差距,这也是我们担心的点。

但后面我们应该会有所迭代,可能能拉开一些差距。市面上像我们这种非技术门槛的产品,理论上谁都可以做。我们未来做的产品也一定会是这样。所以我不会太在意这点,它不会是我考虑的关键。我要做的就是把产品做好,然后尽快推进,相对快一点,让别人追赶有点吃力。营销方面的话也要全力以赴。

🚥 Koji

其实 Pollo 到现在,我觉得很多人都认为它非常神奇。从 0 到 400 万的流量只用了短短几个月,这好像是一夜之间做到的。

从外部来看,就是每两个月就 300 万了,然后有 400 万了。但从内部来看,你觉得有明确的流量增长的里程碑吗?也就是有哪些明确的事件,给 Pollo 带来了爆发式的增长?

👦🏻 阿彪

它确实增长比较快。说到里程碑事件的话,好像也没怎么有,在内部它是比较稳定地增长,没有突然一下子出现陡峭的增长曲线。我觉得它应该属于三板斧的叠加效应,这样才会有比较好的成长。

🚥 Ronghui

前面你说也尝试了 AI 加音乐,但是那个做没有做起来,为什么?

👦🏻 阿彪

第一个问题是我们 API 成本比较贵,当时使用的 Minimax 和天工的。第二个就是用户付费确实也不多,但这里面我知道有些其他玩家他们做得挺好的。还有就是人群画像也不太清晰,有时候还是靠运气。

🚥 Ronghui

就是你觉得这个主要原因是跟你们更相关,还是跟音乐这个行业更相关?是这个行业有什么特别难的地方?

👦🏻 阿彪

我觉得都有。首先就用户购买来说,基本上就是买最便宜的,他不会买高版本的。

第二个就是我们 API 成本确实比较高,相对于其他的竞争对手,比如 Suno,没有任何优势。Suno 的产品又更好,又比我们还便宜。我们做这种 API 套壳的,很难做,就是你跟 Suno 比他太有知名度了。你要占一头,要么比人家便宜,要么比人家好,但你又不可能比人家好。这样子就只能捞一些小虾米了,捞死鱼。

🚥 Koji

什么叫捞死鱼?

👦🏻 阿彪

就瞎猫碰上死耗子,这是 C 端产品的一个共性。有些人他就是不知道 Suno,他恰巧知道你,这不就是瞎猫碰上死耗子吗(笑)。

🚥 Koji

现在做 AI 视频的产品非常多,有很多已经很成功的,也不断有新发布的,感觉几乎每天都有新的 AI 视频产品出来。在所有这些产品里面,你自己最欣赏的产品是哪一个或者哪几个?

👦🏻 阿彪

剪映吧。当然它不需要我欣赏,它已经非常厉害了。

它最大的一个点是,无论是功能还是运营还是增长,都是非常系统的、无敌的。这种团队放到哪个产品里面都能打。

🚥 Koji

你觉得剪映最后会是你们最大的竞争对手吗?

👦🏻 阿彪

不会,我们怎么可能跟剪去 PK 呢?

🚥 Koji

但是剪映可能会蚕食你的市场。

👦🏻 阿彪

这个我没想过,我觉得市场很大。

第二个我觉得我们还是会不一样。我们的用户心智比较偏 AI 的,它是传统的这种剪辑或者模板工具,我们无意跟它去竞争,也不想跟它竞争,也怕跟它竞争。

🚥 Koji

除了剪映,在新一代的 AI 视频产品里面有没有是你自己比较欣赏的产品?不管它今天的规模是大是小?

👦🏻 阿彪

如果是模型公司的话肯定很多。但我觉得模型公司你不能算在里面,比如说像可灵、海螺,这些你不能算在里面。应用层像 Krea 或者 Freepik,但是我觉得他们真的是在产品层面上做得好吗?我是打个问号的。

🚥 Koji

所以你欣赏它们,不是只是欣赏它们的产品的体验和交互。

👦🏻 阿彪

而是说它现在目前做的比较大,也做的比较早,有前瞻性。但是它的产品交互我是不认可的。当然这个东西各有各的看法,有些人可能就喜欢那种交互。

🚥 Koji

你觉得有什么 AI 视频的产品在今天是被大家高估了?

👦🏻 阿彪

我觉得 Krea AI 就是被高估的,它融资了 8300 万美金,总共 ARR 800 多万美金,估值 5 亿美金。

这个我觉得水分泡沫挺高的,可能美国市场上就是钱多,然后就有这个泡沫。其实我压根没想明白它要这么多钱,8300 万美金怎么花得完?然后 800 多万美金 ARR 的公司怎么能值 5 亿美金,我觉得这里面有被高估的成分。

但是 a16z 作为投资机构的影响力是毫无疑问的,他们认可它,也许有一些我们暂时不知道的产品发展方向或者思路。

 

中国软件出海的变局与心法:从认知迭代到「松弛感」管理

 

🚥 Ronghui

不管是听周围朋友说,还是在即刻上看到,挺多人都去找你交流,特别是关注出海的这个领域。

你有观察到,比如说从去年到现在,大家普遍特别关心、找你聊会问的问题都集中在哪些地方?在过去的这段时间里,这些关心的话题有什么变化吗?

👦🏻 阿彪

大部分还是会问一下比如说 SEO 怎么做,怎么推?有一些也会说有什么新的好的产品方向或者思路,主要就是这两块。变化的话,好像也没有什么明显的变化。

🚥 Ronghui

那你觉得他们普遍特别关心什么,或者是普遍为什么问题而特别的担心?

👦🏻 阿彪

其实核心还是在于如何做好营销。

我觉得不同的产品有不同的适合的营销策略,很多人并不清楚自己的产品究竟适合什么样的营销方式,他们缺乏这方面的认知。实际上 SEO 也不是万金油,并不是所有行业都适合做 SEO 的。

举个例子,比如电子签名这类产品,你想去做红人营销,要怎么说呢?它是一个纯 B 端产品,很难想象这种产品有什么噱头点,内容也相对无趣。而如果做广告投放,你的竞争对手可能全都是拿了大额融资的公司或者已经上市的企业。人家都是用 VC 的钱,资金实力雄厚,一个点击都要花好几块甚至好几美金,在这种情况下你根本无法与他们抗衡。

所以说,当你选择了这个产品的那一刻,它适合的营销方式其实就已经被决定了。如果没有选择正确的营销方式去做,很可能会事倍功半,看不到什么效果。

再比如跨境电商行业,它就不适合做 SEO。SHEIN 创始人做 SEO 出身,但 SHEIN 的增长主要是通过广告投放来实现的。所以每个产品都有其注定适合的营销方式,选择了合适的方式,重点投入并发挥其长处就好了,并不是说每个领域都适合所有推广方式。

🚥 Ronghui

这些话是你见到每个人都得说一遍的吗?

👦🏻 阿彪

差不多吧。其实很多人问关于 SEO 的问题,翻来覆去也就是那么些内容。所以我说你还不如直接在微信上问我,我告诉你答案,这样你也不用特意跑过来,省得折腾。

🚥 Koji

你觉得在国内做出海有哪些优势,又有哪些问题?

👦🏻 阿彪

优势是我们有工程师红利,我们勤奋努力,工程师薪资相对海外便宜一些,然后我们赚的是美金,有汇率的优势。

缺点是我们对于比如说非常偏 B 端的一些产品,如果需要洞察用户的使用场景或者体验,是有一定隔阂的。同时如果要去做那边的本地化或者商务销售,我们肯定不擅长。你不可能在国内给人家打一个视频电话做销售,那晚上都不用睡觉了。

🚥 Koji

创业到现在也差不多五年了。你觉得这五年里面你做过最关键的决策是哪一次?

👦🏻 阿彪

就是那些选择正确的产品,好的方向。所有错误的、没有做起来的产品,都是因为选错了方向。

🚥 Koji

选择比努力重要。你觉得自己创业五年在身上发生的最大的变化是什么呢?

👦🏻 阿彪

肯定认知还是会有所提升的。在对于选品和营销这一块,也会更加全面一点,认知更加深刻一点,然后心态上面也会更 OK 一点。

🚥 Koji

这个指的是过去焦虑的事情现在不焦虑了,或者过去害怕的事情现在不害怕了?

👦🏻 阿彪

就举个例子,从我自己的经验来看,我以前觉得如果是个好员工,你肯定会有更高的自我要求,你会经常加班。无论是工作还是学习,我认为工作是做不完的。所以我以前是会希望同事多加班,但是我发现这个是没有用的。我们现在同事大家也都不加班,尤其是营销,研发会加班。我现在也比较佛系了,心态也比较 OK 了。

我是这样想的,如果说我这个产品方向选对了,那么它早一点或者晚一点达到某一个值,影响也不大。就像这个产品今天发布和明天发布好像差别也不是那么大。没必要一定要搞到通宵,搞到三四点才下班,这在我们这是不可能的。你产品选对了,方向选对了,你营销加班不加班好像决定不了什么。

🚥 Koji

就是在一个正确的坡道上滑雪。快一点,慢一点,反正最终都能到达目的地。

👦🏻 阿彪

对,就是这样子。比如说他早一周、早两周做到某一个值,我觉得你靠大家天天逼着去加班,做到这个我觉得也没什么意义。放过自己也放过他人,而且大家不怎么加班,我天天逼着人家加班,我也累,他们也累。所以还是算了,放过自己,放过大家,心态调整一下。

🚥 Koji

在过去一年你认为自己做过最好的一个决策是什么?

👦🏻 阿彪

因为我之前是做 SEO 出身的,我比较了解 SEO 的天花板和局限性,所以我非常苦恼单一技能树的问题。所以正确的决策应该就是公司层面在红人和广告这一块,补全技能树,让我们更全面一点。

🚥 Koji

在过去的工作经历,也包括你创业的经历,有谁给你带去的影响,你觉得是最深刻的?

👦🏻 阿彪

最近比如说 Manus 的发布,对我印象还是比较深刻的。因为他让我看到了 Monica 因为融了资,然后引入了更加优秀的人才,做出了非常优秀的产品,非常有创新。

🚥 Koji

你的 MBTI 是什么?

👦🏻 阿彪

我没有测过。

🚥 Koji

你不好奇吗?

👦🏻 阿彪

我不信这些。

🚥 Koji

所以你不信任何的玄学或者心理学吗?

👦🏻 阿彪

也不能说心理学,比如说什么星座算这个算那个,比如说湖南人怎么样,广东人怎么样,我觉得大家聊一聊 OK 没有问题,但是我不信这个东西。

我当然也不会去否定,说这个东西怎么样。反正我肯定会属于某一个框架或者类型,但是我自己不会去做这样的事情,我懒得去测。

🚥 Koji

所以你是不是一个反权威的人?就是你从小可能没有那么尊重老师,或者说参加工作之后也不一定觉得领导说的都是对的?在这一点上面,你认为自己是不是叛逆程度还蛮高的?

👦🏻 阿彪

没有,我觉得我是个比较老实的人。

但是我跟我的同事反复强调一个点,就是我觉得我们公司没有权威,我希望他们提出不同的意见。我在一定程度上是会迷信权威的,但同时我也会有一点自己的判断,会自己多问几个人。

🚥 Koji

其实过去十年,你毕业之后一直在做出海产品。你觉得在这十年里面有没有哪一个瞬间是你想起来就觉得特别有意思的?作为亲历中国软件出海这个完整过程的一个从业者。

👦🏻 阿彪

这个属于传统出海和 AI 出海。

转拐点时刻就是 ChatGPT。我们之前出海,国内的创业者很少,聊的都没几个,就是传统以万兴为首的一系列相关或者不相关的竞品、友商或者嫡系部队,或者是员工出去创业做的一系列相关的公司,基本上就是大概这么个市场。

然后因为有了 AI,就是万物生花,各种场景和产品都出来了,大家都出海了。而且目前出海也是大势所趋,玩家多了很多。所以我会感觉这个是个非常典型的分水岭。

🚥 Koji

所以最有意思的瞬间就是有了 AI 的那个瞬间?

👦🏻 阿彪

因为多了一些新的场景和机会。

之前我看过很多的软件产品网站,非常多。要么就是竞争非常大,巨头林立,它天花板当然也高;要么就是它太小了,一直苦恼找不到好的方向。但是因为 AI 撕开了这个口子,让我们有了更多的一些机会,会去尝试一些新的产品,让我们也能跟一些大公司处于同一个起跑线。

🚥 Ronghui

这一两年我的一个感受,当然也可能是偏见,是有很多公司做出海,其实他们未必真的想做出海,而只是因为不想在国内卷。

👦🏻 阿彪

对,确实有这种情况。但我认为这也是可以理解的。同样一个产品你做得很好,在国内可能赚十万,但在海外可能赚 100 万美金。要从国内赚钱,真的太难了。

🚥 Ronghui

有很多人说创业要有自己的 DNA,要有自己的决心,或者团队要有某些特定能力。那在这个语境下,这些因素是不是没那么重要?

👦🏻 阿彪

首先我并不认同 DNA 或者基因这种说法,我认为这个东西是由创始人的蜕变和更新迭代决定的。所谓基因,其实是你给自己不迭代或不更新的一个借口或谎言。

比如阿里,也不是一开始就能有阿里云做大模型,最初也不是做电商的,是自己逐步迭代出来的。字节也不是一开始就做海外,对吧?它也没有海外经营的基因,那它是怎么做出来的呢?就是通过迭代。所以我不认为有所谓的「基因」,这种说法其实是在限制自己。

🚥 Koji

我有一个小问题,我看到之前你在即刻发过一次招聘。当时你提到每天中午办公室有一个半小时的午休,然后每天下午好像是 3:40 到 4:00,还有 20 分钟固定的休息时间。

这个政策看起来非常少见。你能展开讲讲吗?为什么会在下午专门安排 20 分钟给所有人集体休息?

👦🏻 阿彪

你还真细致,这都被你发现了。其实是因为之前有个同事提了个建议,我们就采纳了,就这么简单。我们觉得这样挺好的,有点像以前上学时有下课时间。

现在我们感觉这个 20 分钟休息确实不错,因为到了那个点,人确实会有点疲惫,效率也会下降。休息一下,大家可以沟通互动,出去兜风、散步,交流一下,感觉挺好的。

🚥 Ronghui

听起来你确实现在变得比较佛系,是吗?

👦🏻 阿彪

我不认为这是一种佛系,我认为这是一种对员工还是好一点。

🚥 Ronghui

这叫什么,张弛有度对吧?

👦🏻 阿彪

我不认为我是个佛系的人(笑)。

🚥 Koji

好的,今天再次感谢阿彪来上十字路口和我们分享了非常多做营销、做 SEO 的干货,也讲了自己可能从来没在别的地方讲过的一些创业故事和心得体会。

我非常期待 Pollo 在一个半月之后的新版本。也很希望阿彪能够再过半年、再过一年,带着更新的故事、更好的产品和更多的观察思考再来十字路口。好,谢谢你,再见。

👦🏻 阿彪

好,也谢谢大家。

原文链接:「SEO新卷王」Pollo AI 创始人阿彪首谈:SEO 怎么做?红人怎么投?付费广告怎么搞?

Clacky AI – AI编程工具,打造L3级的Coding Studio

Clacky AI是什么

Clacky AI是面向开发者的云端开发环境(CDE),打造L3级别的Agentic AI编程助手。Clacky AI支持全栈开发(包括Python、Node.js、Golang、Ruby、Java等语言),能帮助开发者快速从创意构建迭代出实际可用的系统。Clacky AI基于结构化任务拆解、多线程协作、自我排查与修复等功能,提升开发效率,降低开发门槛,非常适合团队协作和快速迭代项目。“时光机”功能支持追溯开发过程中的每个节点,确保项目的稳定推进。

ClackyAI

Clacky AI的主要功能

  • 工程化思维:强调从项目规划到迭代的完整流程,符合人类的直觉。
  • 全栈支持:支持前端、后端及常见编程语言((如Golang、Python、Node.js、Ruby、Java等)),用户基于简单的提示词生成复杂的项目。
  • 云开发环境:所有开发环境预先配置好,用户无需本地安装依赖,降了使用门槛。
  • 多线程工作流:基于Git分支的多线程工作流,支持隔离和并行的任务执行。
  • 自我排查与修复能力:自主规划任务,在出现问题时自动修复。
  • 时光机功能:支持用户回溯到任意一个节点,保留每个任务节点的完整上下文状态。

Clacky AI的官方示例

Prompt:Develop a kanban-style task management system.(开发一个看板式的任务管理系统。)

ClackyAI

Clacky AI的官网地址

如何使用Clacky AI

  • 注册登录:访问 Clacky AI 官网,注册账号并登录。
  • 申请内测资格:目前 Clacky AI 仍处于内测阶段,需要申请内测资格。点击申请内测按钮,填写相关信息,等待审核通过。
  • 创建项目:登录后进入 Clacky AI 的工作界面。点击“Create Project”按钮,开始创建新项目。输入项目名称和描述,选择项目类型(如 Web 应用、爬虫工具、游戏等)。
  • 输入需求:在项目创建完成后,输入具体的需求描述。Clacky AI 提供“调优提示词”功能,帮助用户将需求描述得更清晰、更结构化。确认需求后,Clacky AI 自动生成需求列表,支持用户进一步细化或调整。
  • 任务规划与执行:Clacky AI 根据需求自动拆解任务,生成任务列表。用户选择直接开始任务执行,或者手动调整任务顺序和优先级。
  • 代码生成与优化:在任务执行过程中,Clacky AI 生成代码,实时显示在代码编辑器中。用户用“时光机”功能查看每一步的变更记录,回溯到任意节点。
  • 团队协作:如果是团队项目,在项目中创建多个线程(Thread),分配给不同的团队成员。每个线程独立处理一个子任务,团队成员在自己的线程中进行开发。
  • 代码导出与部署:项目完成后,将生成的代码导出到本地。用户根据需要将代码部署到服务器或云平台。

Clacky AI的核心优势

  • 全周期开发:从零开始的原型设计(0→1)到大规模迭代(1→N)在一个统一的开发环境中完成。
  • 专为重要项目设计:从一开始为真实项目设计,无需中途更换工具,支持持续增长。
  • 智能伙伴:作为逻辑清晰、目标驱动的AI队友,专注于交付成果和扩展项目。

Clacky AI如何支持团队协作

  • 基于隔离线程实现并行任务执行。
  • 支持人类与AI协同处理项目的不同部分。
  • 基于云实时进度跟踪与动态调整。

Clacky AI的应用场景

  • 全栈项目开发:适用于从零开始构建完整的全栈应用,如开发一个电商网站,前端界面设计、后端逻辑处理及数据库集成等均可一站式完成,快速生成可运行的系统。
  • 团队协作开发:支持团队成员在同一个项目中创建多个线程(Thread),异步处理不同任务,共享项目上下文,适合多人协作开发复杂项目,提升协作效率。
  • 快速原型开发:帮助开发者快速将创意转化为可运行的原型,基于简单的提示词生成初始版本,适合个人开发者或团队在项目初期快速验证产品方向。
  • 教学与学习:作为编程教学工具,帮助学生快速理解编程概念,生成示例代码,降低学习门槛,适合编程教育场景。
  • 企业级应用开发:企业用其快速开发和迭代能力,缩短项目周期,提升市场响应速度,基于云端开发环境减少本地资源的配置和维护成本。

AI周刊丨本周不可错过的AI行业动态(6.9-6.15)

本篇内容,带你快速了解本周AI热点资讯

weekly

 

01. AI大事件

 

智谱推出首个企业级超级助手Agent——CoCo

智谱推出首个企业级超级助手Agent——CoCo,具备交付导向、记忆机制和无缝嵌入三大企业级特性。能全流程辅助工作,根据员工职能和需求主动服务,无缝接入企业资源,提供个性化服务。

智谱coco

联想发布城市超级智能体,展现AI驱动城市治理新范式

在2025数字城市论坛上,联想集团展示了其“城市超级智能体”。该智能体采用“1×N”架构,通过一个城市级智能中枢平台联动多个垂直领域,旨在实现城市治理与社会服务的智能化升级,为城市发展注入“AI+”新动能。

科大讯飞最新发布!打造下一代智能交互新范式

科大讯飞在深圳举办智能交互产品升级发布会,主题为“交互领航智启新章”。

在发布会上,AIUI、机器人超脑、虚拟数字人与讯飞星辰四大开发平台亮相,展示软硬件协同优化成果。

科大讯飞发布十大场景化方案,涵盖办公、人力与企业数字化等刚需场景,推动AI技术从通用能力向垂直场景转化。

全球AI开源贡献榜出炉,阿里千问跻身全球前五、中国第一

全球最大的AI开源社区Hugging Face发布最新AI开源贡献榜,阿里通义千问跻身全球第五、中国第一,DeepSeek位列第九,是前十中唯二的非美国机构。

榜单考察开源模型、数据集、开发者关注度、社区活跃度及全球影响力等指标。

Tolan已在全球获得超 500 万次下载,ARR超 400 万美元

AI陪伴应用Tolan凭借独特外星人形象和情感互动模式,获得超500万下载量,ARR达400万美元。

Tolan由西雅图初创公司Portola开发,主打与外星生物“交朋友”,通过语音交互、情绪回应和个性成长机制,为用户提供温暖陪伴。

字节跳动 Seed 团队正式发布视频生成基础模型 Seedance 1.0

字节跳动Seed团队发布Seedance 1.0视频生成模型。模型支持文字与图片输入,可生成多镜头无缝切换的1080p高品质视频,具备原生多镜头叙事能力、更强运动生成效果、支持多种风格创作等亮点,40多秒能完成5秒1080p视频的生成任务。

在第三方评测榜单Artificial Analysis中,Seedance 1.0文生视频、图生视频两个任务均位居首位。

 

02. 新产品发布

 

Dia 浏览器向 Arc 用户开放下载,推出“外部记忆体”功能

所有 Arc 用户可直接访问官网下载安装,每位用户还可获得 3 个邀请码,支持新用户加入。

Dia 浏览器推出了革命性的 AI 驱动功能——“外部记忆体”,将用户的浏览历史转化为一个可交互、可分析的个人智能知识库。

主要特性包括:

@History 模糊搜索:通过模糊的记忆片段或关键词高效检索浏览历史。

自然语言提问:支持用自然语言提问,例如“帮我找一下上周看过的关于 AI Agent 的论文”。

自动生成分析报告:基于特定时间段或主题的浏览数据生成结构化分析报告。

夸克发布行业首个高考志愿大模型

夸克APP发布行业首个高考志愿大模型,为考生提供全新高考志愿服务。

模型推出全新专业的高考知识库,通过【夸克搜索】可提供专业、准确的大学、专业查询及志愿问题解答。

腾讯元宝“高考志愿咨询”功能上线:可提供专属深度建议

腾讯元宝“高考志愿咨询”功能正式上线。用户在元宝手机端、电脑版或网页版升级至最新版本后,选择任意模型并开启深度思考,提问志愿填报相关问题,元宝将自动触发深度搜索并提交专属深度建议。

阿里国际站发布首个外贸营销智能体 OKKI AiReach

阿里国际站旗下智能工作台OKKI发布了其首个外贸营销智能体(AI Agent) OKKI AiReach。

该工具能主动分析供应链图谱、精准挖掘潜在客户,旨在帮助外贸商家寻找生意增量。

内测数据显示,使用后营销打开率提升至15%,询盘上涨3倍。

Meta 推出基于视频训练的世界模型 V-JEPA 2

Meta推出基于视频训练的世界模型V-JEPA 2,由首席AI科学家Yann LeCun介绍。

模型拥有12亿参数,基于联合嵌入预测架构(JEPA)构建,具备先进的环境理解与预测能力,能在新环境中完成零样本规划与机器人控制。

V-JEPA 2通过自监督学习训练,无需人工注释,可用于辅助技术、混合现实指导、个性化教育等领域。

OpenAI 发布 o3-pro升级版推理模型,支持调用ChatGPT全套工具

OpenAI发布o3-pro模型,价格暴降 80%,高性能+低价格,替代o1-pro向Pro和Team用户开放。

o3-pro是推理模型o3的升级版,处理复杂问题、精准回答能力更强,支持调用ChatGPT全套工具,响应速度稍慢,适合对答案准确性要求高的场景。o3-pro在表达清晰度、答案完整性等方面优于o3。

字节跳动推出豆包大模型 1.6,使用成本降至三分之一

在火山引擎Force原动力大会上,字节跳动宣布豆包大模型升级至1.6版,推理、数学、指令遵循等能力大幅提升,达到全球第一梯队水平。

豆包 1.6 系列模型支持多模态理解和图形界面操作,能理解和处理真实世界问题。

腾讯发布混元3D 2.1:首个完全开源AI 3D建模工具上线

腾讯正式发布并全面开源了混元3D 2.1模型,这是业界首个从模型到代码均完全开源的AI 3D生成工具。

该模型支持PBR物理渲染,能高精度还原真实材质,单张图生成3D模型仅需30秒。得益于其高效架构,用户在单张消费级GPU上即可完成部署和推理,极大降低了使用门槛,为游戏、动漫、电商等行业带来革命性的效率提升。

 

其他动态

 

豆包一句话P图升级,基于最新图像编辑模型SeedEdit 3.0,支持更多,P图玩法,包括一键添加或替换文字局部P图和风格切换,主体保持不变。

Genspark公司推出创新性人工智能浏览器——Genspark AI Browser。内置智能助手,可帮助用户查找更优交易、比较产品、分析评论,辅助决策。“自动驾驶模式”能自动浏览信息源、收集资料、访问高级数据库,完成复杂网页任务。支持MCP连接700多种工具,实现工作流程自动化,具备广告拦截功能。

商汤科技的“小浣熊家族”与蚂蚁集团的“蚂蚁百宝箱”正式达成生态合作,联合打造“AI数据分析助手”,为用户提供大模型服务,后续将登陆支付宝平台。

中国天气智能体台风频道正式上线。作为国内首个天气智能体,融合气象传媒与人工智能技术,可实时推送台风预警信息,查询台风路径及图文、视频等内容。频道通过精准监测和贴心服务,为用户提供台风动态、预警推送、防御指南及科普知识。

谷歌上线 Weather Lab 气象预测网站,引入 DeepMind AI 模型,可预测台风的生成时间、路径、强度等,模拟未来 15 天多达 50 种气象发展场景。网站提供与欧洲中期天气预报中心传统模型的对比功能,帮助用户更早获取气旋信息。    ·

全球最大资管机构贝莱德已构建名为Asimov的AI研究平台。该虚拟分析师可24小时不间断地分析公司财报、研报和各类文件,以生成投资洞见。此举是金融业大规模应用AI的缩影,旨在提升投研效率和深度。

Manus现已接入Veo3模型,带来更出色的视觉表现力,角色对话更自然,音画同步更准确,故事叙事更流畅可以创作出电影级别的视觉体验。面向Basic,Plus,Pro会员开放使用。

知乎知名答主夕小瑶团队推出全球首个A2A范式Agent——Teamo。产品定位为知识工作者的超级Agent,采用Agent-to-Agent(A2A)范式,由“Teamo队长”统一指挥,各领域专业Agent协同工作,模拟真实团队作业。

普林斯顿大学与复旦大学联合推出全球首个历史领域AI评测基准HistBench及AI历史助手HistAgent。HistAgent集成文献检索、OCR识别、多语言翻译等工具,专为历史研究优化,在HistBench测试中表现远超现有模型。

OpenAl、Anthropic和 Google与 Lovable 合作,在本周末举办 AI 对决,周末期间,每个人都能不限量免费使用 Lovable生成代码,比较各模型 vibe coding 的表现。活动期间构建的网页还能分 65000 美金的奖金。

 

03. 开源项目

 

Mistral 推出推理模型 Magistral 系列,Small 版已开源

法国AI实验室Mistral推出推理模型Magistral系列,包含Magistral Small和Magistral Medium两个版本。

Magistral Small拥有240亿参数,已在Hugging Face平台开源;Magistral Medium能力更强,处于预览阶段,仅在特定平台提供。

小红书hi lab团队首次开源文本大模型 :dots.llm1

小红书hi lab(人文智能实验室)首次开源文本大模型dots.llm1。模型是中等规模的Mixture of Experts(MoE)语言模型,总参数量1420亿,激活参数140亿。在训练11.2万亿token高质量数据后,性能可与Qwen2.5-72B媲美。

Databricks开源其核心ETL框架Delta Live Tables

在其年度Data + AI峰会上,Databricks宣布将其核心的声明式ETL(数据提取、转换和加载)框架以“Apache Spark Declarative Pipelines”的名义开源。

此举旨在帮助开发者更高效、可靠地构建和运行数据处理流程,加速数据管道构建速度高达90%。

 

04. 投资融资

 

美泰公司与 OpenAI 合作,将生成式AI技术引入玩具开发

美泰公司与 OpenAI 达成合作,将生成式 AI 技术引入玩具开发和 IP 重塑业务。是 OpenAI 首次与玩具厂商合作,通过 AI 提升粉丝互动体验。美泰计划今年稍晚推出首款“AI 赋能产品”,包括实体玩具和互动体验。

靠ChatGPT狂飙,OpenAI年化经常性收入突破百亿美元

OpenAI自推出ChatGPT不到三年,年化经常性收入(ARR)已突破100亿美元,较去年增长近80%。该收入包括消费者产品、ChatGPT商业产品及API销售收入,不包含微软授权收入等。目前OpenAI拥有300万付费商业用户。

AI 编程工具 Cursor 快速崛起,20 个月实现 1 亿美元年化收入

Cursor AI 编程工具,由 AnySphere 联合创始人兼 CEO Michael Truell 创立,上线 20 个月实现 1 亿美元年化收入,两年达 3 亿美元。

成功源于重构软件开发流程,提升人类指令表达能力。团队曾尝试机械工程领域,后回归编程,放弃插件形式,构建完整 IDE。

Meta豪掷143亿美元收购Scale AI 49%股权,创始人加盟

Meta Platforms宣布以143亿美元收购数据标注公司Scale AI 49%的股份,同时Scale AI的28岁华人创始人Alexandr Wang将加入Meta,此举被视为Meta重振其AI雄心的关键一步,但也引发了行业关于数据质量和高额开支的讨论。

3D大模型公司VAST再次完成数千万美元的Pre-A+轮融资

3D大模型公司VAST完成数千万美元Pre-A+轮融资,由北京市人工智能产业投资基金领投,靖亚资本跟投。

VAST同时发布全球首个AI驱动的一站式3D工作台Tripo Studio,即将推出全新算法Tripo 3.0。融资将重点投入Tripo系列大模型研发及Tripo Studio产品及生态平台建设。

硅基流动完成新一轮数亿元融资,阿里云领投

硅基流动宣布完成数亿元人民币A轮融资,由阿里云领投,创新工场等老股东超额跟投,华兴资本担任独家财务顾问。

硅基流动专注于AI基础设施领域,通过技术突破和产品创新,有效解决国内AI行业发展难题。

英伟达、三星联手投资 AI 机器人公司 Skild AI,估值达 45 亿美元

英伟达和三星电子将联手投资AI机器人创业公司Skild AI,分别投资2500万美元和1000万美元。

Skild AI专注于机器人软件开发,此次投资属于其B轮融资的一部分,公司估值约45亿美元,软银集团领投1亿美元。

英伟达正推广“实体AI”概念,认为其将成为重要收入来源;三星则希望通过投资保持对Skild及其人才的了解。

高通宣布以24亿美元收购英国芯片IP公司Alphawave

芯片巨头高通宣布以约24亿美元现金收购英国半导体IP企业Alphawave。此次收购旨在加强高通在AI算力高速互联技术(SerDes)方面的能力,是其在数据中心领域的重要战略布局。

宁波博登智能完成亿元A轮融资,上海国资领投

宁波AI数据服务商“博登智能”宣布完成亿元A轮融资,由上海国际集团旗下的国和投资领投,公司估值达到7亿元。

该公司核心产品为基于AI的数据自动化标注平台,融资将用于技术深化和全球市场拓展。

 

05. 观点洞察

 

Ben Mann (Anthropic联合创始人): 未来是专业子代理协作的时代

Anthropic联合创始人Ben Mann认为,AI应用的未来正朝着能执行长期复杂任务的“代理性”方向发展。

未来的最优架构将是由一个通用的顶层模型(如Opus)扮演“编排者”,负责规划任务,然后分派给一系列更小、更高效、更专业的“子代理”或专用工具模型来执行,这能显著降低成本与延迟。

英伟达CEO黄仁勋:未来十年是自动驾驶与机器人的时代

英伟达CEO黄仁勋在Viva Tech科技大会上表示,未来几年,自动驾驶汽车和机器人技术将迎来蓬勃发展。他断言:“这是自动驾驶汽车、机器人和自动化机器的十年”,预示着物理世界的AI应用将成为下一个主要增长点。

北大教授陈钟:AI重塑金融服务,需警惕新型系统性风险

北京大学教授陈钟指出,AI正深刻重塑金融服务模式,但同时也带来了数据安全、模型偏见等新型系统性风险。他强调,金融业必须先行建立负责任的AI伦理与治理准则,并将公平性、可解释性、稳健性等核心价值嵌入AI系统全生命周期。

郭明錤预测苹果WWDC 2025将聚焦生成式AI整合

知名分析师郭明錤预测,苹果在即将召开的WWDC 2025上将把重心放在生成式AI上。预计苹果将重塑Siri品牌,深度整合AI与操作系统,并向开发者开放AI能力接口,以提升全场景用户体验和强化隐私保护。

你不关心AI,AI就会关心你——Ilya Sutskever多伦多大学演讲要点

Ilya Sutskever 在其母校多伦多大学的演讲中提出:“你不去关心AI,AI就会来关心你!” 这一观点呼应了他对人工智能未来影响的深刻洞察。他坚信基于大脑是生物计算机这一逻辑,数字大脑(AI)终将无所不能,完成人类所能做的一切。面对AI带来的巨大挑战与机遇,他强调最好的应对方式是亲自体验顶尖AI技术,从而形成对其能力的真实认知。

他表示:“AI 带来的挑战,在某种意义上,是人类有史以来最大的挑战,而克服它也将带来最大的回报。无论你喜不喜欢,你的人生都将在很大程度上受到 AI 的影响。因此,去关注它,去留意它,然后产生出能量去解决那些即将出现的问题,这将是最重要的事情。”

猎豹移动董事长傅盛:AI与硬件结合及应用是未来焦点

猎豹移动董事长傅盛认为,未来大模型可能成为类似公共资源的存在,而真正的机会在于AI与硬件的结合(如智能服务机器人)以及具体的AI应用。他指出,几乎所有业务都能用AI重做一遍,创业者需要洞察用户需求与技术的结合点。

原文链接:AI周刊丨本周不可错过的AI行业动态(6.9-6.15)