Author: Chimy

  • Piczoo – AI图像编辑工具,智能拼图等多功能图片处理

    Piczoo是什么

    Piczoo是西安纽扣软件科技有限公司推出的多功能图片编辑应用。集成拼图、长图拼接、修图模板、滤镜贴纸和花体字等多种编辑功能,为用户提供一个全面的图片处理平台。用智能拼图功能快速创建个性化的图片布局,用滤镜相机直接拍摄添加滤镜效果,或用艺术字体和贴纸为图片增添趣味。Piczoo支持一键分享到各大社交平台,满足用户在社交媒体上分享美图的需求。

    Piczoo

    Piczoo的主要功能

    • 智能拼图:提供多种布局自动匹配,一键生成海量拼图布局,满足个性化拼图需求。
    • 滤镜相机:直接拍出带滤镜效果的图片,提供多款“光效”滤镜,为图片增加自然光影效果。
    • 拼图拼贴:拥有丰富的模板样式,内置纯色渐变背景色盘和不同风格背景图片,让图片排版更有趣。
    • 艺术字体:提供多种字体样式,适配英语、日语、中文等多种语言,增加图片的视觉效果。
    • 贴纸:提供像素风、手绘风、图形、Emoji等多种风格贴纸,用于装饰图片。

    如何使用Piczoo

    • 下载和安装:iOS设备访问苹果应用商店,下载并安装。
    • 打开应用:完成安装后,点击应用图标打开Piczoo。
    • 选择功能:应用主界面展示不同的功能模块,如拼图、滤镜相机、艺术字体等,选择需要的功能。
    • 导入图片:根据所选功能,选择从相册导入图片,或用Piczoo的相机功能拍摄新照片。
    • 编辑图片:用Piczoo提供的工具进行编辑,比如应用滤镜、添加贴纸、调整图片布局等。
    • 应用滤镜和贴纸:选择喜欢的滤镜增强图片效果,或添加有趣的贴纸个性化图片。
    • 调整和优化:调整图片的大小、位置和角度,确保在拼图中看起来恰到好处。
    • 使用艺术字体:如果需要,为图片添加艺术字体,增强视觉效果。
    • 添加图形边框:选择一个图形边框来装饰图片,让图片更具吸引力。
    • 保存和分享:编辑完成后,将图片保存到设备上,或直接用Piczoo分享到微信、微博、Instagram等社交平台。

    Piczoo的的应用场景

    • 社交媒体分享:用户编辑和美化图片,分享到微信朋友圈、微博、Instagram、Facebook等社交平台,吸引更多关注和点赞。
    • 旅行记录:在旅行时,将多张风景照片拼接成长图,或应用滤镜和贴纸,让旅行照片更加生动有趣。
    • 美食分享:美食爱好者拍摄美食照片,应用美食滤镜和贴纸,让食物看起来更加诱人,分享给朋友或在美食社区中展示。
    • 日常点滴记录:用户记录日常生活中的点点滴滴,如宠物、孩子成长、朋友聚会等。
    • 节日和活动:在节日或特殊活动时,用户制作节日主题的图片,如圣诞节、新年、生日等,添加节日元素和祝福语,发送给亲朋好友。
  • TextHarmony – 字节联合华东师范推出的多模态生成模型

    TextHarmony是什么

    TextHarmony是华东师范大学和字节跳动共同推出的多模态生成模型,擅长理解和生成视觉文本。模型基于Slide-LoRA技术,动态聚合特定于模态和模态无关的LoRA专家,部分解耦多模态生成空间,在单一模型实例中协调视觉和语言的生成。TextHarmony在视觉和语言模态之间实现更统一的生成过程。研究团队推出高质量的图像字幕数据集DetailedTextCaps-100K,基于高级闭源MLLM合成,进一步提升模型的视觉文本生成能力。

    TextHarmony

    TextHarmony的主要功能

    • 视觉文本理解:TextHarmony能理解图像中的文本信息,执行如场景文本检测、识别、文档理解、视觉问题回答(VQA)和关键信息提取(KIE)等任务。
    • 视觉文本生成:模型根据文本描述生成图像,在生成的图像中渲染准确且连贯的文本。
    • 视觉文本编辑:TextHarmony替换或在图像的特定位置渲染文本,且保持背景的一致性。
    • 视觉文本感知:模型具备基本的光学字符识别(OCR)能力,能检测和识别图像中的文字。

    TextHarmony的技术原理

    • Slide-LoRA:动态聚合模态特定和模态无关的LoRA(Low-Rank Adaptation)专家的方法,部分解耦多模态生成空间,让模型在单一实例中生成视觉和语言模态时更加协调。
    • 多模态预训练:TextHarmony在包含丰富文本的图像-文本语料库上进行预训练,学习生成多模态输出。
    • 综合微调:在预训练的基础上,TextHarmony在文本为中心的任务上进行微调,提升模型在多模态生成和遵循人类指令方面的能力。
    • 高质量数据集:创建DetailedTextCaps-100K数据集,提供详细的图像字幕对,字幕对在图像生成任务中关注视觉和文本元素,显著提高图像生成的质量。
    • 模型架构:TextHarmony的架构包括视觉编码器、LLM(大型语言模型)和图像解码器,组件协同工作生成视觉和文本内容。最大化条件概率,实现文本和图像的交织令牌序列的生成。

    TextHarmony的项目地址

    TextHarmony的应用场景

    • 文档分析:TextHarmony用在自动化处理和理解文档中的文本内容,例如自动识别和提取文档中的关键信息,提高文档管理的效率。
    • 场景文本识别:在城市监控、自动驾驶等领域,TextHarmony识别和理解街景、广告牌、交通标志等场景中的文本信息。
    • 视觉问题回答(VQA):TextHarmony能回答有关图像内容的问题,在教育、娱乐和智能助手领域有广泛应用。
    • 图像编辑和增强:在设计和媒体制作中,TextHarmony根据需要在图像中添加或修改文本,提高创意工作的灵活性。
    • 信息检索:TextHarmony帮助开发更智能的搜索引擎,理解图像中的文本内容来提供更准确的搜索结果。
  • Exemplary AI – AI驱动的生成多种内容形式的视频转录编辑工具

    Exemplary AI是什么

    Exemplary AI是基于AI技术帮助用户将长视频转换成短视频片段,生成摘要、笔记、博客、章节、文字记录等多种内容形式的转录编辑工具。平台具有自动生成社交媒体描述、字幕、章节标题等功能,支持120多种语言的字幕生成,让内容创作者能轻松地将视频和音频内容转化为吸引眼球的文本内容。用户只需上传文件,Exemplary AI基于AI技术进行内容的转换和编辑,用户能下载或直接在社交媒体上分享内容。工具简化内容创作过程,适于多个行业,帮助用户释放内容的潜力。

    Exemplary AI

    Exemplary AI的主要功能

    • 视频内容转换:将长视频快速转换成适合社交媒体的短视频片段。
    • 文本记录与编辑:提供高准确率的文字记录,支持用户基于文字记录编辑视频。
    • 社交媒体优化:自动生成视频内容的社交媒体描述、字幕、章节和标题。
    • AI写作:用简单的提示,基于AI技术将视频和音频内容转换成吸引人的文本内容。
    • 多语言支持:支持生成和翻译超过120种不同语言的字幕,帮助内容创作者触及全球观众。

    Exemplary AI的产品官网

    Exemplary AI的产品定价

    • 免费版:每月60分钟上传时间,单用户访问,14天数据保留,上传文件最大1GB,上传视频最长1小时。
    • 入门版($9/月或$108/年):每年2400分钟上传时间,包括1个工作区用户,存储空间100GB,上传文件最大2GB,上传视频最长4小时。
    • 专业版($19/月或$228/年):每年7200分钟上传时间,3个工作区用户,存储空间500GB,上传文件最大4GB,上传视频最长8小时。
    • 团队版:价格定制,为大型团队和企业提供定制计划,定制上传分钟数,多用户和自定义存储。

    Exemplary AI

    Exemplary AI的应用场景

    • 社交媒体营销:将长视频内容转换成适合不同社交媒体平台的短视频,提高用户参与度和内容的传播力。
    • 内容创作与分发:为博客、新闻网站和在线杂志等创建和发布内容,提高内容的多样性和吸引力。
    • 教育与培训:将讲座或课程视频转换成文字记录和摘要,方便学生复习和教师备课。
    • 企业培训与发展:将内部培训视频转换成易于搜索和引用的文本内容,提高培训材料的可用性。
    • 播客和音频内容:为播客和其他音频内容生成文字记录,方便听众在无法听音频时阅读内容。
  • FP Video – AI图像编辑应用,覆盖多场景的图像创意编辑

    FP Video是什么

    FP Video 是多功能AI驱动的图像编辑应用,提供包括AI绘画、照片修复、换发型、卡通头像制作、时光机等多种创意工具。基于先进的AI技术,让用户能轻松修复老照片、定制个性化头像、尝试不同发型,及进行多种创意编辑。FP Video 提供一键消除路人、抠图换背景等功能,满足用户在不同场景下的图片编辑需求。

    FP Video

    FP Video的主要功能

    • AI绘画:将用户的照片或文字描述转换成不同风格的艺术作品。
    • 照片修复:用AI技术修复破损或老旧的照片,消除折痕和污渍,恢复照片的原始色彩和清晰度。
    • AI写真:将普通照片转换成具有不同艺术风格(如簪花、民族、新年风格)的写真。
    • 换发型:让用户尝试不同的发型和发色,无需实际改变,预览新造型。
    • AI扩图:扩展照片的比例或角度,智能补充照片缺失的部分。
    • 消除路人:用AI技术从照片中移除不需要的背景人物或其他对象。

    如何使用FP Video

    • 下载和安装:iOS设备访问苹果应用商店,安卓设备访问手机应用商店下载并安装。
    • 浏览功能:应用主界面展示不同的功能模块,如AI绘画、照片修复、换发型等。
    • 选择功能:根据想要进行的操作,选择相应的功能模块。
    • 上传图片:从相册中选择一张图片或直接用应用拍摄一张新照片。
    • 编辑图片:根据所选功能,进行编辑选项。例如,在AI绘画中,选择不同的艺术风格;在照片修复中,选择修复的强度等。
    • 应用效果:选择好编辑选项后,用AI技术处理图片。处理完成后,预览效果。
    • 保存或分享:如果对编辑后的效果满意,保存到相册或直接分享到社交媒体。

    FP Video的应用场景

    • 个人照片编辑:用户用FP Video美化个人照片,如调整肤色、去除皮肤瑕疵、改变发型和发色等。
    • 修复老照片:基于AI技术修复破损或褪色的老照片,恢复原有的色彩和清晰度。
    • 艺术创作:将普通照片转换成不同风格的艺术作品,如油画、漫画、水墨画等,为个人作品增添艺术感。
    • 社交媒体内容制作:为社交媒体平台制作独特的图片和视频内容,吸引更多关注和互动。
    • 虚拟试妆:在特殊场合前,用户虚拟试妆,预览不同妆容效果,选择最适合自己的妆容。
  • 清言浏览器插件 – 智谱AI推出的浏览器AI辅助工具

    清言浏览器插件是什么

    清言浏览器插件是智谱清言推出的一款基于智能Agent技术的浏览器插件,能够理解用户意图并自动完成复杂任务。清言浏览器插件集成了通用对话、页面总结、智能写作等功能,并支持AutoGLM、站内高级检索等高级功能。无论是学术研究、工作办公还是日常浏览,清言都能成为您的好帮手,大幅提升效率,让上网更轻松便捷。

    qingyan-webagent

    清言浏览器插件的主要功能

    通用功能

    • 通用对话: 与插件进行自然语言对话,获取信息、解决问题等。
    • 页面总结: 自动总结当前网页内容,提取关键信息。
    • 页面对话: 在网页上进行对话,例如对文章进行评论、提问等。
    • 划线工具: 在网页上划线,标记重点内容。
    • 智能写作: 辅助写作,例如生成文章大纲、改写句子等。
    • 网页翻译: 将网页内容翻译成其他语言。

    高级功能

    • AutoGLM: 将用户输入的自然语言指令转换为机器指令,实现更智能的交互。
    • 站内高级检索: 支持站内高级检索,方便用户快速找到所需信息。
    • 多链接总结: 自动总结多个链接的内容,提高信息获取效率。
    • Github Issue问答: 帮助用户快速回答Github Issue问题。

    如何使用清言浏览器插件

    • 安装插件
      • 访问清言浏览器插件官方网站,选择Chrome商店下载,点击“添加至Chrome”或“获取”,选择“添加扩展程序”完成安装。
      • 或下载CRX安装包,在浏览器的扩展程序页面开启开发者模式,将下载的CRX文件拖入扩展程序页面进行安装。
    • 启动插件:安装完成后,在浏览器的右上角或侧边栏看到一个清言的图标或悬浮球。
    • 使用AutoGLM:输入的自然语言指令转换为机器指令,实现更智能的自动交互,帮你完成指定任务。
    • 使用站内高级检索:输入具体的搜索任务并执行,插件自动在当前网站中进行搜索和总结。
    • 使用多链接总结:在网页的输入框中,点击清言的写作按钮,唤醒写作助手,协助进行写作。
    • 使用Github Issue问答:选择后能快速回答Github Issue问题。
    • 探索更多功能:清言插件其他功能,用点击插件图标或悬浮球探索和使用。

    清言浏览器插件的产品定价

    • 清言浏览器插件目前是完全免费的。

    清言浏览器插件的应用场景

    • 学术研究:清言插件能帮助学术研究人员快速检索文献、总结内容、辅助写作,提升学术研究的效率和准确性。
    • 工作办公:对于职场人士,清言插件是高效工作助手,帮助快速获取信息、撰写报告、管理邮件,提高工作效率。
    • 日常浏览:对于日常用户,清言插件能够简化信息获取过程,例如自动总结文章、翻译内容,让上网更轻松便捷。
    • 在线学习:清言插件可以帮助在线学习者更高效地学习,例如生成学习笔记、翻译课程内容,提升学习效果。
    • 翻译工作:对于翻译从业者,清言插件可以成为翻译助手,帮助快速翻译文档、邮件等,提高翻译效率。
    • 游戏攻略:清言插件可以帮助游戏爱好者获取游戏攻略、心得等,提升游戏体验。
  • EVERYPIXEL – AI图片搜索引擎,支持颜色、方向、图像类型多种搜索过滤器

    EVERYPIXEL是什么

    EVERYPIXEL是AI驱动的图片搜索引擎,基于先进的算法和机器学习技术,帮助用户找到所需的图片资源。EVERYPIXEL支持多种搜索过滤器,包括颜色、方向和图像类型等,提高搜索效率。EVERYPIXEL提供无缝图案功能,支持用户创建定制的图案。EVERYPIXEL支持用户搜索特定作者的作品,或直接用粘贴图片URL搜索相似的图片。对于专业设计师或普通用户,EVERYPIXEL能提供强大的帮助,提升设计效率和创新能力。

    EVERYPIXEL

    EVERYPIXEL的主要功能

    • 智能图片搜索:用AI技术,帮助用户快速找到所需的图片,支持用关键词、颜色、方向等条件进行筛选。
    • 多来源索引:聚合超过50个付费和免费图片库的资源,用户能在一个平台上搜索到广泛来源的图片。
    • 免费图片搜索:提供来自22个图库的免费图片,方便用户寻找无需版权费用的图像资源。
    • 无缝图案功能:用户创建和搜索可定制的无缝图案,适合需要背景纹理或图案设计的用户。
    • 图像和作者搜索:用户上传图片或搜索作者名找到相似的图片或特定作者的作品。

    EVERYPIXEL的产品官网

    EVERYPIXEL的应用场景

    • 平面设计:设计师l搜索高质量的图片素材,用在广告、海报、宣传册等平面设计项目。
    • 网站和应用开发:开发者寻找合适的图片资源,用在网站背景、应用界面设计或用户界面元素。
    • 内容创作:博客作者、社交媒体运营者和内容营销人员找到吸引人的图片,增强内容的吸引力。
    • 教育和学术研究:教师和研究人员搜索版权清晰的图片,用在教学材料、学术报告或研究论文的插图。
    • 电子商务:电商网站和在线商店寻找产品图片,用在商品展示、促销活动或提高网站的视觉吸引力。
  • EveryoneNobel – AI图像生成工具,生成个性化诺贝尔奖风格图像

    EveryoneNobel是什么

    EveryoneNobel是一个开源AI工具,为每个人生成个性化的诺贝尔奖风格图像。EveryoneNobel基于ComfyUI框架,结合HTML模板和图像生成技术,用户只需上传肖像照片、提供基本信息,如姓名和获奖主题,系统能自动生成独具特色的诺贝尔奖“奖状”。工具简化荣誉图像的制作流程,且支持个性化定制,非常适合社交媒体分享和各种庆祝场合。

    EveryoneNobel

    EveryoneNobel的主要功能

    • 生成个性化诺贝尔奖风格图像:用户上传个人肖像照片,输入姓名和获奖主题,系统自动生成带有这些信息的诺贝尔奖风格图像。
    • 基于ComfyUI框架的图像生成:用ComfyUI框架的高度灵活性,确保生成的图像风格独特且细节丰富。
    • HTML模板展示文本:用HTML模板在图像上展示用户输入的文本信息,如获奖者姓名和奖项主题。
    • 个性化定制选项:支持用户根据个人喜好调整图像内容和样式,进一步个性化定制。

    EveryoneNobel的技术原理

    • 图像生成:用ComfyUI框架,生成具有独特风格和丰富细节的图像。
    • 文本处理:基于HTML模板技术将用户输入的文本信息(如姓名和获奖主题)添加到生成的图像上。
    • 用户交互:提供一个用户友好的界面,让用户能轻松上传图片和输入所需文本。
    • 自定义选项:支持用户调整图像的各种参数,如颜色、字体和布局,满足个性化需求。

    EveryoneNobel的项目地址

    EveryoneNobel应用场景

    • 社交媒体互动:用户生成个性化的诺贝尔奖风格图像,分享到社交媒体平台,增加趣味性和互动性。
    • 个人成就展示:个人庆祝和展示自己的成就,比如在职业发展、学术研究或其他领域获得的重要里程碑。
    • 教育和学术:教师和学生创造有趣的学习材料,或者作为学术成就的一种认可方式。
    • 团队激励:企业或组织生成个性化的荣誉证书,用在表彰员工或团队的卓越表现。
    • 特殊场合庆祝:在生日、纪念日或其他特殊场合,生成特别的诺贝尔奖风格图像作为礼物或庆祝方式。
  • vidyo.ai – AI视频编辑工具,智能剪辑识别长视频中精彩片段

    vidyo.ai是什么

    vidyo.ai 是AI视频编辑工具,能将长视频内容自动转换成适合社交媒体平台的短视频片段。基于AI技术分析视频,识别精彩瞬间,实现一键剪辑,简化视频编辑流程。 vidyo.ai 提供智能剪辑、调整播放速度、自动静音和降噪、自动生成字幕及适应不同平台的视频尺寸调整等功能。vidyo.ai支持多种语言(目前支持英语、西班牙语、德语和法语),适合内容创作者和品牌提升观看量和互动,无需复杂的编辑技能就能制作出专业级别的视频内容。

    vidyo.ai

    vidyo.ai的主要功能

    • 智能剪辑(IntelliClips):AI自动识别视频中的关键时刻,剪辑成适合社交媒体的短视频。
    • 视频尺寸调整:根据各个社交媒体平台的要求,自动调整视频的尺寸和格式。
    • 自动生成字幕:基于AI技术为视频添加字幕,提高视频的可达性和观看体验。
    • 调整播放速度:支持用户根据需要调整视频的播放速度,创造不同的视觉效果。
    • 自动静音和降噪:智能检测、消除不需要的静音部分和背景噪音,提升音频质量。

    vidyo.ai的产品官网

    vidyo.ai的产品定价

    • 免费计划:每月75个信用点,支持720p渲染质量,创建短视频剪辑。
    • 增长计划(Growth Plan):包年¥25/月,包月¥49/月。每月600个信用点,无限制的1080p视频剪辑,一键安排到6个以上平台。
    • 定制计划(Custom Plan):价格定制,支持多达5个品牌工具包,为多达5个人管理社交媒体账户。

    vidyo.ai

    vidyo.ai的应用场景

    • 社交媒体内容创作:将长视频剪辑成适合Instagram Reels、TikTok、YouTube Shorts等平台的短视频,增加用户互动和参与度。
    • 品牌营销:为企业和品牌创建吸引人的宣传视频,提高品牌知名度和产品宣传效果。
    • 教育和培训:制作教育内容的短视频,如课程要点总结、教学技巧展示等,便于学生快速学习和复习。
    • 播客和视频博客:将播客音频或视频内容转换成视觉吸引人的短视频,吸引更多听众和观众。
    • 新闻和媒体:快速制作新闻摘要或热点事件的短视频,提高新闻内容的传播速度和观看率。
  • ReadPo – AI读写助手,支持内容聚合快速阅读并总结

    ReadPo是什么

    ReadPo是专为知识创作者设计的AI驱动的读写助手,基于整合内容聚合、AI分析和写作辅助功能,帮助用户快速从各种来源获取信息,转化为可分享的内容。ReadPo基于先进的自然语言处理和机器学习算法,ReadPo提供一个全面的平台,用在快速阅读、信息筛选、文章撰写和内容定制。ReadPo特别适合公众号、Newsletter、Blog、简讯、信息卡片等创作场景,能端到端完成收集、阅读、写作和发布任务。ReadPo提供将Markdown内容转换为图文海报的功能,方便用户在小红书等平台分享文章。

    Readpo-website

    ReadPo的主要功能

    • 内容聚合:从Google News、RSS订阅源、Twitter等渠道获取信息。
    • AI驱动的分析:自动对收集到的内容进行评分和排序,帮助用户快速识别重要信息。
    • AI辅助写作:提供写作提示,帮助用户基于选定的主题或信息源生成文章。
    • 图文海报生成:将Markdown内容转换成图文海报,方便在社交媒体等平台上分享。
    • 主题阅读:支持用户创建不同的主题,围绕主题聚合和阅读相关内容。
    • 内容定制:用户根据需要调整文章的主题、字体、背景等,适应不同的发布平台。

    ReadPo的产品官网

    ReadPo的产品定价

    • Free(免费版):创建1个主题,每月30积分,至多可抓取900篇内容,至多可生成10篇文章或海报。
    • Starter(入门版):$8.3/月(限时早鸟优惠50%)无限制创建主题,每月250积分,至多可抓取7500篇内容,至多可生成50-62篇文章或海报,解锁全部海报模板。
    • Pro(专业版):$25/月(限时早鸟优惠50%)每月800积分,每月至多可抓取240,000篇内容,每月至多可生成160-200篇文章或海报,支持切换微调过的自定义写作大模型。

    Readpo

    ReadPo的应用场景

    • 公众号运营:公众号作者用ReadPo快速搜集相关主题的信息,生成高质量的文章,转换成图文海报形式,吸引更多读者。
    • 博客写作:博客作者聚合相关话题的内容,用AI辅助写作功能快速撰写博文,优化文章结构和表达。
    • 新闻编辑:新闻工作者追踪最新的新闻动态,快速整理和撰写新闻稿件,提高报道的时效性和准确性。
    • 学术研究:研究人员聚合大量的学术资料,用AI辅助分析和写作功能,加速学术论文的撰写和发表。
    • 内容营销:营销人员收集市场动态和用户反馈,生成有说服力的内容营销材料,提高营销内容的吸引力和转化率。
  • AutoGLM – 智谱AI推出的模拟人类操作手机的AI智能体

    AutoGLM是什么

    AutoGLM是智谱AI团队最新推出的 “Phone Use” AI智能体,基于图形用户界面(GUI)实现自主任务完成。AutoGLM能模拟人类在手机操作,执行如社交媒体互动、在线购物、酒店预订等任务。AutoGLM能接收简单的文字或语音指令,自动完成复杂的操作流程,无需用户手动干预。

    AutoGLM的技术核心包括基础智能体解耦合中间界面和自进化在线课程强化学习框架,让AutoGLM能精确执行动作、灵活规划任务,克服传统大模型智能体在动作执行精确度和任务规划灵活性上的挑战。AutoGLM正处于内测阶段,首批开放给部分清言用户(暂时仅支持安卓系统)。

    AutoGLM

    AutoGLM的主要功能

    • 模拟人类操作手机:接收文字或语音指令,执行如微信点赞评论、淘宝购物、携程预订酒店、12306购票、美团点外卖等任务。
    • 实时操作:能实时响应指令,在手机上执行复杂的任务序列。
    • 无需API调用:不依赖于特定的API接口,直接与图形用户界面(GUI)交互。
    • 自动化任务执行:在真实环境中执行自动化任务,简化用户操作流程。

    AutoGLM的技术原理

    • 基础智能体解耦合中间界面:用自然语言指令将任务规划与动作执行解耦,提升智能体的操作能力和灵活性。
    • 自进化在线课程强化学习框架:在真实在线环境中学习和提升智能体的能力,基于自适应学习策略不断自我改进。
    • 任务规划与动作执行的分离:基于中间界面设计,让任务规划和动作执行能独立优化,提高动作执行的精确度。
    • 动态调整学习任务难度:根据智能体当前的能力水平,动态调整学习任务的难度,最大程度地利用模型潜能。
    • 策略更新与经验回放:用KL散度控制策略更新和智能体置信度经验回放,减轻模型在迭代训练中的遗忘问题。

    AutoGLM的项目地址

    AutoGLM的应用场景

    • 社交媒体管理:在社交平台上自动执行点赞、评论、分享等操作。
    • 在线购物:在电商平台上搜索商品、比较价格、下单购买、跟踪物流等。
    • 旅行预订:在旅游网站上搜索并预订酒店、机票、火车票等。
    • 外卖订购:在外卖平台上浏览菜单、下单、支付以及追踪订单状态。
    • 日常信息查询:如查询天气、新闻、股票信息等。