Category: AI项目和框架

AI工具集介绍和收录了当前流行的AI研究项目和框架,紧跟最新AI领域的进展,解读AI研究论文和方法框架,帮你快速了解这些项目的工作原理。

  • PhotoMaker – 腾讯等推出的AI人物生成和图片风格化工具

    PhotoMaker是由来自腾讯PCG部门的ARC实验室、南开大学和东京大学的研究人员最新推出的一款逼真的AI人物生成和照片风格化的开源模型和框架,可以帮助用户将上传的参考图片生成任何风格的照片/绘画/头像。该个性化的文本到图像生成方法将输入的 ID 图像编码成一个堆叠 ID 嵌入,以保留 ID 信息,然后在推理过程中合并/创建新的定制 ID,借此来生成各种风格的人物照片。

    PhotoMaker Hugging Face

    PhotoMaker生成的钢铁侠版牛顿

    PhotoMaker的功能特色

    • 快速定制:用户只需上传一张图片,输入描述性文本,即可迅速生成符合描述风格的个性化照片。
    • 生成逼真的人物:PhotoMaker 能够生成高度逼真的人物图像,无论是面部特征还是整体造型,都能达到令人信服的效果。
    • 多样的图片风格化:除了逼真的人物照片,PhotoMaker 还能将输入的图片转换为草图、漫画、动画等多种艺术风格。
    • 无需LoRA训练:与传统的AI模型不同,PhotoMaker 不需要进行LoRA训练,降低了使用门槛,使得更多用户能够轻松上手。
    • 混合不同人物特征:PhotoMaker 允许用户混合不同人物的特征,创造出全新的人物形象,为艺术创作和个性化表达提供了无限可能。
    • 改变人物的年龄和性别:用户可以调整照片中人物的年龄和性别,例如生成年轻版或女性版的有趣形象
    PhotoMaker生成的梵高

    PhotoMaker生成的梵高

    如何使用PhotoMaker

    PhotoMaker的项目主页为:https://photo-maker.github.io/,论文全文:https://huggingface.co/papers/2312.04461。用户可以通过Hugging Face的demo在线运行和体验:

    1. 访问PhotoMaker的Hugging Face项目地址https://huggingface.co/spaces/TencentARC/PhotoMaker(让照片风格化则访问PhotoMaker-Style https://huggingface.co/spaces/TencentARC/PhotoMaker-Style
    2. 上传你要个性化的人物照片(或选择示例图片)
    3. 输入文本提示,确保在要自定义的类单词后面加上触发词:img,例如:man img或woman img或girl img
    4. 选择你喜欢的风格样式模板
    5. 最后点击“Submit”按钮提交等待图片生成即可
  • Outfit Anyone – 阿里开源的一键换衣虚拟试穿项目

    Outfit Anyone是由阿里巴巴智能计算研究院推出的一个高质量服装虚拟试穿的开源项目,借助该技术,用户或模特无需亲自试穿衣服即可预览上身效果。Outfit Anyone采用双流条件扩散模型,处理模特、服装和文本提示,通过衣物图像作为控制因素实现更逼真的虚拟试穿效果。通过该技术,用户可以更加轻松地探索和选择适合自己的服装,同时也为服装设计师和零售商提供了新的创意和营销工具。

    Outfit Anyone

    Outfit Anyone的功能特色

    • 低图片输入要求:用户只需提供服饰的平铺图,即可生成服装在模特身上的试穿效果。
    • 高质量试衣输出:系统能够生成高质量的试衣效果,服装的细节和皮肤纹理都表现得非常逼真。
    • 服饰搭配支持:Outfit Anyone 支持上下装的组合搭配,能够处理各种风格的服装,并创建相应的搭配效果。
    • 灵活可扩展:系统在处理服装变形方面表现出色,可以根据需要调整模特的姿势和身体形状。
    • 广泛的适用范围:Outfit Anyone 能够处理从动漫到真实世界的各种图像,适应性强。
    • 支持不同身材试衣:系统能够适应各种体型的模特,包括健身、曲线和娇小体型,提供个性化的试穿体验。
    • 与Animate Anyone 搭配使用:Outfit Anyone 还可以与 Animate Anyone 算法结合使用,先进行服装虚拟试穿,然后生成模特穿着新服装的舞蹈视频

    如何使用Outfit Anyone

    Outfit Anyone的官方项目主页为:https://humanaigc.github.io/outfit-anyone/,目前用户可通过ModelScope魔搭或Hugging Face社区进行在线体验:

    1. 访问 Outfit Anyone 的 ModelScope demo https://modelscope.cn/studios/DAMOXR/OutfitAnyone 或 Hugging Face demo https://huggingface.co/spaces/HumanAIGC/OutfitAnyone
    2. 选择AI模特,上传或选择上衣和下衣,然后点击Run运行
    3. 等待片刻合成的试衣效果即可呈现

    Outfit Anyone ModelScope

    Outfit Anyone的应用场景

    1. 普通消费者:消费者可以在不实际试穿的情况下,预览服装在自己身上的效果,提供了一种全新的购物体验。
    2. 服装设计师:设计师可以使用这项技术来展示设计作品,通过虚拟试穿效果来吸引潜在客户,或者在设计过程中快速测试和调整服装样式
    3. 模特:对于模特来说,Outfit Anyone 可以减少实际试穿服装的时间和成本,同时提供多样化的试穿效果,帮助他们在虚拟环境中展示不同风格的服装。
    4. 电商从业者:对于预算低的商家,可以使用 Outfit Anyone 给宣传图换装,展示店铺服装上身效果,节省雇佣服装模特的成本
  • ReplaceAnything – 阿里推出的AI替换图片中物体的开源框架

    ReplaceAnything是由阿里巴巴智能计算研究院推出的一款开源AI图像内容替换框架,利用先进的人工智能技术,能够实现对照片或图像中物体的智能替换。用户可以通过简单的操作,只需框选想要保留的图像部分,输入提示词或描述来替换想要更改的图像区域,如更换人物发型、服装、背景等。这项技术为图像编辑和内容创作提供了更多的可能性,同时也为普通用户提供了便捷有趣的图像处理工具。

    ReplaceAnything

    ReplaceAnything的应用场景

    1. 服装替换:在时尚和零售行业中,可以用于展示不同服装款式在模特身上的搭配效果,或者在电商平台上提供虚拟试衣功能。
    2. 证件照背景替换:用户可以轻松更换自拍图片的背景,无需前往专门的摄影店,即可替换成不同颜色要求的证件照
    3. 人脸替换:在娱乐和社交媒体中,用户可以将照片中的脸部替换为其他人物或卡通形象,创造有趣的效果。
    4. 产品场景图替换:商家和设计师可以更换产品图片的背景,以适应不同的营销场景和广告需求。

    如何使用ReplaceAnything

    目前用户可以通过ModelScope魔搭或Hugging Face社区在线体验和使用ReplaceAnything

    1. 访问 ModelScope demo https://www.modelscope.cn/studios/damo/ReplaceAnything/summary 或 Hugging Face demo https://huggingface.co/spaces/modelscope/ReplaceAnything
    2. 在“输入图像”中上传或选择Example例图里面的一张图片
    3. 通过点击鼠标选择图像中希望保留的物体
    4. 输入对应的参数,例如prompt等,点击Run进行生成
    5. 此外支持换背景操作,上传目标风格背景调整后即可进行生成

    ReplaceAnything项目主页:https://aigcdesigngroup.github.io/replace-anything/

  • Animate Anyone – 阿里推出的图像到视频角色动画合成的框架

    Animate Anyone是由阿里巴巴智能计算研究院推出的一款将静态图像中的角色或人物进行动态化的开源框架,已在GitHub上斩获了近1.3万个星标,并在国内外引起了热烈的讨论。该框架在扩散模型的基础之上,引入了ReferenceNet、Pose Guider姿态引导器和时序生成模块等技术,以实现照片动起来时保持一致性、可控性和稳定性,输出高质量的动态化视频。阿里旗下的AI聊天助手通义千问里面的「通义舞王」功能便是基于该技术,可让照片中的人物/角色跳起科目三、抖肩舞、鬼步舞等。

    Animate Anyone

    Animate Anyone的应用场景

    • 角色动态化:无论是真人、动漫角色还是卡通形象或人形物体,Animate Anyone都能让它们动起来,为各种创意项目增添乐趣。
    • 时尚视频合成:在时尚领域,Animate Anyone能够将静态模特转化为动态展示,实现不同角度和着装效果的动态展示,为服装展示提供新的视觉体验。
    • 人类舞蹈生成:Animate Anyone 通过结合参考图像和姿态骨架动画,能够生成逼真的舞蹈视频,可以让一本真经的人物也跳起舞来。

    如何使用Animate Anyone

    Animate Anyone的项目主页为https://humanaigc.github.io/animate-anyone/,GitHub代码库地址为https://github.com/HumanAIGC/AnimateAnyone,可以通过通义千问APP或Hugging Face进行在线快速体验:

    1. Hugging Face社区Demo:访问https://huggingface.co/spaces/xunsong/Moore-AnimateAnyone,上传或拖放图像、添加动态姿态图并调节参数后点击Animate即可让图片中的角色动起来
    2. 通义千问:手机上安装通义千问APP,然后在指令中心中选择「一张照片来跳舞」或直接输入通义舞王,选择你感兴趣的舞蹈模版、上传静态照片然后即可生成动态视频