Author: Chimy

SleepFM – 斯坦福大学开源的多模态睡眠分析模型
SleepFM是什么

SleepFM 是斯坦福大学开源的多模态睡眠分析模型，基于超过14,000名参与者的100,000小时睡眠数据，通过融合大脑活动、心电图和呼吸信号，提供全面的睡眠健康评估。旨在提高睡眠分析的效率和准确性。模型采用对比学习技术，优化睡眠阶段分类和睡眠呼吸障碍检测的准确性。SleepFM 能辅助临床诊断和研究，能集成到可穿戴设备中，用于个人睡眠健康管理。开源特性为睡眠医学领域提供了一个强大的研究和应用平台。

SleepFM的主要功能
- 睡眠阶段分类：自动分析和分类个体的睡眠阶段，包括清醒、浅睡、深睡和REM睡眠。
- 睡眠呼吸障碍检测：识别睡眠期间的呼吸异常，如呼吸暂停和低通气。
- 人口统计属性预测：从生理信号中预测个体的年龄和性别。
- 数据检索：通过一种生理信号检索与之对应的其他模态信号。
- 临床辅助：辅助临床医生分析睡眠监测数据，提高诊断效率。
- 健康管理：集成到可穿戴设备中，用于个人睡眠健康的监控和管理。
- 研究与药物开发：支持睡眠相关的临床研究和药物效果监测。
SleepFM的技术原理
- 多模态数据融合：结合 BAS、ECG 和呼吸信号，信号分别来自大脑、心脏和肺部，覆盖了19 个数据通道。
- 对比学习框架：SleepFM 探索两种对比学习框架，即成对对比学习（pairwise CL）和留一法对比学习（leave-one-out CL）。成对对比学习将来自不同模态的正匹配对在潜在空间中拉近，同时推开负匹配对。留一法对比学习则是在构建对比学习样本时，将两个输入与剩下的输入构成样本对，从而从一个片段构建出三个样本对。
- 自监督预训练：通过自监督学习方法，SleepFM 在预训练阶段不依赖于标注数据，通过设计的数据增强策略和对比损失函数来学习数据的表示。
- 下游任务性能提升：预训练得到的表示用于多种下游任务，如睡眠阶段分类和睡眠呼吸障碍（SDB）检测。SleepFM 的表现超过了传统的端到端训练的卷积神经网络（CNN）。
SleepFM的项目地址
- GitHub仓库：https://github.com/rthapa84/sleepfm-codebase
- arXiv技术论文：https://export.arxiv.org/pdf/2405.17766
SleepFM的应用场景
- 临床诊断：辅助医生和睡眠专家快速准确地分析睡眠监测数据，提高诊断效率和准确性。
- 睡眠研究：在睡眠医学研究中，分析临床试验数据和监测药物效果，以及研究睡眠模式和睡眠障碍。
- 健康管理：集成到可穿戴设备或智能家居系统中，帮助个人监控和改善睡眠质量。
- 药物开发：在新药开发和临床试验中，用于评估药物对睡眠质量的影响。
- 教育和培训：在医学教育中，作为教学工具，帮助学生和专业人员学习睡眠生理学和睡眠障碍的识别。
- 远程医疗：在远程医疗环境中，为远离医疗中心的患者提供睡眠监测和分析服务。
September 18, 2024
SleepFM – 斯坦福大学开源的多模态睡眠分析模型
SleepFM是什么

SleepFM 是斯坦福大学开源的多模态睡眠分析模型，基于超过14,000名参与者的100,000小时睡眠数据，通过融合大脑活动、心电图和呼吸信号，提供全面的睡眠健康评估。旨在提高睡眠分析的效率和准确性。模型采用对比学习技术，优化睡眠阶段分类和睡眠呼吸障碍检测的准确性。SleepFM 能辅助临床诊断和研究，能集成到可穿戴设备中，用于个人睡眠健康管理。开源特性为睡眠医学领域提供了一个强大的研究和应用平台。

SleepFM的主要功能
- 睡眠阶段分类：自动分析和分类个体的睡眠阶段，包括清醒、浅睡、深睡和REM睡眠。
- 睡眠呼吸障碍检测：识别睡眠期间的呼吸异常，如呼吸暂停和低通气。
- 人口统计属性预测：从生理信号中预测个体的年龄和性别。
- 数据检索：通过一种生理信号检索与之对应的其他模态信号。
- 临床辅助：辅助临床医生分析睡眠监测数据，提高诊断效率。
- 健康管理：集成到可穿戴设备中，用于个人睡眠健康的监控和管理。
- 研究与药物开发：支持睡眠相关的临床研究和药物效果监测。
SleepFM的技术原理
- 多模态数据融合：结合 BAS、ECG 和呼吸信号，信号分别来自大脑、心脏和肺部，覆盖了19 个数据通道。
- 对比学习框架：SleepFM 探索两种对比学习框架，即成对对比学习（pairwise CL）和留一法对比学习（leave-one-out CL）。成对对比学习将来自不同模态的正匹配对在潜在空间中拉近，同时推开负匹配对。留一法对比学习则是在构建对比学习样本时，将两个输入与剩下的输入构成样本对，从而从一个片段构建出三个样本对。
- 自监督预训练：通过自监督学习方法，SleepFM 在预训练阶段不依赖于标注数据，通过设计的数据增强策略和对比损失函数来学习数据的表示。
- 下游任务性能提升：预训练得到的表示用于多种下游任务，如睡眠阶段分类和睡眠呼吸障碍（SDB）检测。SleepFM 的表现超过了传统的端到端训练的卷积神经网络（CNN）。
SleepFM的项目地址
- GitHub仓库：https://github.com/rthapa84/sleepfm-codebase
- arXiv技术论文：https://export.arxiv.org/pdf/2405.17766
SleepFM的应用场景
- 临床诊断：辅助医生和睡眠专家快速准确地分析睡眠监测数据，提高诊断效率和准确性。
- 睡眠研究：在睡眠医学研究中，分析临床试验数据和监测药物效果，以及研究睡眠模式和睡眠障碍。
- 健康管理：集成到可穿戴设备或智能家居系统中，帮助个人监控和改善睡眠质量。
- 药物开发：在新药开发和临床试验中，用于评估药物对睡眠质量的影响。
- 教育和培训：在医学教育中，作为教学工具，帮助学生和专业人员学习睡眠生理学和睡眠障碍的识别。
- 远程医疗：在远程医疗环境中，为远离医疗中心的患者提供睡眠监测和分析服务。
September 18, 2024
mPLUG-DocOwl2 – 阿里推出多页文档理解的多模态大模型，单页仅需324个token
mPLUG-DocOwl2是什么

mPLUG-DocOwl 2是由阿里巴巴通义实验室mPLUG团队推出的用于多页文档理解的多模态大型语言模型。在不依赖光学字符识别（OCR）技术的情况下，通过高分辨率文档图像压缩技术，实现对文档图片的高效理解和处理。mPLUG-DocOwl 2在多页文档理解基准测试中达到了新的最高标准（SOTA），每页文档图像消耗324个token，降低显存占用和首包时间，提高处理速度。模型的训练分为三个阶段：单页预训练、多页预训练和多任务指令微调。mPLUG-DocOwl 2支持理解单页文档，还能处理多页文档中的复杂问题，如跨页内容关联和结构解析。

mPLUG-DocOwl2的主要功能
- 多页文档理解：在不依赖OCR技术的情况下，直接从多页文档图像中提取和理解信息。
- 高分辨率图像处理：通过高分辨率文档图像压缩模块，将每页文档图像压缩成324个视觉token，减少显存占用和首包时间。
- 多页问答能力：回答有关多页文档内容的问题，提供详细的解释以及相关页码。
- 文档结构解析：解析并表示多页文档的层级结构，以JSON格式输出，便于进一步的数据处理和分析。
- 跨页内容关联：理解和关联多页文档中跨页的内容，提供跨页结构理解。
- 高效处理：在单个A100-80G GPU上，同时处理多达60页的高清文档图片，提高处理效率。
mPLUG-DocOwl2的技术原理
- 高分辨率文档图像压缩（High-resolution DocCompressor）：基于低分辨率全局视觉特征作为指导，通过cross-attention机制将高分辨率文档图像压缩成较少的视觉token。
- Shape-adaptive Cropping：自适应裁剪模块根据文档的形状和大小进行切割，来适应不同页面的布局。
- 视觉特征提取：使用视觉编码器（如ViT）提取每个切片的视觉特征，并通过H-Reducer模块进行特征合并和维度对齐。
- 跨注意力机制：在压缩过程中，使用全局图特征作为查询，切片特征作为键值对，通过cross-attention层实现特征压缩。
- 全局与局部视觉特征结合：结合全局视觉特征（捕捉布局信息）和局部视觉特征（保留文本和图像细节），实现更准确的文档理解。
mPLUG-DocOwl2的项目地址
- GitHub仓库：https://github.com/X-PLUG/mPLUG-DocOwl/tree/main/DocOwl2
- arXiv技术论文：https://arxiv.org/pdf/2409.03420v2
mPLUG-DocOwl2的应用场景
- 法律文件分析：自动化解析法律文件和案例，提取关键信息，支持法律研究和案件准备。
- 医疗记录管理：从医疗记录和报告中提取重要数据，支持病人护理、研究和行政管理。
- 学术研究：帮助研究人员快速理解和总结大量文献，加速科学发现和知识创新。
- 金融报告分析：自动化处理年度报告、财务报表和其他金融文档，提取关键财务指标和趋势。
- 政府文档处理：自动化处理政府发布的公告、法规和政策文件，提高政府服务效率。
September 18, 2024
mPLUG-DocOwl2 – 阿里推出多页文档理解的多模态大模型，单页仅需324个token
mPLUG-DocOwl2是什么

mPLUG-DocOwl 2是由阿里巴巴通义实验室mPLUG团队推出的用于多页文档理解的多模态大型语言模型。在不依赖光学字符识别（OCR）技术的情况下，通过高分辨率文档图像压缩技术，实现对文档图片的高效理解和处理。mPLUG-DocOwl 2在多页文档理解基准测试中达到了新的最高标准（SOTA），每页文档图像消耗324个token，降低显存占用和首包时间，提高处理速度。模型的训练分为三个阶段：单页预训练、多页预训练和多任务指令微调。mPLUG-DocOwl 2支持理解单页文档，还能处理多页文档中的复杂问题，如跨页内容关联和结构解析。

mPLUG-DocOwl2的主要功能
- 多页文档理解：在不依赖OCR技术的情况下，直接从多页文档图像中提取和理解信息。
- 高分辨率图像处理：通过高分辨率文档图像压缩模块，将每页文档图像压缩成324个视觉token，减少显存占用和首包时间。
- 多页问答能力：回答有关多页文档内容的问题，提供详细的解释以及相关页码。
- 文档结构解析：解析并表示多页文档的层级结构，以JSON格式输出，便于进一步的数据处理和分析。
- 跨页内容关联：理解和关联多页文档中跨页的内容，提供跨页结构理解。
- 高效处理：在单个A100-80G GPU上，同时处理多达60页的高清文档图片，提高处理效率。
mPLUG-DocOwl2的技术原理
- 高分辨率文档图像压缩（High-resolution DocCompressor）：基于低分辨率全局视觉特征作为指导，通过cross-attention机制将高分辨率文档图像压缩成较少的视觉token。
- Shape-adaptive Cropping：自适应裁剪模块根据文档的形状和大小进行切割，来适应不同页面的布局。
- 视觉特征提取：使用视觉编码器（如ViT）提取每个切片的视觉特征，并通过H-Reducer模块进行特征合并和维度对齐。
- 跨注意力机制：在压缩过程中，使用全局图特征作为查询，切片特征作为键值对，通过cross-attention层实现特征压缩。
- 全局与局部视觉特征结合：结合全局视觉特征（捕捉布局信息）和局部视觉特征（保留文本和图像细节），实现更准确的文档理解。
mPLUG-DocOwl2的项目地址
- GitHub仓库：https://github.com/X-PLUG/mPLUG-DocOwl/tree/main/DocOwl2
- arXiv技术论文：https://arxiv.org/pdf/2409.03420v2
mPLUG-DocOwl2的应用场景
- 法律文件分析：自动化解析法律文件和案例，提取关键信息，支持法律研究和案件准备。
- 医疗记录管理：从医疗记录和报告中提取重要数据，支持病人护理、研究和行政管理。
- 学术研究：帮助研究人员快速理解和总结大量文献，加速科学发现和知识创新。
- 金融报告分析：自动化处理年度报告、财务报表和其他金融文档，提取关键财务指标和趋势。
- 政府文档处理：自动化处理政府发布的公告、法规和政策文件，提高政府服务效率。
September 18, 2024
GameGen-O – 腾讯推出的游戏视频生成模型，自动生成角色、场景、动作和事件
GameGen-O是什么

GameGen-O 是腾讯推出的一款基于 Transformer 架构的游戏视频生成模型，专门用于生成开放世界视频游戏。模型能模拟游戏引擎的多种功能，包括生成游戏角色、动态环境、复杂动作等，支持交互控制，支持用户通过文本、操作信号和视频提示来控制游戏内容。GameGen-O 的开发涉及大规模的数据收集和处理，创建首个开放世界视频游戏数据集（OGameData），经过两阶段的训练过程，包括基础模型预训练和指令调整。模型的推出会对游戏开发行业产生重大影响，它能降低开发成本和时间，同时为玩家提供更多的创作自由度。

GameGen-O的主要功能
- 角色生成：能根据用户的文本指令生成各种角色，如西部牛仔、太空人、魔法师等。
- 环境生成：能创造出动态的游戏环境，适应不同的游戏风格和场景。
- 动作生成：支持生成复杂的角色动作，如驾驶、飞行、射击等。
- 事件生成：能生成游戏中的各种事件，如天气变化、自然灾害等。
- 交互控制：用户可以通过文本、操作信号和视频提示来控制游戏内容，实现交互式游戏体验。
GameGen-O的技术原理
- 开放域生成：GameGen-O 能生成各种类型的游戏元素，如角色、环境、动作和事件，扩展了游戏的可能性。
- 交互式可控性：模型能生成游戏内容，支持用户通过 InstructNet 分支进行交互式控制，例如改变角色行为、环境布局、事件发生等。
- OGameData 数据集：为了训练 GameGen-O，研究团队构建了大规模的开放世界电子游戏数据集 OGameData，包含来自150多个游戏的4000多个小时视频片段，覆盖多种游戏类型和风格。
- 两阶段训练：模型采用了两阶段训练策略。第一阶段是基础模型预训练，学习生成高质量的游戏视频；第二阶段是通过指令微调，赋予模型根据用户指令生成和控制内容的能力。
- 技术创新：GameGen-O 采用了多种先进技术，如2+1D VAE视频压缩、混合训练策略、掩码注意力机制等，确保模型的稳定性和生成质量。
- 数据集构建和训练过程：从互联网上收集了32,000个原始视频，经过人类专家筛选和GPT-4o标注，形成了高质量的训练数据。模型的基础训练阶段使用了变分自编码器来压缩视频片段，采用了不同帧速率和分辨率的混合训练策略。
- InstructNet：在模型的微调阶段，使用了可训练的 InstructNet 来接受多模态输入，包括文本、操作信号和视频提示，实现对生成内容的交互式控制。
GameGen-O的项目地址
- 项目官网：gamegen-o.github.io
- Github仓库：https://github.com/GameGen-O/GameGen-O/
GameGen-O的应用场景
- 游戏原型制作：开发者可以用 GameGen-O 快速制作游戏原型，测试不同的游戏元素，节省从零开始构建游戏的时间和精力。
- 环境和场景生成：GameGen-O 能创造出动态的游戏环境和复杂的场景，为游戏世界增添丰富的视觉效果。
- 动作和事件生成：模型支持生成复杂的角色动作和游戏中的各种事件，如海啸、龙卷风、火灾等，增加游戏的互动性和挑战性。
- 辅助游戏开发：GameGen-O 可以辅助游戏开发环节，通过AI模型替代部分开发工作，提高开发效率。
- 研究和教育：对于研究者和教育者，GameGen-O可以作为一个研究工具，帮助探索视频游戏 AI 开发、互动控制和沉浸式虚拟环境等领域。
September 16, 2024
GameGen-O – 腾讯推出的游戏视频生成模型，自动生成角色、场景、动作和事件
GameGen-O是什么

GameGen-O 是腾讯推出的一款基于 Transformer 架构的游戏视频生成模型，专门用于生成开放世界视频游戏。模型能模拟游戏引擎的多种功能，包括生成游戏角色、动态环境、复杂动作等，支持交互控制，支持用户通过文本、操作信号和视频提示来控制游戏内容。GameGen-O 的开发涉及大规模的数据收集和处理，创建首个开放世界视频游戏数据集（OGameData），经过两阶段的训练过程，包括基础模型预训练和指令调整。模型的推出会对游戏开发行业产生重大影响，它能降低开发成本和时间，同时为玩家提供更多的创作自由度。

GameGen-O的主要功能
- 角色生成：能根据用户的文本指令生成各种角色，如西部牛仔、太空人、魔法师等。
- 环境生成：能创造出动态的游戏环境，适应不同的游戏风格和场景。
- 动作生成：支持生成复杂的角色动作，如驾驶、飞行、射击等。
- 事件生成：能生成游戏中的各种事件，如天气变化、自然灾害等。
- 交互控制：用户可以通过文本、操作信号和视频提示来控制游戏内容，实现交互式游戏体验。
GameGen-O的技术原理
- 开放域生成：GameGen-O 能生成各种类型的游戏元素，如角色、环境、动作和事件，扩展了游戏的可能性。
- 交互式可控性：模型能生成游戏内容，支持用户通过 InstructNet 分支进行交互式控制，例如改变角色行为、环境布局、事件发生等。
- OGameData 数据集：为了训练 GameGen-O，研究团队构建了大规模的开放世界电子游戏数据集 OGameData，包含来自150多个游戏的4000多个小时视频片段，覆盖多种游戏类型和风格。
- 两阶段训练：模型采用了两阶段训练策略。第一阶段是基础模型预训练，学习生成高质量的游戏视频；第二阶段是通过指令微调，赋予模型根据用户指令生成和控制内容的能力。
- 技术创新：GameGen-O 采用了多种先进技术，如2+1D VAE视频压缩、混合训练策略、掩码注意力机制等，确保模型的稳定性和生成质量。
- 数据集构建和训练过程：从互联网上收集了32,000个原始视频，经过人类专家筛选和GPT-4o标注，形成了高质量的训练数据。模型的基础训练阶段使用了变分自编码器来压缩视频片段，采用了不同帧速率和分辨率的混合训练策略。
- InstructNet：在模型的微调阶段，使用了可训练的 InstructNet 来接受多模态输入，包括文本、操作信号和视频提示，实现对生成内容的交互式控制。
GameGen-O的项目地址
- 项目官网：gamegen-o.github.io
- Github仓库：https://github.com/GameGen-O/GameGen-O/
GameGen-O的应用场景
- 游戏原型制作：开发者可以用 GameGen-O 快速制作游戏原型，测试不同的游戏元素，节省从零开始构建游戏的时间和精力。
- 环境和场景生成：GameGen-O 能创造出动态的游戏环境和复杂的场景，为游戏世界增添丰富的视觉效果。
- 动作和事件生成：模型支持生成复杂的角色动作和游戏中的各种事件，如海啸、龙卷风、火灾等，增加游戏的互动性和挑战性。
- 辅助游戏开发：GameGen-O 可以辅助游戏开发环节，通过AI模型替代部分开发工作，提高开发效率。
- 研究和教育：对于研究者和教育者，GameGen-O可以作为一个研究工具，帮助探索视频游戏 AI 开发、互动控制和沉浸式虚拟环境等领域。
September 16, 2024
CSGO AI – 小红书联合南理工推出的AI文生图项目
CSGO是什么

CSGO（Content-Style Composition in Text-to-Image Generation）是南京理工大学、小红书等机构合作推出的图像风格迁移和文本到图像生成的研究项目。CSGO的目标是为用户提供更加丰富和多样化的图像创作工具。项目提出创新的数据构建流程，用于生成和清洗风格化数据三元组，并构建名为IMAGStyle的大规模风格迁移数据集。基于数据集，CSGO框架通过端到端训练，实现图像驱动的风格迁移、文本驱动的风格化合成以及文本编辑驱动的风格化合成，显著提升图像生成中的风格控制能力。

CSGO的主要功能
- 图像驱动的风格迁移：用户将一种图像的风格应用到另一种图像上，实现视觉上的风格转换，同时保持原始内容的语义。
- 文本驱动的风格化合成：输入文本描述，生成具有特定风格的图像，展示了在理解自然语言和将文本转化为视觉风格方面的能力。
- 文本编辑驱动的风格化合成：在生成图像后，用户通过编辑文本描述进一步调整图像的风格，提供更高级别的创作控制。
- 端到端训练模型：CSGO采用端到端的训练方法，模型从输入到输出的整个过程是连续的，无需分阶段处理，提高了模型的效率和效果。
- 特征注入技术：通过独立的特征注入技术，CSGO将内容和风格特征明确解耦，分别提取并融合到生成的图像中，确保内容的准确性和风格的一致性。
CSGO的技术原理
- 数据构建流程：CSGO通过一个自动化的数据构建流程生成和清洗风格化数据三元组，三元组包括内容图像、风格图像和对应的风格化结果图像。
- 端到端训练模型：CSGO采用端到端的训练方法，模型直接从输入学习到输出，无需分阶段处理，提高了模型的效率和效果。
- 特征注入技术：
  - 内容控制：使用预训练的ControlNet和额外的可学习交叉注意力层，将内容特征注入到基础模型中，保留原始内容的语义和布局。
  - 风格控制：通过预训练的图像编码器和风格投影层，提取风格特征，将其注入到模型的上采样块和独立的风格控制模块中。
- 扩散模型：CSGO利用扩散模型逐步去除噪声来生成图像，在风格迁移的上下文中将一种风格应用到内容图像上，同时保持内容的完整性。
- 内容对齐评分（CAS）：CSGO引入内容对齐评分（Content Alignment Score），衡量生成图像与原始内容图像在内容上的一致性，评估风格迁移的质量。
CSGO的项目地址
- 项目官网：csgo-gen.github.io
- GitHub仓库：https://github.com/instantX-research/CSGO
- HuggingFace模型库：https://huggingface.co/spaces/xingpng/CSGO
- arXiv技术论文：https://arxiv.org/pdf/2408.16766
CSGO的应用场景
- 艺术创作：艺术家和设计师用CSGO来探索新的艺术风格，创作独特的数字艺术作品，或在保持内容主题不变的情况下尝试不同的视觉表现手法。
- 数字娱乐：在游戏开发和电影制作中，CSGO用来生成具有特定风格的场景和角色概念图，为数字内容创作提供多样化的视觉元素。
- 设计行业：设计师基于CSGO快速生成设计草图和原型，通过不同的风格化图像来展示产品设计，或在设计过程中快速迭代和测试不同的视觉风格。
- 广告营销：营销人员用CSGO生成吸引人的广告视觉内容，将产品图像风格化来吸引目标受众，或根据品牌形象定制独特的视觉风格。
- 社交媒体内容创作：内容创作者和影响者用CSGO为社交媒体平台（如Instagram、小红书等）创作风格化的内容，提高视觉吸引力和个性化表达。
September 16, 2024
CSGO AI – 小红书联合南理工推出的AI文生图项目
CSGO是什么

CSGO（Content-Style Composition in Text-to-Image Generation）是南京理工大学、小红书等机构合作推出的图像风格迁移和文本到图像生成的研究项目。CSGO的目标是为用户提供更加丰富和多样化的图像创作工具。项目提出创新的数据构建流程，用于生成和清洗风格化数据三元组，并构建名为IMAGStyle的大规模风格迁移数据集。基于数据集，CSGO框架通过端到端训练，实现图像驱动的风格迁移、文本驱动的风格化合成以及文本编辑驱动的风格化合成，显著提升图像生成中的风格控制能力。

CSGO的主要功能
- 图像驱动的风格迁移：用户将一种图像的风格应用到另一种图像上，实现视觉上的风格转换，同时保持原始内容的语义。
- 文本驱动的风格化合成：输入文本描述，生成具有特定风格的图像，展示了在理解自然语言和将文本转化为视觉风格方面的能力。
- 文本编辑驱动的风格化合成：在生成图像后，用户通过编辑文本描述进一步调整图像的风格，提供更高级别的创作控制。
- 端到端训练模型：CSGO采用端到端的训练方法，模型从输入到输出的整个过程是连续的，无需分阶段处理，提高了模型的效率和效果。
- 特征注入技术：通过独立的特征注入技术，CSGO将内容和风格特征明确解耦，分别提取并融合到生成的图像中，确保内容的准确性和风格的一致性。
CSGO的技术原理
- 数据构建流程：CSGO通过一个自动化的数据构建流程生成和清洗风格化数据三元组，三元组包括内容图像、风格图像和对应的风格化结果图像。
- 端到端训练模型：CSGO采用端到端的训练方法，模型直接从输入学习到输出，无需分阶段处理，提高了模型的效率和效果。
- 特征注入技术：
  - 内容控制：使用预训练的ControlNet和额外的可学习交叉注意力层，将内容特征注入到基础模型中，保留原始内容的语义和布局。
  - 风格控制：通过预训练的图像编码器和风格投影层，提取风格特征，将其注入到模型的上采样块和独立的风格控制模块中。
- 扩散模型：CSGO利用扩散模型逐步去除噪声来生成图像，在风格迁移的上下文中将一种风格应用到内容图像上，同时保持内容的完整性。
- 内容对齐评分（CAS）：CSGO引入内容对齐评分（Content Alignment Score），衡量生成图像与原始内容图像在内容上的一致性，评估风格迁移的质量。
CSGO的项目地址
- 项目官网：csgo-gen.github.io
- GitHub仓库：https://github.com/instantX-research/CSGO
- HuggingFace模型库：https://huggingface.co/spaces/xingpng/CSGO
- arXiv技术论文：https://arxiv.org/pdf/2408.16766
CSGO的应用场景
- 艺术创作：艺术家和设计师用CSGO来探索新的艺术风格，创作独特的数字艺术作品，或在保持内容主题不变的情况下尝试不同的视觉表现手法。
- 数字娱乐：在游戏开发和电影制作中，CSGO用来生成具有特定风格的场景和角色概念图，为数字内容创作提供多样化的视觉元素。
- 设计行业：设计师基于CSGO快速生成设计草图和原型，通过不同的风格化图像来展示产品设计，或在设计过程中快速迭代和测试不同的视觉风格。
- 广告营销：营销人员用CSGO生成吸引人的广告视觉内容，将产品图像风格化来吸引目标受众，或根据品牌形象定制独特的视觉风格。
- 社交媒体内容创作：内容创作者和影响者用CSGO为社交媒体平台（如Instagram、小红书等）创作风格化的内容，提高视觉吸引力和个性化表达。
September 16, 2024
12个AI短剧创作平台和软件，自动剪辑一键生成视频短片
AI技术正在逐渐渗透到创意产业，从简单的语音助手到复杂的内容创作工具，AI的身影已出现在主流视频媒体平台上，催生了AI制作的视频短片和影视作品，重新定义了创意领域的边界。本篇文章将大家介绍12个AI短剧创作平台，一键创作视频故事短片。一个平台，能理解你的故事想法，自动生成一个完整的视频短片，这就是AI短剧创作平台的魅力所在。不单是一个AI工具，更是一个全新的视频创作伙伴，通过AI的力量，让创意变成现实。

1.白日梦

白日梦是光魔科技推出的AI故事视频创作平台，基于自然语言处理技术，用户可以输入文本内容，快速生成最长6分钟的视频。平台提供丰富的角色库、多种视频风格，支持自动化分镜生成，保持角色和场景的一致性。白日梦AI特别适合儿童绘本、连环画创作，也适用于小说推广、广告营销和艺术创作等场景。用户可通过简单步骤创作故事视频，导出后可分享至不同平台。

🚀创作功能亮点
- 文本到视频转换：用户只需输入文字描述，AI就能理解其内容，自动生成视频。
- 海量角色演员库：平台拥有庞大的角色库，用户可以根据视频内容的需要选择合适的角色，也可以自定义创建角色。
- 多种风格的视频生成：支持多种视频风格，如国风仙侠、AI短剧、萌宠星球等。
- 角色和场景生成：AI能根据文本描述自动生成相应的角色和场景，简化视频创作过程。
- 自动化分镜生成：AI智能分析文本内容，自动设计合理的镜头切换和场景过渡。
✨支持视频风格
- 国风仙侠：适合创作具有中国传统仙侠元素的视频，如武侠故事、神话传说等。
- AI短剧：适合生成短小精悍的剧情视频，喜剧、悲剧或任何其他类型的短剧。
- 萌宠星球：专为宠物爱好者设计，可以创作以宠物为主角的可爱视频。
- 神奇脑洞：适合那些天马行空、创意无限的故事，可以是科幻、奇幻或任何超现实的内容。
- 同人二创：支持用户基于现有的作品（如动漫、游戏、电影等）进行二次创作。
- 逸闻趣史：适合创作历史故事或基于真实事件的趣味视频。
- 儿童故事：可以创作教育性或娱乐性的儿童故事视频。
- 动态画面：提供动态背景和场景，增加视频的生动性和吸引力。
- 图文模式：适合创作绘本或连环画风格的视频，结合文字和图片讲述故事。
👨🏻‍💻创作流程
- 访问平台：访问白日梦AI官网。
- 创建角色：用户可以从角色库中选择现有的形象，或者根据自己的需求创建新的角色。
- 编写故事：用户需要编写想要转化为视频的故事或脚本，确保内容适合视频化。
- 角色设定：根据故事的内容，为故事选择合适的角色，进行必要的角色设定。
- 选择分镜：系统会根据用户的故事文案自动生成视频分镜，可以对这些分镜进行调整。
- 生成视频：预览满意，用户可以点击“生成视频”按钮，根据提供的内容生成视频。
💰产品价格
- 积分：新用户注册可领取1000积分。更多权益需要购买会员，以官网信息为准。
2.讯飞绘镜

讯飞绘镜是科大讯飞推出的AI短视频创作平台，能将用户输入的文本描述自动转换成视频内容，如短剧、预告片、MV等。讯飞绘镜适合内容创作者、营销人员和教育工作者，帮助他们快速将创意或故事转化为视频形式，简化视频制作流程，支持一键分发至各大社交平台。

🚀创作功能亮点
- 文本自动转视频：用户只需输入文本描述，讯飞绘镜能生成剧本，转化为视频分镜，最终制作成完整的短视频。
- 智能视频编辑工具：讯飞绘镜内置多种AI视频编辑工具，包括文本内容调整、背景音乐合成、旁白及对话生成等。
- 一键式视频分发：用户可以通过一键分发功能，轻松将作品推广至各大社交和视频平台。
- 粉丝互动与数据管理：讯飞绘镜提供粉丝互动功能和数据管理工具，帮助用户有效管理与粉丝的互动，同时对视频内容的表现进行数据分析。
✨支持视频风格
- 剧情短片：适合制作具有故事情节的视频，如科幻、戏剧、爱情等类型的剧情片。
- 预告片：适合生成城市宣传、商业广告、风光旅游等类型的预告片。
- 音乐视频(MV)：可以根据用户提供的歌曲歌词内容生成相应的视频素材，定制音乐MV。
- 经典IP角色：用户希望在视频中加入特定角色，可以详细描述角色特征生成相应的形象。
👨🏻‍💻创作流程
- 创作文字脚本：用户在平台上点击“开始创作”，输入灵感和创意的描述，选择想要创作的作品类型，如AI短剧、AI预告片或AI MV。
- 生成图片分镜：AI根据用户输入的文字脚本自动生成对应的图片分镜。可以对生成的分镜进行查看和调整。
- 生成视频素材：用户对图片分镜设置完成后，点击“生成视频”，平台会根据分镜生成视频素材，用户可以预览进一步调整素材。
- 导出素材到本地：视频素材调整完成后，用户可以保存单个视频素材，或者一键下载包含旁白、图片分镜和视频分镜的工程压缩包。
💰产品价格
- 讯飞绘镜用户注册后可获得150绘点用于视频生成，访问讯飞绘镜官网进行免费体验。
3.MOKI

MOKI是美图公司推出的AI短片创作工具，专注于简化短片创作流程，支持动画短片、网文短剧、故事绘本、MV等多种视频内容的生成。MOKI通过AI技术实现从文案到成片的一站式创作体验，用户只需输入故事梗概或导入脚本，即自动生成分镜脚本并进行编辑，最终生成带有配乐的视频内容。MOKI的核心优势在于AI驱动的脚本、分镜、视频生成、配音、配乐能力，使没有专业背景的用户也能轻松创作出具有个人特色的短片。MOKI计划提供4K分辨率、自定义图片生成视频等高级功能，满足专业用户的需求。

🚀创作功能亮点
- AI驱动的脚本生成：用户只需输入故事梗概或导入现有脚本，MOKI能自动生成分镜脚本提供多种设定选项。
- 一键生成视频内容：
  - 在内容生成阶段，MOKI自动生成分镜画面支持细节修改。
  - 在后期制作阶段，MOKI一键生成带有配乐的视频内容，支持用户对视频生成效果持续优化。
- 多种视频类型支持：MOKI适用于动画短片、网文短剧和故事绘本的制作等多类视频的需求。
- 智能剪辑与配乐：MOKI的AI功能能自动识别素材内容，实现智能剪辑、配乐和特效处理等专业功能。
✨支持视频风格
- 动画短片：MOKI可以帮助创作者快速生成动画短片的脚本和分镜，自动转换为视频素材。
- 网文短剧：能将网络文学内容转化为短剧形式的视频，提供创意构思辅助。
- 故事绘本：MOKI支持将故事内容转化为绘本风格的视频，适合儿童内容创作。
- MV（音乐视频）：MOKI可以辅助创作者制作音乐视频，通过AI技术提升制作效率。
👨🏻‍💻创作流程
- 前期设定：用户输入故事梗概或导入现有脚本，自动生成分镜脚本，提供多种视觉和风格设定选项。
- 内容生成：MOKI会自动生成分镜画面，支持用户对画面进行细节上的修改和调整。
- 后期制作：一键生成带有配乐的视频内容，支持用户对生成的视频效果进行持续的优化。
- 输出成片：完成上述步骤后，可以得到最终的视频短片，直接分享或进行专业级的调整。
💰产品价格
- 限时免费：目前MOKI开通限时免费生成服务，可登录官网体验
- MOKI积分：积分有效期2年，积分可用于MOKI平台内各类功能，如生成分镜图、生成视频等。新用户登录可获得325积分；购买100积分￥10元；300积分￥30元；500积分￥50元。
4.SkyReels

SkyReels 是昆仑万维推出的全球首款 AI 短剧平台，集成了剧本生成、角色定制、分镜设计、剧情编排、对白配音、背景音乐以及影片合成等多个功能，让创作者能轻松地“一键成剧”，制作出高质量的 AI 视频。用户只需输入一个简单的创意，SkyReels 就能自动完成从剧本到成品短剧的全流程制作，能自动将内容转换为 1080P 60 帧的高清视频，单次可生成视频长度达到 180 秒。特别适合短剧创作者、内容创作新人、社交媒体内容创作者、品牌与营销团队、教育与培训行业使用。

🚀创作功能亮点
- 全自动化剧本生成：用户只需输入一个概念或故事创意，AI 可自动生成一份结构完整、情节丰富的剧本，支持对已有剧本的自动整理与润色。
- 高质量情节设计：SkyReels 通过分析大量剧本情节，能生成高质量的故事情节、戏剧冲突、爽点及情感表达，确保剧本的吸引力和丰富性。
- 智能分镜生成：根据剧本内容，能一键生成分镜图片和对应的文字脚本，可以自由调整分镜、镜头角度、运镜方式等参数。
- 情感化对白/BGM：基于情感化语音合成技术，SkyReels 能赋予角色自然的句间停顿、情感表达、抑扬顿挫，基于视频内容自动生成 AI BGM，实现画面与音乐的完美融合。
- 个性化定制：支持角色形象、音色和分镜的智能生成与自定义调整。
- 内容一致性与精确性：SkyReels 确保角色与场景在不同分镜中的一致性，根据故事描述自动推演角色表演，实现人物表情、动作、台词的协调一致。
- 高效视频生成：能自动将分镜转换为连续高清视频，提供 1080P 60 帧输出。
✨支持视频风格
- 短剧视频：SkyReels 能一键生成完整的剧本、分镜、人物对白与背景音乐（BGM），自动将这些内容转换为连续的高清视频，单次可生成视频长度达到180秒。
- 动漫风格视频：SkyReels 提供动漫、卡通等多种视觉风格选择，适应不同创作者的偏好。
- 真人3D视频：能生成真人3D效果的视频，提供更加逼真的视觉体验。
- 情感化视频：基于情感化语音合成技术，SkyReels 能生成具有自然情感表达的视频内容。
- 剧情视频：SkyReels 能根据剧本内容一键生成分镜图片和对应的文字脚本，支持剧情的连贯性和表现力。
👨🏻‍💻创作流程
- 创意输入：首先输入一个简单的创意或概念，作为短剧的基础。
- 剧本生成：SkyReels通过自研剧本大模型SkyScript，自动生成一份结构完整、情节丰富的剧本。
- 角色定制：系统根据剧本内容自动推荐合适的角色，支持用户自定义角色形象和音色。
- 分镜生成：使用自研分镜大模型StoryboardGen，根据剧本一键生成分镜图片和对应的文字脚本。
- 视频生成：基于WorldEngine平台，将分镜自动转换为连续视频，生成的场景和人物更加生动和一致。
💰产品价格
- 目前开放申请内测，可登录官方网站进行登录申请体验。具体价格信息可登录网站获取。
5.OneStory

OneStory是一款AI驱动的故事创作工具，能将文字创意快速转化为专业分镜脚本和影视级连续画面。用户无需美术或电影制作背景，可通过简单操作创作出高质量的视觉作品。工具支持一键生成分镜脚本、轻松产出图像、实现画面元素级控制，支持用户构建专属角色资产库，适用于个人创作、教育、影视制作等多种场景，简化创作流程，让每个创意得以实现。

🚀创作功能亮点
- 一键生成专业分镜脚本：用户可以上传剧本文档或即兴的文思，OneStory会立即转化为分镜脚本和故事板。
- 轻松产出影视级图像：基于AI数据集，用户可以快速创作出高质量的图像故事，无需美术基础。
- 构建专属角色资产库：用户可以通过提示词和人物形象图片来构建自己的角色库，打造个性化的IP形象。
✨支持视频风格
- 多场景适用性：适用于多种不同的创作场景和案例，满足不同用户的个性化需求。
- 一键生成视频：用户可以将生成的图像串联成视频，OneStory支持视频生成功能，根据图像一键制作动画视频。
- 连续性角色和故事：OneStory支持生成连续性、一致性的角色和故事。
👨🏻‍💻创作流程
- 注册并登录：访问OneStory官网，注册账号并登录。
- 输入故事创意：在OneStory的文本输入框中，输入故事大纲、剧情简介或任何创意想法。
- 选择生成方式：根据需求，选择生成故事的方式，如分镜脚本、图像生成等。
- 调整与预览：OneStory会根据输入内容生成分镜脚本或图像，可以实时预览生成的内容。
- 生成视频：OneStory支持将生成的图像串联成视频，可以使用一键制作动画视频。
💰产品价格
- 免费用户：提供基础试用服务。
- 普通会员：价格为18元/月或180元/年，提供100个项目、600次重绘、8000字字符数的使用额度。
- 高级会员：价格为38元/月或380元/年，提供500个项目、2000次重绘、15000字字符数的使用额度。
- 团队会员：价格为定制，包括团队协作功能，如多人编辑和图片批注。
- AI视频生成：需要单独付费，一次图生视频的价格为3元人民币。
6.AutoShorts

AutoShorts.ai 是一个AI视频生成平台，能自动化地创建和发布无脸视频，特别适合TikTok和YouTube的内容创作者。用户只需提供主题或脚本，AutoShorts.ai 的AI技术能自动生成视频脚本、语音并发布到相应的平台。平台支持自定义脚本、配音和视觉效果，提供一键式操作，简化视频制作流程。AutoShorts.ai 提供了自动化发布机制，支持定时发布视频到社交媒体平台，实现24小时*7的自动化运营。适用于内容创作者、营销代理和教育者，帮助简化视频制作流程，提高效率，同时确保内容的独创性。

🚀创作功能亮点
- 自动化视频生成：基于AI技术根据用户输入自动生成无脸视频，简化视频创作流程。
- 一键式操作：用户只需提供主题或脚本，通过一次点击完成视频创作。
- 个性化定制：提供脚本、配音、字幕和视觉效果的定制选项，适应不同品牌和风格。
- 自动发布机制：支持定时发布视频到YouTube和TikTok等平台，实现24小时*7的自动化运营。
- AI驱动的创新：采用最新的AI技术，如GPT-4和Stable Diffusion，确保视频内容的创新性和吸引力。
✨支持视频风格
- 教育视频：适合在线课程、讲座或教学辅助，使学习材料更加生动和吸引人。
- 社交媒体营销：为社交媒体营销活动创建吸引人的视频内容。
- 影响者内容：影响者可以为其社交媒体频道创建高质量的视频内容。
- 企业内部培训：制作内部培训视频，用于员工培训和发展，提高培训效率和参与度。
- 历史频道：如讲述鲜为人知的历史事实的频道。
👨🏻‍💻创作流程
- 选择主题：用户可以选择一个预设的主题或者自定义自己的主题。
- 输入脚本：用户输入视频的脚本或描述，作为AI创作视频的基础。
- 自定义选项：用户可以根据需要选择配音、字幕、视觉效果等自定义选项。
- 预览编辑视频：AI根据提供的信息生成视频后，预览视频内容，或编辑视频的脚本、标题和背景音乐。
- 发布设置：可以设置视频的发布时间和平台，如TikTok或YouTube。
💰产品价格
- 免费开源
7.Flow Studio

Flow Studio是一款AI视频生成工具，能一键生成3分钟电影级质量的视频。通过AI自动创建引人入胜的情节、保持角色一致性，自动匹配背景音乐和音效，简化视频制作流程。支持多种视频风格和类型，适用于营销、教育、社交媒体等场景。

🚀创作功能亮点
- AI驱动的叙事：Flow Studio能自动生成引人入胜的情节，保持角色的一致性，确保视频内容连贯且吸引人。
- 电影级制作质量：提供专业级的视觉效果和音频质量，包括背景音乐和音效，提升整体观看体验。
- 一键生成视频：用户只需提供基本的文本描述，Flow Studio可自动完成视频的生成，简化视频创作流程。
- 多样化的视频风格：支持动漫、现实、3D、2.5D、线艺术等多种视频风格。
- 角色和声音匹配：确保角色在整个视频中的一致性，自动生成匹配的对话和音效。
✨支持视频风格
- 动漫：适合制作动画风格的视频。
- 现实：适用于现实风格的视频制作。
- 3D：提供三维视觉效果的视频。
- 2.5D：结合了2D和3D元素的视频风格。
- 线艺术：以线条为主要视觉元素的艺术风格。
- 恐怖：适合制作恐怖风格的视频。
- 浪漫：适合制作浪漫情感类视频。
- 单口喜剧：适合制作幽默或喜剧风格的视频。
👨🏻‍💻创作流程
- 注册和登录：首先，需要通过Google、Discord、X或LinkedIn账户注册并登录Flow Studio。
- 选择角色：登录后可以在角色库中选择一个角色，或者自行生成角色。
- 输入文本：在文本框中输入不超过500字的文本，文本应包含主角的姓名，描述想要生成的视频内容。
- 选择视频风格：根据视频的故事情节，选择合适的视频风格，如“General”、“Horror”等。
- 生成视频：完成上述步骤后，点击生成按钮，Flow Studio根据提供的文字和选择的风格自动生成视频。
💰产品价格
- 免费：提供免费生成两条视频。
- 付费订阅：按每条视频0.99美元的价格购买
8.Showrunner

Showrunner是Fable Studio推出的AI互动故事创作平台，支持用户通过简短的文字提示生成个性化的动画电视剧集。平台基于人工智能技术，根据用户的输入自动创作出对话、声音、剪辑等内容，快速生成2至16分钟的剧集。Showrunner旨在将观众转变为内容创作者，提供深度个性化的创作体验，模糊消费者与创作者之间的界限。专注于动画内容创作，未来计划扩展至真人实拍。

🚀创作功能亮点
- AI内容生成：只需提供简短的文字提示，Showrunner的AI能生成完整的动画剧集，包括对话、声音和剪辑。
- 个性化定制：深入定制剧情走向、对话撰写、角色设计和镜头选择，确保内容反映个人创意。
- 互动参与：Showrunner鼓励用户从被动观看者变为积极创作者，参与并影响他们喜爱的节目内容。
- 多样化动画风格：提供多种动画风格，包括经典动漫、3D动画和《南方公园》风格的剪纸动画。
✨支持视频风格
- 动漫风格：提供经典的动漫风格，满足用户创作传统二维动画的需求。
- 3D动画：支持皮克斯动画风格的3D动画创作，为用户提供立体和动态的视觉效果。
- 剪纸动画：模仿《南方公园》的剪纸动画风格，具有独特的视觉效果和表现力。
- 讽刺剧：如《Exit Valley》这样的作品，以犀利的讽刺手法讲述故事。
- 家庭喜剧：如《Pixels》这样的剧集，讲述家庭生活中的温馨和幽默。
- 恐怖动漫：如《Ikiru Shinu》这样的黑色恐怖动画，探索悬疑和惊悚元素。
- 政治讽刺剧：如《United Flavors of America》作品，通过夸张和幽默的方式对现实政治进行嘲讽。
- 科幻故事：如《The Prize》这样的剧集，设定在太空船上，讲述太空探险家的故事。
- 情感剧：如《What We Leave Behind》这样的动漫家庭剧，探讨家庭成员间的关系。
- 选集剧集：如《Sim Francisco》的系列剧，每集都以一个共享宇宙为背景，讲述不同人物的故事。
- 侦探黑色电影：如《Shadows over Shinjuku》的30年代动漫侦探黑色电影剧，融合历史背景和侦探悬疑元素。
- 西部剧：如《Thistle Gulch》这样的剧集，展现西部小镇背后的秘密和故事。
👨🏻‍💻创作流程
- 输入提示：在Showrunner上，输入文本提示，包含10-15个关键词或短语，来描述想要生成的场景或故事。
- AI创作：Showrunner的AI引擎收到文本提示后，自动创作出剧本草稿，包括对话、角色和情节。
- 内容生成：AI根据剧本草稿生成视频内容，包括动画、声音表演和基本剪辑。
- 个性化定制：可以对AI生成的内容进行个性化编辑，包括调整对话、修改角色设计、调整镜头和剪辑等。
- 编辑和细化：可以用Showrunner的编辑工具进一步细化视频，调整声音效果、颜色校正和动画细节。
- 最终输出：满意后，可以将完成的视频输出。
💰产品价格
- Showrunner目前处于内测阶段，用户可以访问官网加入等待列表，获得早期访问权限。目前没有具体的产品价格信息
9.神笔马良

神笔马良是猫眼娱乐推出的AI影视创作工具，能智能分析剧本内容，快速生成人物小传、AI画像、动态分镜，自动配音和添加背景音乐，提高影视创作前期的效率，确保剧本的原创性和保密性。神笔马良适用于项目提报、创投路演、创意阐释、剧本会议和分镜设计等多个场景。

🚀创作功能亮点
- 智能剧本分析：能深度理解剧本内核，自动提炼剧情要点。
- 快速角色创作：根据剧本内容快速生成人物小传和AI画像，使角色形象更加立体丰满。
- 一键动态分镜：智能划分剧本场次，设计镜头语言，一键生成动态分镜。
- 自动台词朗诵：系统自动为角色生成配音，根据情节发展添加背景音乐，增强剧本的视听效果。
✨支持视频风格
- 多场景适用：适用于项目提报、创投路演、创意阐释、剧本会议和分镜设计等多种影视创作场景。
- 多样画风选择：提供多种视觉风格，以满足不同剧本的视觉需求。目前申请内测体验中，可以访问神笔马良的官方网站了解更多信息。
👨🏻‍💻创作流程
- 上传剧本：登录后，找到上传剧本的选项，将剧本文档上传到平台。
- 智能分析：系统会对上传的剧本进行智能分析，提炼剧情和角色。
- 角色创作：根据剧本内容，系统生成人物小传和AI画像。
- 分镜创作：系统将一键生成动态分镜，包括场次划分和镜头语言设计。
- 台词朗诵：系统为角色自动生成配音，并根据情节添加背景音乐。
- 调整和编辑：可以对生成的故事板进行细节调整，如修改景别、色调等。
- 预览和导出：可以预览生成的动态故事板，确保满足要求后导出故事板，支持图片、视频或其他格式。
💰产品价格
- 目前产品内测体验中，可以访问官方网站进行体验和获取信息。
10.CoCoClip.AI

CoCoClip.AI 是一款面向社交媒体内容创作者的 AI 视频创作工具，专门设计用于制作适合 YouTube Shorts、TikTok 和 Instagram Reels 等平台的短视频。提供了一系列 AI 驱动的功能，如文本到视频的转换、自动视频编辑、智能字幕生成、AI 配音和多平台格式适配，丰富的模板和特效库。用户可以通过简单的操作生成个性化视频，一键分享到各大社交媒体，提升内容的吸引力和传播力。

🚀创作功能亮点
- AI 视频生成：用户可以输入文本描述，AI自动生成相应的视频内容，简化了视频创作过程。
- 自动视频编辑：平台提供自动剪辑和编排视频片段的功能，节省了大量手动编辑的时间。
- AI 脚本生成：AI 脚本生成器能自动为视频创建引人入胜的脚本，提升创造力的同时节省时间。
- 文本转视频：将书面内容转化为视觉吸引力的视频，增强用户参与度和覆盖范围。
- AI 配音工具：提供高质量的配音，无需专业配音演员，为视频添加声音。
✨支持视频风格
- AI 猫视频：CoCoClip 提供了一个专门的 AI 猫视频生成器，可以制作以猫为主题的可爱迷人视频。
- AI 产品视频：平台提供了 AI 产品视频生成器，专为电子商务和联盟营销专业人士设计，帮助他们创建专业外观的产品演示视频。
- 社交媒体视频：CoCoClip 支持为 YouTube Shorts、TikTok 和 Instagram Reels 等平台创建引人入胜的视频内容。
- AI 故事和脚本生成：CoCoClip 的 AI 工具可以帮助用户编写脚本和创作故事，适合需要引人入胜的视频叙事的内容创作者。
- 生动肖像创作：使用 AI 制作生动的肖像动画，为视频内容增添动态元素。
👨🏻‍💻创作流程
- 注册和登录：访问 CoCoClip 的官方网站。
- 选择视频模板：浏览不同的视频模板，模板专为不同的社交媒体平台和视频风格设计。
- 使用 AI 视频生成器：如 AI 猫视频生成器或 AI 产品视频生成器。输入相关的文本提示或脚本，AI 将根据这些提示自动生成视频内容。
- 自动编辑：让 CoCoClip 的自动视频编辑功能来完善创作，包括剪辑、添加字幕和过渡效果。
- 预览和导出：预览视频，确保符合预期后导出为适合不同社交媒体平台的格式。
💰产品价格
- 免费计划：基础功能免费，适合初学者和偶尔制作视频的用户。
- Pro 计划：每月 $14.9；包括 200 积分；可以创建大约 10 个 AI 短视频。
- Plus 计划：每月 $29.9；包括 500 积分；可以创建大约 25 个 AI 短视频。
- Plus Max 计划：每月 $59.9；包括 1200 积分；可以创建大约 60 个 AI 短视频。
11.Reel.AI

Reel.AI 是 CreativeFitting（井英科技）开发的全球首款 AI 短剧应用，基于 AI 技术生成短视频内容，为用户带来新的娱乐体验。应用在海外市场推出后，迅速受到欢迎，登上了娱乐应用畅销榜。Reel.AI 的背后团队 CreativeFitting 获得了百度集团的 Pre-A+ 轮融资，融资用于产品的进一步升级和内容生态系统的建设。Reel.AI 的视频生成工具基于自研的 Reel Diffusion 模型，擅长制作能激发观众情感共鸣的短片，展现了 AI 技术在内容创作领域的潜力。

🚀创作功能亮点
- 智能分镜脚本生成：只需输入简单的文案内容，系统会根据输入的文字信息，自动生成符合情境的分镜脚本。
- 一站式角色、配音、配乐解决方案：Reel.AI 提供了涵盖角色设计、配音和配乐等多个制作环节的一站式解决方案。可以在平台上选择 AI 生成的角色形象，或者上传自定义的设计。
- AI 生成的短剧场景及人物：Reel.AI 专注于叙事型视频生成能力的构建，通过不断升级模型能力，先围绕短视频广告场景做到了可以生成简单剧情，在行业里第一个推出了支持生成复杂剧情短剧视频的 ReelDiffusion 模型。
- AI 短剧 + AI 聊天互动：Reel.AI 结合了 AI 短剧和 AI 聊天互动，提供新型的娱乐体验。
- 高叙事型视频生成能力：基于自研的 Reel Diffusion 模型，擅长制作能激发观众情感共鸣的短片。在视频生成方面达到了全球领先水平，特别在动画短剧方面。
✨支持视频风格
- 动漫风格：可以将视频转换成动漫风格，给用户一种二次元的视觉体验。
- 3D风格：提供3D立体效果的视频风格，增加视频的深度和真实感。
- 水彩风格：模拟水彩画的风格，为用户提供艺术感强烈的视频效果。
- 自然风格：保持视频内容的自然感，适合风景类视频的生成。
- 粘土动画：模仿粘土动画的风格，提供一种手工艺术的感觉。
- 黑白风格：提供经典的黑白电影风格，适合营造特定的氛围。
- 电影质感：模仿电影的质感和色调，提升视频的艺术感。
- 日漫风格：提供日式动漫的风格模板，用户可以一键生成具有日漫风格的视频。
👨🏻‍💻创作流程
- 选择内容类型：可以选择从文字描述、图片或手绘图开始创作视频。
- 输入内容：如果是从文字描述，需要输入详细的文本提示，如果图片或手绘图开始，需要上传相应的图片文件。
- 选择风格：可以根据需要选择视频的风格，比如动漫、3D、水彩等。
- 调整参数：可以根据个人喜好调整视频的参数，如分辨率、帧率、视频长度等。
- 生成视频：完成上述步骤后，点击生成按钮，AI根据提供的内容和风格参数开始创作视频。
💰产品价格
- 可访问 Reel.AI 的官方网站或者在应用商店下载应用后获取价格详情。
12.PopShort.AI

PopShort.AI 是一个AI短剧创作平台，通过 AI 技术为用户带来沉浸式的互动体验和独特的剧情。平台的特色在于能提供每周更新的一分钟左右的短剧，适合忙碌的现代生活节奏。PopShort.AI 的主要功能包括与虚拟角色进行沉浸式 AI 互动、独家剧情体验、拥有超过1000小时的 AI 故事库，让用户成为故事主角的能力。用户可以通过订阅来观看所有的故事内容，订阅会自动续订，用户也可以随时取消。

🚀创作功能亮点
- 沉浸式 AI 互动：用户可以与虚拟角色进行激动人心的对话，提供身临其境的体验。
- 独家剧情：每个体验都是独一无二的，拥有无限的可能。
- 庞大的 AI 故事库：提供超过1000小时的激动人心的内容，用户可以随心所欲地享受。
- 成为故事的主角：AI 辅助用户轻松创建独家剧情。
✨支持视频风格
- 短剧：PopShort.AI 专注于制作短剧，这些短剧通常具有紧凑的情节和引人入胜的故事线。
- 互动故事：平台提供互动式故事体验，观众可以通过选择不同的选项来影响故事的发展。
- 定制视频：用户可以根据自己的需求定制个性化视频内容。
- 写实风格：提供逼真的视频效果，适合需要真实感的内容。
- 动画风格：适合创造卡通或动画风格的视频。
- 国风：提供中国风格的视频，适合展示传统文化元素。
- 风格化：追求艺术风格和视觉表现力，适合艺术创作和创意表达。
- 人像风格：专注于人物肖像的视频，适合时尚、广告等行业。
👨🏻‍💻创作流程
- 真人编剧完成剧本：PopShort.AI 的创作流程首先由真人编剧完成剧本创作。
- AI 视频生成：在制作环节，视频生成涉及到大量手动调整的部分。例如，AI 视频生成的过程类似抽卡，每次生成一个 3-5 秒的视频片段，单集 1 分钟的 AI 短剧至少需要生成 15 个可用片段，之后再手动剪辑。
- 后期制作：生成的片段经过后期剪辑，形成最终的短剧内容。目前产能大概是 1 人 1 天 1-2 集。
💰产品价格
- 访问 PopShort.AI 的官方网站获取最新的定价信息。
September 15, 2024
12个AI短剧创作平台和软件，自动剪辑一键生成视频短片
AI技术正在逐渐渗透到创意产业，从简单的语音助手到复杂的内容创作工具，AI的身影已出现在主流视频媒体平台上，催生了AI制作的视频短片和影视作品，重新定义了创意领域的边界。本篇文章将大家介绍12个AI短剧创作平台，一键创作视频故事短片。一个平台，能理解你的故事想法，自动生成一个完整的视频短片，这就是AI短剧创作平台的魅力所在。不单是一个AI工具，更是一个全新的视频创作伙伴，通过AI的力量，让创意变成现实。

1.白日梦

白日梦是光魔科技推出的AI故事视频创作平台，基于自然语言处理技术，用户可以输入文本内容，快速生成最长6分钟的视频。平台提供丰富的角色库、多种视频风格，支持自动化分镜生成，保持角色和场景的一致性。白日梦AI特别适合儿童绘本、连环画创作，也适用于小说推广、广告营销和艺术创作等场景。用户可通过简单步骤创作故事视频，导出后可分享至不同平台。

🚀创作功能亮点
- 文本到视频转换：用户只需输入文字描述，AI就能理解其内容，自动生成视频。
- 海量角色演员库：平台拥有庞大的角色库，用户可以根据视频内容的需要选择合适的角色，也可以自定义创建角色。
- 多种风格的视频生成：支持多种视频风格，如国风仙侠、AI短剧、萌宠星球等。
- 角色和场景生成：AI能根据文本描述自动生成相应的角色和场景，简化视频创作过程。
- 自动化分镜生成：AI智能分析文本内容，自动设计合理的镜头切换和场景过渡。
✨支持视频风格
- 国风仙侠：适合创作具有中国传统仙侠元素的视频，如武侠故事、神话传说等。
- AI短剧：适合生成短小精悍的剧情视频，喜剧、悲剧或任何其他类型的短剧。
- 萌宠星球：专为宠物爱好者设计，可以创作以宠物为主角的可爱视频。
- 神奇脑洞：适合那些天马行空、创意无限的故事，可以是科幻、奇幻或任何超现实的内容。
- 同人二创：支持用户基于现有的作品（如动漫、游戏、电影等）进行二次创作。
- 逸闻趣史：适合创作历史故事或基于真实事件的趣味视频。
- 儿童故事：可以创作教育性或娱乐性的儿童故事视频。
- 动态画面：提供动态背景和场景，增加视频的生动性和吸引力。
- 图文模式：适合创作绘本或连环画风格的视频，结合文字和图片讲述故事。
👨🏻‍💻创作流程
- 访问平台：访问白日梦AI官网。
- 创建角色：用户可以从角色库中选择现有的形象，或者根据自己的需求创建新的角色。
- 编写故事：用户需要编写想要转化为视频的故事或脚本，确保内容适合视频化。
- 角色设定：根据故事的内容，为故事选择合适的角色，进行必要的角色设定。
- 选择分镜：系统会根据用户的故事文案自动生成视频分镜，可以对这些分镜进行调整。
- 生成视频：预览满意，用户可以点击“生成视频”按钮，根据提供的内容生成视频。
💰产品价格
- 积分：新用户注册可领取1000积分。更多权益需要购买会员，以官网信息为准。
2.讯飞绘镜

讯飞绘镜是科大讯飞推出的AI短视频创作平台，能将用户输入的文本描述自动转换成视频内容，如短剧、预告片、MV等。讯飞绘镜适合内容创作者、营销人员和教育工作者，帮助他们快速将创意或故事转化为视频形式，简化视频制作流程，支持一键分发至各大社交平台。

🚀创作功能亮点
- 文本自动转视频：用户只需输入文本描述，讯飞绘镜能生成剧本，转化为视频分镜，最终制作成完整的短视频。
- 智能视频编辑工具：讯飞绘镜内置多种AI视频编辑工具，包括文本内容调整、背景音乐合成、旁白及对话生成等。
- 一键式视频分发：用户可以通过一键分发功能，轻松将作品推广至各大社交和视频平台。
- 粉丝互动与数据管理：讯飞绘镜提供粉丝互动功能和数据管理工具，帮助用户有效管理与粉丝的互动，同时对视频内容的表现进行数据分析。
✨支持视频风格
- 剧情短片：适合制作具有故事情节的视频，如科幻、戏剧、爱情等类型的剧情片。
- 预告片：适合生成城市宣传、商业广告、风光旅游等类型的预告片。
- 音乐视频(MV)：可以根据用户提供的歌曲歌词内容生成相应的视频素材，定制音乐MV。
- 经典IP角色：用户希望在视频中加入特定角色，可以详细描述角色特征生成相应的形象。
👨🏻‍💻创作流程
- 创作文字脚本：用户在平台上点击“开始创作”，输入灵感和创意的描述，选择想要创作的作品类型，如AI短剧、AI预告片或AI MV。
- 生成图片分镜：AI根据用户输入的文字脚本自动生成对应的图片分镜。可以对生成的分镜进行查看和调整。
- 生成视频素材：用户对图片分镜设置完成后，点击“生成视频”，平台会根据分镜生成视频素材，用户可以预览进一步调整素材。
- 导出素材到本地：视频素材调整完成后，用户可以保存单个视频素材，或者一键下载包含旁白、图片分镜和视频分镜的工程压缩包。
💰产品价格
- 讯飞绘镜用户注册后可获得150绘点用于视频生成，访问讯飞绘镜官网进行免费体验。
3.MOKI

MOKI是美图公司推出的AI短片创作工具，专注于简化短片创作流程，支持动画短片、网文短剧、故事绘本、MV等多种视频内容的生成。MOKI通过AI技术实现从文案到成片的一站式创作体验，用户只需输入故事梗概或导入脚本，即自动生成分镜脚本并进行编辑，最终生成带有配乐的视频内容。MOKI的核心优势在于AI驱动的脚本、分镜、视频生成、配音、配乐能力，使没有专业背景的用户也能轻松创作出具有个人特色的短片。MOKI计划提供4K分辨率、自定义图片生成视频等高级功能，满足专业用户的需求。

🚀创作功能亮点
- AI驱动的脚本生成：用户只需输入故事梗概或导入现有脚本，MOKI能自动生成分镜脚本提供多种设定选项。
- 一键生成视频内容：
  - 在内容生成阶段，MOKI自动生成分镜画面支持细节修改。
  - 在后期制作阶段，MOKI一键生成带有配乐的视频内容，支持用户对视频生成效果持续优化。
- 多种视频类型支持：MOKI适用于动画短片、网文短剧和故事绘本的制作等多类视频的需求。
- 智能剪辑与配乐：MOKI的AI功能能自动识别素材内容，实现智能剪辑、配乐和特效处理等专业功能。
✨支持视频风格
- 动画短片：MOKI可以帮助创作者快速生成动画短片的脚本和分镜，自动转换为视频素材。
- 网文短剧：能将网络文学内容转化为短剧形式的视频，提供创意构思辅助。
- 故事绘本：MOKI支持将故事内容转化为绘本风格的视频，适合儿童内容创作。
- MV（音乐视频）：MOKI可以辅助创作者制作音乐视频，通过AI技术提升制作效率。
👨🏻‍💻创作流程
- 前期设定：用户输入故事梗概或导入现有脚本，自动生成分镜脚本，提供多种视觉和风格设定选项。
- 内容生成：MOKI会自动生成分镜画面，支持用户对画面进行细节上的修改和调整。
- 后期制作：一键生成带有配乐的视频内容，支持用户对生成的视频效果进行持续的优化。
- 输出成片：完成上述步骤后，可以得到最终的视频短片，直接分享或进行专业级的调整。
💰产品价格
- 限时免费：目前MOKI开通限时免费生成服务，可登录官网体验
- MOKI积分：积分有效期2年，积分可用于MOKI平台内各类功能，如生成分镜图、生成视频等。新用户登录可获得325积分；购买100积分￥10元；300积分￥30元；500积分￥50元。
4.SkyReels

SkyReels 是昆仑万维推出的全球首款 AI 短剧平台，集成了剧本生成、角色定制、分镜设计、剧情编排、对白配音、背景音乐以及影片合成等多个功能，让创作者能轻松地“一键成剧”，制作出高质量的 AI 视频。用户只需输入一个简单的创意，SkyReels 就能自动完成从剧本到成品短剧的全流程制作，能自动将内容转换为 1080P 60 帧的高清视频，单次可生成视频长度达到 180 秒。特别适合短剧创作者、内容创作新人、社交媒体内容创作者、品牌与营销团队、教育与培训行业使用。

🚀创作功能亮点
- 全自动化剧本生成：用户只需输入一个概念或故事创意，AI 可自动生成一份结构完整、情节丰富的剧本，支持对已有剧本的自动整理与润色。
- 高质量情节设计：SkyReels 通过分析大量剧本情节，能生成高质量的故事情节、戏剧冲突、爽点及情感表达，确保剧本的吸引力和丰富性。
- 智能分镜生成：根据剧本内容，能一键生成分镜图片和对应的文字脚本，可以自由调整分镜、镜头角度、运镜方式等参数。
- 情感化对白/BGM：基于情感化语音合成技术，SkyReels 能赋予角色自然的句间停顿、情感表达、抑扬顿挫，基于视频内容自动生成 AI BGM，实现画面与音乐的完美融合。
- 个性化定制：支持角色形象、音色和分镜的智能生成与自定义调整。
- 内容一致性与精确性：SkyReels 确保角色与场景在不同分镜中的一致性，根据故事描述自动推演角色表演，实现人物表情、动作、台词的协调一致。
- 高效视频生成：能自动将分镜转换为连续高清视频，提供 1080P 60 帧输出。
✨支持视频风格
- 短剧视频：SkyReels 能一键生成完整的剧本、分镜、人物对白与背景音乐（BGM），自动将这些内容转换为连续的高清视频，单次可生成视频长度达到180秒。
- 动漫风格视频：SkyReels 提供动漫、卡通等多种视觉风格选择，适应不同创作者的偏好。
- 真人3D视频：能生成真人3D效果的视频，提供更加逼真的视觉体验。
- 情感化视频：基于情感化语音合成技术，SkyReels 能生成具有自然情感表达的视频内容。
- 剧情视频：SkyReels 能根据剧本内容一键生成分镜图片和对应的文字脚本，支持剧情的连贯性和表现力。
👨🏻‍💻创作流程
- 创意输入：首先输入一个简单的创意或概念，作为短剧的基础。
- 剧本生成：SkyReels通过自研剧本大模型SkyScript，自动生成一份结构完整、情节丰富的剧本。
- 角色定制：系统根据剧本内容自动推荐合适的角色，支持用户自定义角色形象和音色。
- 分镜生成：使用自研分镜大模型StoryboardGen，根据剧本一键生成分镜图片和对应的文字脚本。
- 视频生成：基于WorldEngine平台，将分镜自动转换为连续视频，生成的场景和人物更加生动和一致。
💰产品价格
- 目前开放申请内测，可登录官方网站进行登录申请体验。具体价格信息可登录网站获取。
5.OneStory

OneStory是一款AI驱动的故事创作工具，能将文字创意快速转化为专业分镜脚本和影视级连续画面。用户无需美术或电影制作背景，可通过简单操作创作出高质量的视觉作品。工具支持一键生成分镜脚本、轻松产出图像、实现画面元素级控制，支持用户构建专属角色资产库，适用于个人创作、教育、影视制作等多种场景，简化创作流程，让每个创意得以实现。

🚀创作功能亮点
- 一键生成专业分镜脚本：用户可以上传剧本文档或即兴的文思，OneStory会立即转化为分镜脚本和故事板。
- 轻松产出影视级图像：基于AI数据集，用户可以快速创作出高质量的图像故事，无需美术基础。
- 构建专属角色资产库：用户可以通过提示词和人物形象图片来构建自己的角色库，打造个性化的IP形象。
✨支持视频风格
- 多场景适用性：适用于多种不同的创作场景和案例，满足不同用户的个性化需求。
- 一键生成视频：用户可以将生成的图像串联成视频，OneStory支持视频生成功能，根据图像一键制作动画视频。
- 连续性角色和故事：OneStory支持生成连续性、一致性的角色和故事。
👨🏻‍💻创作流程
- 注册并登录：访问OneStory官网，注册账号并登录。
- 输入故事创意：在OneStory的文本输入框中，输入故事大纲、剧情简介或任何创意想法。
- 选择生成方式：根据需求，选择生成故事的方式，如分镜脚本、图像生成等。
- 调整与预览：OneStory会根据输入内容生成分镜脚本或图像，可以实时预览生成的内容。
- 生成视频：OneStory支持将生成的图像串联成视频，可以使用一键制作动画视频。
💰产品价格
- 免费用户：提供基础试用服务。
- 普通会员：价格为18元/月或180元/年，提供100个项目、600次重绘、8000字字符数的使用额度。
- 高级会员：价格为38元/月或380元/年，提供500个项目、2000次重绘、15000字字符数的使用额度。
- 团队会员：价格为定制，包括团队协作功能，如多人编辑和图片批注。
- AI视频生成：需要单独付费，一次图生视频的价格为3元人民币。
6.AutoShorts

AutoShorts.ai 是一个AI视频生成平台，能自动化地创建和发布无脸视频，特别适合TikTok和YouTube的内容创作者。用户只需提供主题或脚本，AutoShorts.ai 的AI技术能自动生成视频脚本、语音并发布到相应的平台。平台支持自定义脚本、配音和视觉效果，提供一键式操作，简化视频制作流程。AutoShorts.ai 提供了自动化发布机制，支持定时发布视频到社交媒体平台，实现24小时*7的自动化运营。适用于内容创作者、营销代理和教育者，帮助简化视频制作流程，提高效率，同时确保内容的独创性。

🚀创作功能亮点
- 自动化视频生成：基于AI技术根据用户输入自动生成无脸视频，简化视频创作流程。
- 一键式操作：用户只需提供主题或脚本，通过一次点击完成视频创作。
- 个性化定制：提供脚本、配音、字幕和视觉效果的定制选项，适应不同品牌和风格。
- 自动发布机制：支持定时发布视频到YouTube和TikTok等平台，实现24小时*7的自动化运营。
- AI驱动的创新：采用最新的AI技术，如GPT-4和Stable Diffusion，确保视频内容的创新性和吸引力。
✨支持视频风格
- 教育视频：适合在线课程、讲座或教学辅助，使学习材料更加生动和吸引人。
- 社交媒体营销：为社交媒体营销活动创建吸引人的视频内容。
- 影响者内容：影响者可以为其社交媒体频道创建高质量的视频内容。
- 企业内部培训：制作内部培训视频，用于员工培训和发展，提高培训效率和参与度。
- 历史频道：如讲述鲜为人知的历史事实的频道。
👨🏻‍💻创作流程
- 选择主题：用户可以选择一个预设的主题或者自定义自己的主题。
- 输入脚本：用户输入视频的脚本或描述，作为AI创作视频的基础。
- 自定义选项：用户可以根据需要选择配音、字幕、视觉效果等自定义选项。
- 预览编辑视频：AI根据提供的信息生成视频后，预览视频内容，或编辑视频的脚本、标题和背景音乐。
- 发布设置：可以设置视频的发布时间和平台，如TikTok或YouTube。
💰产品价格
- 免费开源
7.Flow Studio

Flow Studio是一款AI视频生成工具，能一键生成3分钟电影级质量的视频。通过AI自动创建引人入胜的情节、保持角色一致性，自动匹配背景音乐和音效，简化视频制作流程。支持多种视频风格和类型，适用于营销、教育、社交媒体等场景。

🚀创作功能亮点
- AI驱动的叙事：Flow Studio能自动生成引人入胜的情节，保持角色的一致性，确保视频内容连贯且吸引人。
- 电影级制作质量：提供专业级的视觉效果和音频质量，包括背景音乐和音效，提升整体观看体验。
- 一键生成视频：用户只需提供基本的文本描述，Flow Studio可自动完成视频的生成，简化视频创作流程。
- 多样化的视频风格：支持动漫、现实、3D、2.5D、线艺术等多种视频风格。
- 角色和声音匹配：确保角色在整个视频中的一致性，自动生成匹配的对话和音效。
✨支持视频风格
- 动漫：适合制作动画风格的视频。
- 现实：适用于现实风格的视频制作。
- 3D：提供三维视觉效果的视频。
- 2.5D：结合了2D和3D元素的视频风格。
- 线艺术：以线条为主要视觉元素的艺术风格。
- 恐怖：适合制作恐怖风格的视频。
- 浪漫：适合制作浪漫情感类视频。
- 单口喜剧：适合制作幽默或喜剧风格的视频。
👨🏻‍💻创作流程
- 注册和登录：首先，需要通过Google、Discord、X或LinkedIn账户注册并登录Flow Studio。
- 选择角色：登录后可以在角色库中选择一个角色，或者自行生成角色。
- 输入文本：在文本框中输入不超过500字的文本，文本应包含主角的姓名，描述想要生成的视频内容。
- 选择视频风格：根据视频的故事情节，选择合适的视频风格，如“General”、“Horror”等。
- 生成视频：完成上述步骤后，点击生成按钮，Flow Studio根据提供的文字和选择的风格自动生成视频。
💰产品价格
- 免费：提供免费生成两条视频。
- 付费订阅：按每条视频0.99美元的价格购买
8.Showrunner

Showrunner是Fable Studio推出的AI互动故事创作平台，支持用户通过简短的文字提示生成个性化的动画电视剧集。平台基于人工智能技术，根据用户的输入自动创作出对话、声音、剪辑等内容，快速生成2至16分钟的剧集。Showrunner旨在将观众转变为内容创作者，提供深度个性化的创作体验，模糊消费者与创作者之间的界限。专注于动画内容创作，未来计划扩展至真人实拍。

🚀创作功能亮点
- AI内容生成：只需提供简短的文字提示，Showrunner的AI能生成完整的动画剧集，包括对话、声音和剪辑。
- 个性化定制：深入定制剧情走向、对话撰写、角色设计和镜头选择，确保内容反映个人创意。
- 互动参与：Showrunner鼓励用户从被动观看者变为积极创作者，参与并影响他们喜爱的节目内容。
- 多样化动画风格：提供多种动画风格，包括经典动漫、3D动画和《南方公园》风格的剪纸动画。
✨支持视频风格
- 动漫风格：提供经典的动漫风格，满足用户创作传统二维动画的需求。
- 3D动画：支持皮克斯动画风格的3D动画创作，为用户提供立体和动态的视觉效果。
- 剪纸动画：模仿《南方公园》的剪纸动画风格，具有独特的视觉效果和表现力。
- 讽刺剧：如《Exit Valley》这样的作品，以犀利的讽刺手法讲述故事。
- 家庭喜剧：如《Pixels》这样的剧集，讲述家庭生活中的温馨和幽默。
- 恐怖动漫：如《Ikiru Shinu》这样的黑色恐怖动画，探索悬疑和惊悚元素。
- 政治讽刺剧：如《United Flavors of America》作品，通过夸张和幽默的方式对现实政治进行嘲讽。
- 科幻故事：如《The Prize》这样的剧集，设定在太空船上，讲述太空探险家的故事。
- 情感剧：如《What We Leave Behind》这样的动漫家庭剧，探讨家庭成员间的关系。
- 选集剧集：如《Sim Francisco》的系列剧，每集都以一个共享宇宙为背景，讲述不同人物的故事。
- 侦探黑色电影：如《Shadows over Shinjuku》的30年代动漫侦探黑色电影剧，融合历史背景和侦探悬疑元素。
- 西部剧：如《Thistle Gulch》这样的剧集，展现西部小镇背后的秘密和故事。
👨🏻‍💻创作流程
- 输入提示：在Showrunner上，输入文本提示，包含10-15个关键词或短语，来描述想要生成的场景或故事。
- AI创作：Showrunner的AI引擎收到文本提示后，自动创作出剧本草稿，包括对话、角色和情节。
- 内容生成：AI根据剧本草稿生成视频内容，包括动画、声音表演和基本剪辑。
- 个性化定制：可以对AI生成的内容进行个性化编辑，包括调整对话、修改角色设计、调整镜头和剪辑等。
- 编辑和细化：可以用Showrunner的编辑工具进一步细化视频，调整声音效果、颜色校正和动画细节。
- 最终输出：满意后，可以将完成的视频输出。
💰产品价格
- Showrunner目前处于内测阶段，用户可以访问官网加入等待列表，获得早期访问权限。目前没有具体的产品价格信息
9.神笔马良

神笔马良是猫眼娱乐推出的AI影视创作工具，能智能分析剧本内容，快速生成人物小传、AI画像、动态分镜，自动配音和添加背景音乐，提高影视创作前期的效率，确保剧本的原创性和保密性。神笔马良适用于项目提报、创投路演、创意阐释、剧本会议和分镜设计等多个场景。

🚀创作功能亮点
- 智能剧本分析：能深度理解剧本内核，自动提炼剧情要点。
- 快速角色创作：根据剧本内容快速生成人物小传和AI画像，使角色形象更加立体丰满。
- 一键动态分镜：智能划分剧本场次，设计镜头语言，一键生成动态分镜。
- 自动台词朗诵：系统自动为角色生成配音，根据情节发展添加背景音乐，增强剧本的视听效果。
✨支持视频风格
- 多场景适用：适用于项目提报、创投路演、创意阐释、剧本会议和分镜设计等多种影视创作场景。
- 多样画风选择：提供多种视觉风格，以满足不同剧本的视觉需求。目前申请内测体验中，可以访问神笔马良的官方网站了解更多信息。
👨🏻‍💻创作流程
- 上传剧本：登录后，找到上传剧本的选项，将剧本文档上传到平台。
- 智能分析：系统会对上传的剧本进行智能分析，提炼剧情和角色。
- 角色创作：根据剧本内容，系统生成人物小传和AI画像。
- 分镜创作：系统将一键生成动态分镜，包括场次划分和镜头语言设计。
- 台词朗诵：系统为角色自动生成配音，并根据情节添加背景音乐。
- 调整和编辑：可以对生成的故事板进行细节调整，如修改景别、色调等。
- 预览和导出：可以预览生成的动态故事板，确保满足要求后导出故事板，支持图片、视频或其他格式。
💰产品价格
- 目前产品内测体验中，可以访问官方网站进行体验和获取信息。
10.CoCoClip.AI

CoCoClip.AI 是一款面向社交媒体内容创作者的 AI 视频创作工具，专门设计用于制作适合 YouTube Shorts、TikTok 和 Instagram Reels 等平台的短视频。提供了一系列 AI 驱动的功能，如文本到视频的转换、自动视频编辑、智能字幕生成、AI 配音和多平台格式适配，丰富的模板和特效库。用户可以通过简单的操作生成个性化视频，一键分享到各大社交媒体，提升内容的吸引力和传播力。

🚀创作功能亮点
- AI 视频生成：用户可以输入文本描述，AI自动生成相应的视频内容，简化了视频创作过程。
- 自动视频编辑：平台提供自动剪辑和编排视频片段的功能，节省了大量手动编辑的时间。
- AI 脚本生成：AI 脚本生成器能自动为视频创建引人入胜的脚本，提升创造力的同时节省时间。
- 文本转视频：将书面内容转化为视觉吸引力的视频，增强用户参与度和覆盖范围。
- AI 配音工具：提供高质量的配音，无需专业配音演员，为视频添加声音。
✨支持视频风格
- AI 猫视频：CoCoClip 提供了一个专门的 AI 猫视频生成器，可以制作以猫为主题的可爱迷人视频。
- AI 产品视频：平台提供了 AI 产品视频生成器，专为电子商务和联盟营销专业人士设计，帮助他们创建专业外观的产品演示视频。
- 社交媒体视频：CoCoClip 支持为 YouTube Shorts、TikTok 和 Instagram Reels 等平台创建引人入胜的视频内容。
- AI 故事和脚本生成：CoCoClip 的 AI 工具可以帮助用户编写脚本和创作故事，适合需要引人入胜的视频叙事的内容创作者。
- 生动肖像创作：使用 AI 制作生动的肖像动画，为视频内容增添动态元素。
👨🏻‍💻创作流程
- 注册和登录：访问 CoCoClip 的官方网站。
- 选择视频模板：浏览不同的视频模板，模板专为不同的社交媒体平台和视频风格设计。
- 使用 AI 视频生成器：如 AI 猫视频生成器或 AI 产品视频生成器。输入相关的文本提示或脚本，AI 将根据这些提示自动生成视频内容。
- 自动编辑：让 CoCoClip 的自动视频编辑功能来完善创作，包括剪辑、添加字幕和过渡效果。
- 预览和导出：预览视频，确保符合预期后导出为适合不同社交媒体平台的格式。
💰产品价格
- 免费计划：基础功能免费，适合初学者和偶尔制作视频的用户。
- Pro 计划：每月 $14.9；包括 200 积分；可以创建大约 10 个 AI 短视频。
- Plus 计划：每月 $29.9；包括 500 积分；可以创建大约 25 个 AI 短视频。
- Plus Max 计划：每月 $59.9；包括 1200 积分；可以创建大约 60 个 AI 短视频。
11.Reel.AI

Reel.AI 是 CreativeFitting（井英科技）开发的全球首款 AI 短剧应用，基于 AI 技术生成短视频内容，为用户带来新的娱乐体验。应用在海外市场推出后，迅速受到欢迎，登上了娱乐应用畅销榜。Reel.AI 的背后团队 CreativeFitting 获得了百度集团的 Pre-A+ 轮融资，融资用于产品的进一步升级和内容生态系统的建设。Reel.AI 的视频生成工具基于自研的 Reel Diffusion 模型，擅长制作能激发观众情感共鸣的短片，展现了 AI 技术在内容创作领域的潜力。

🚀创作功能亮点
- 智能分镜脚本生成：只需输入简单的文案内容，系统会根据输入的文字信息，自动生成符合情境的分镜脚本。
- 一站式角色、配音、配乐解决方案：Reel.AI 提供了涵盖角色设计、配音和配乐等多个制作环节的一站式解决方案。可以在平台上选择 AI 生成的角色形象，或者上传自定义的设计。
- AI 生成的短剧场景及人物：Reel.AI 专注于叙事型视频生成能力的构建，通过不断升级模型能力，先围绕短视频广告场景做到了可以生成简单剧情，在行业里第一个推出了支持生成复杂剧情短剧视频的 ReelDiffusion 模型。
- AI 短剧 + AI 聊天互动：Reel.AI 结合了 AI 短剧和 AI 聊天互动，提供新型的娱乐体验。
- 高叙事型视频生成能力：基于自研的 Reel Diffusion 模型，擅长制作能激发观众情感共鸣的短片。在视频生成方面达到了全球领先水平，特别在动画短剧方面。
✨支持视频风格
- 动漫风格：可以将视频转换成动漫风格，给用户一种二次元的视觉体验。
- 3D风格：提供3D立体效果的视频风格，增加视频的深度和真实感。
- 水彩风格：模拟水彩画的风格，为用户提供艺术感强烈的视频效果。
- 自然风格：保持视频内容的自然感，适合风景类视频的生成。
- 粘土动画：模仿粘土动画的风格，提供一种手工艺术的感觉。
- 黑白风格：提供经典的黑白电影风格，适合营造特定的氛围。
- 电影质感：模仿电影的质感和色调，提升视频的艺术感。
- 日漫风格：提供日式动漫的风格模板，用户可以一键生成具有日漫风格的视频。
👨🏻‍💻创作流程
- 选择内容类型：可以选择从文字描述、图片或手绘图开始创作视频。
- 输入内容：如果是从文字描述，需要输入详细的文本提示，如果图片或手绘图开始，需要上传相应的图片文件。
- 选择风格：可以根据需要选择视频的风格，比如动漫、3D、水彩等。
- 调整参数：可以根据个人喜好调整视频的参数，如分辨率、帧率、视频长度等。
- 生成视频：完成上述步骤后，点击生成按钮，AI根据提供的内容和风格参数开始创作视频。
💰产品价格
- 可访问 Reel.AI 的官方网站或者在应用商店下载应用后获取价格详情。
12.PopShort.AI

PopShort.AI 是一个AI短剧创作平台，通过 AI 技术为用户带来沉浸式的互动体验和独特的剧情。平台的特色在于能提供每周更新的一分钟左右的短剧，适合忙碌的现代生活节奏。PopShort.AI 的主要功能包括与虚拟角色进行沉浸式 AI 互动、独家剧情体验、拥有超过1000小时的 AI 故事库，让用户成为故事主角的能力。用户可以通过订阅来观看所有的故事内容，订阅会自动续订，用户也可以随时取消。

🚀创作功能亮点
- 沉浸式 AI 互动：用户可以与虚拟角色进行激动人心的对话，提供身临其境的体验。
- 独家剧情：每个体验都是独一无二的，拥有无限的可能。
- 庞大的 AI 故事库：提供超过1000小时的激动人心的内容，用户可以随心所欲地享受。
- 成为故事的主角：AI 辅助用户轻松创建独家剧情。
✨支持视频风格
- 短剧：PopShort.AI 专注于制作短剧，这些短剧通常具有紧凑的情节和引人入胜的故事线。
- 互动故事：平台提供互动式故事体验，观众可以通过选择不同的选项来影响故事的发展。
- 定制视频：用户可以根据自己的需求定制个性化视频内容。
- 写实风格：提供逼真的视频效果，适合需要真实感的内容。
- 动画风格：适合创造卡通或动画风格的视频。
- 国风：提供中国风格的视频，适合展示传统文化元素。
- 风格化：追求艺术风格和视觉表现力，适合艺术创作和创意表达。
- 人像风格：专注于人物肖像的视频，适合时尚、广告等行业。
👨🏻‍💻创作流程
- 真人编剧完成剧本：PopShort.AI 的创作流程首先由真人编剧完成剧本创作。
- AI 视频生成：在制作环节，视频生成涉及到大量手动调整的部分。例如，AI 视频生成的过程类似抽卡，每次生成一个 3-5 秒的视频片段，单集 1 分钟的 AI 短剧至少需要生成 15 个可用片段，之后再手动剪辑。
- 后期制作：生成的片段经过后期剪辑，形成最终的短剧内容。目前产能大概是 1 人 1 天 1-2 集。
💰产品价格
- 访问 PopShort.AI 的官方网站获取最新的定价信息。
September 15, 2024