Category: AI工具

AI工具集介绍和收录了当前最新的AI产品，紧跟最新AI领域的进展，介绍了AI产品的主要功能、如何使用和主要应用场景，快速了解最新AI产品发展趋势。

Aider – 开源AI编程助手，基于命令行指定自动完成代码修改
Aider是什么

Aider 是开源的AI辅助编程工具，基于终端与大型语言模型（LLM）配合，实现高效代码编辑和开发。Aider支持多种编程语言，如 Python、JavaScript、TypeScript 等，能与 Claude 3.5 Sonnet、DeepSeek R1、OpenAI 的o3-mini、 GPT-4o 等多种 LLM 无缝对接。用户基于命令行指定文件并描述需求，Aider 自动完成代码修改并提交 Git 更改，生成合理的提交信息。Aider支持多文件编辑、语音编程、添加图片或 URL 等功能，显著提升开发效率。

Aider的主要功能
- 代码编辑与修改：用户基于命令行指定需要编辑的文件，描述需求（如添加功能、修复错误、重构代码等），Aider 自动完成代码修改。支持多文件编辑，适用于复杂的代码修改需求。
- 自动提交更改：修改完成后，自动将更改提交到 Git 仓库，生成合理的提交信息。
- 与多种 LLM 集成：支持与多种大型语言模型（LLM）对接，如 Claude 3.5 Sonnet、DeepSeek、OpenAI 的 GPT-4o 等。
- 交互功能：支持在聊天中添加图片（如 GPT-4o 和 Claude 3.5 Sonnet 支持）、URL，及通过语音编程，扩展交互方式。
- 多语言支持：支持多种主流编程语言，如 Python、JavaScript、TypeScript、PHP、HTML、CSS 等。
- 与 IDE 集成：在用户熟悉的编辑器或 IDE 中使用，同时与 Aider 的交互不会中断。
Aider的技术原理
- 基于 LLM 的代码生成与理解：用 LLM 的自然语言理解和代码生成能力，将用户的自然语言指令转换为代码修改操作。
- 本地代码库的上下文映射：创建本地 Git 仓库的上下文映射，帮助 LLM 理解代码库的整体结构和逻辑。使得 LLM 在处理复杂代码库时保持高效和准确。
- 实时同步与交互：用户在编辑器中修改代码时，Aider 实时同步更改，确保 LLM 在生成代码时始终基于最新版本。实时交互机制保证了开发的流畅性和一致性。
- 自动 Git 提交：修改完成后，Aider 自动将更改提交到 Git 仓库，生成合理的提交信息。
Aider的项目地址
- 项目官网：https://aider.chat/
- GitHub仓库：https://github.com/Aider-AI/aider
Aider的应用场景
- 新项目开发：快速搭建代码框架，生成基础功能模块，加速项目启动。
- 代码修复：分析错误信息，自动生成修复代码，减少调试时间。
- 代码重构：优化代码结构，提升可读性和性能，支持复杂代码库的多文件编辑。
- 文档更新：根据代码变更自动生成或更新文档，确保代码与文档的一致性。
- 团队协作：帮助新成员快速上手，提供代码优化建议，提升团队整体效率。
February 20, 2025
Phantom – 字节跳动推出的主体一致视频生成框架
Phantom是什么

Phantom是字节跳动智能创作团队推出的用在主体一致视频生成（Subject-to-Video, S2V）的框架。基于跨模态对齐技术，结合文本和图像提示，从参考图像中提取主体元素并生成与文本描述一致的视频内容。Phantom基于现有的文本到视频（T2V）和图像到视频（I2V）架构，重新设计了联合文本-图像注入模型，基于文本-图像-视频三元组数据学习跨模态对齐。Phantom框架支持单主体和多主体参考，特别在人类生成任务中强调主体一致性，覆盖现有的身份保留视频生成任务，提供增强优势。

Phantom的主要功能
- 从参考图像中提取主体元素：识别并提取图像中的主体（如人物、动物、物体等），作为生成视频的核心内容。
- 根据文本提示生成视频：用户基于文本指令控制视频的内容和风格，实现高度定制化的视频生成。
- 多主体视频生成：支持同时处理多个主体，生成复杂的交互场景，如多人互动、人与宠物互动等。
- 身份保留（ID-Preserving）：在生成视频时，保留主体的身份特征（如人脸、服装等），特别适用于虚拟试穿、数字人生成等场景。
- 高质量视频输出：生成的视频在视觉效果、主体一致性和文本响应性方面表现出色，与现有的商业解决方案相当。
Phantom的技术原理
- 数据结构设计：Phantom构建了文本-图像-视频三元组数据结构，用在训练模型理解不同模态之间的关系。数据分为In-paired（图像与视频主体一致）和Cross-paired（跨视频匹配）两种类型，避免模型简单复制输入图像。
- 模型架构：基于现有的文本到视频（T2V）和图像到视频（I2V）架构，重新设计联合文本-图像注入模型。模型分为输入头（Input Head）和可训练的DiT模块。输入头负责编码视频、文本和参考图像，DiT模块负责跨模态对齐和视频生成。
- 跨模态对齐：参考图像基于特定的视觉编码器（如VAE和CLIP）编码后，与视频特征和文本特征分别拼接，输入到DiT模块的视觉和文本分支。
- 身份保留技术：在处理人脸等身份特征时，基于面部识别模型（如ArcFace）评估生成视频与参考图像的相似度，确保主体身份的一致性。
- 优化与训练：基于大规模的三元组数据训练，学习如何在生成视频时平衡文本和图像的双重提示。模型在预训练阶段继承基础模型的权重，基于跨模态数据进一步微调，实现高质量的视频生成。
Phantom的项目地址
- 项目官网：https://phantom-video.github.io/Phantom/
- GitHub仓库：https://github.com/Phantom-video/Phantom
- arXiv技术论文：https://arxiv.org/pdf/2502.11079
Phantom的应用场景
- 虚拟试穿：生成服装动态展示视频，帮助用户预览效果。
- 数字人生成：创建具有特定外貌的虚拟角色，用于虚拟主播等场景。
- 广告视频制作：根据图像和文本快速生成产品广告，提升制作效率。
- 影视动画：生成角色动画原型，辅助创意验证，降低制作成本。
- 教育培训：生成科学实验、历史场景等教学视频，增强互动性。
February 20, 2025
灵境AI – AI内容生成平台，提供文案、图片、视频创作等多种AI功能
灵境AI是什么

灵境AI是专注于文创数字化和AI内容生成的智能平台，通过先进的AI技术为用户提供高效的内容创作解决方案。具备文案创作、小说写作辅助、AI图片生成、视频创作等功能，能帮助创作者快速生成高质量的文案、故事创意、艺术作品以及动态视频。灵境AI结合了自然语言处理和深度学习技术，支持多种应用场景。

灵境AI的主要功能
- 文案创作：灵境AI能根据用户输入的主题或关键词，快速生成高质量的文案内容，适用于广告宣传、产品介绍、社交媒体文案等多种场景。可以根据用户需求进行文案风格的调整，如正式、幽默、文艺等。
- 小说写作辅助：针对文学创作，灵境AI提供故事创意启发、人物设定辅助、情节发展建议等功能，帮助创作者突破写作瓶颈，提升创作效率。支持生成小说开头、结尾或中间情节，为作者提供灵感支持。
- AI图片生成：用户可以通过输入文字描述，让灵境AI生成相应的艺术图片或设计元素。应用于创意设计、广告制作和艺术创作等领域。
- 视频创作：灵境AI支持将图片转化为动态视频，用户可以输入图片或文字描述，生成短视频内容，适用于社交媒体推广、短视频制作等场景。
- 智能对话与内容仿写：提供智能对话功能，能根据用户输入进行自然流畅的对话交流。可以对已有内容进行仿写，生成风格相似的文本，适用于内容扩充或创意启发。
- 数字人创建与AI试衣：在灵境Pro等应用中，灵境AI支持数字人创建和AI试衣功能，用户可以生成个性化的数字人形象，通过虚拟试衣功能体验不同的服装搭配效果。
- IP生成与文创应用：灵境AI结合网文大数据，能生成具有潜力的IP创意，助力文创产业的IP孵化和内容生产，在小说、动漫等领域表现出色。
如何使用灵境AI
- 访问官网并注册账号：访问灵境AI的官方网站，注册账号并登录。
- 选择所需工具：灵境AI提供了多种功能，包括AI文案创作、AI视频生成、小说/短剧分销、网文大数据分析等。用户可以根据自己的需求选择相应的工具。
- 输入关键词或素材：在选定的工具中输入相关的关键词、主题或素材。例如，在文案创作中输入产品信息、目标受众等；在视频生成中输入脚本或图片素材。
- 生成内容并调整优化：点击“生成”按钮后，灵境AI会根据输入的信息快速生成内容。用户可以根据需要对生成的内容进行调整和优化，例如修改文案风格、调整视频效果等。
- 下载并应用：生成满意的内容后，可以下载应用于不同的场景，如社交媒体推广、短视频创作、小说发布等。
灵境AI的应用场景
- 小说创作：灵境AI提供故事创意启发、人物塑造辅助和情节推进建议，帮助创作者快速生成高质量的小说内容。
- 短剧与动漫制作：通过AI技术，灵境AI能够将小说、剧本等文字内容改编为动漫或短剧，支持从剧本创作到动态渲染的全流程制作。
- AI文案创作：灵境AI能生成直播脚本、视频剧本、电商文案、新闻资讯等多种类型的文案，满足不同营销场景的需求。
- AI视频生成：灵境AI整合视频原创和二次创作工具，帮助品牌和创作者快速生成高质量的短视频内容，适用于品牌推广和自媒体创作。
- AI绘画与图片生成：灵境AI可以根据用户输入生成多种风格的图片，适用于艺术创作和设计领域。
February 20, 2025
Speechki – AI文本转语音工具，支持1,100多种语音和80多种语言
Speechki是什么

Speechki是先进的 AI 文本转语音（TTS）工具，能将文本快速转换为高质量、逼真的音频内容。Speechki支持超过1,100种语音和80多种语言，适用于多种场景，如内容创作、教育、企业营销等。Speechki核心功能包括实时校对、角色管理、精确停顿控制以及多语言支持，用户基于可视化编辑器调整语速、语调和音高，生成自然流畅的音频。Speechki 提供 ChatGPT 插件，方便用户将文本直接转换为音频文件。

Speechki的主要功能
- 高质量文本转语音（TTS）：将文本快速转换为逼真的音频，支持超过1,100种语音和80多种语言。
- 实时校对与编辑：提供实时校听功能，用户能在文本转语音过程中即时调整。
- 可视化编辑器：支持章节式格式化和角色管理，方便用户在对话中分配不同角色。
- 精确控制音频输出：用户能调整语速、语调、音高，能对特定词汇或短语进行发音调整。
- 与 ChatGPT 集成：提供 ChatGPT 插件，用户直接将 ChatGPT 生成的文本转换为音频文件，支持多种语言，提升创作效率。
Speechki的官网地址
- 官网地址：speechki.org
Speechki的应用场景
- 内容创作：制作播客、有声读物、音频故事或视频配音，将文字内容快速转换为高质量音频，提升创作效率和受众体验。
- 教育领域：将教学材料、课程笔记或电子书转换为音频，方便学生随时随地学习，尤其适合视障人士或需要多模态学习的场景。
- 企业与营销：用在制作多语言广告配音、客户支持音频或企业培训材料，提升品牌传播力和客户互动体验。
- 娱乐与媒体：为动画、游戏或短视频生成角色配音，丰富内容表现力，提升观众的沉浸感。
- 个人使用与辅助：将个人文档、博客文章或社交媒体内容转换为音频，方便在开车、运动或休息时收听，拓展内容的可访问性。
February 20, 2025
ToddlerBot – 斯坦福大学开源的机器学习与人形机器人平台
ToddlerBot是什么

ToddlerBot是斯坦福大学开源的用在运动操作的开源机器学习与人形机器人平台，为高效收集大规模、高质量的训练数据设计。ToddlerBot具备30个主动自由度，用Dynamixel电机，总成本控制在6000美元以内。基于数字孪生技术和零点校准，ToddlerBot能实现模拟到现实的零样本转移，且远程操作设备支持高效现实世界数据收集。ToddlerBot在运动和操作任务中表现出色，例如臂展、负载、耐力和动态运动能力。ToddlerBot的开源设计和详细组装手册易于复制和维护，适合广泛的研究应用。

ToddlerBot的主要功能
- 高效数据收集：能同时在模拟环境和现实世界中收集高质量的训练数据，支持大规模机器学习任务。
- 全身运动与操作：具备30个主动自由度，能执行复杂的全身运动和操作任务，如步行、推-ups、拉-ups、双臂操作和全身操作。
- 零样本模拟到现实转移：基于高保真数字孪生技术和电机系统识别，实现从模拟到现实的无缝策略转移。
- 远程操作与数据收集：配备直观的远程设备，支持基于人类演示快速收集现实世界数据，用在学习运动技能。
- 人机交互与协作：支持多机器人协作任务，如共同完成房间清理等复杂场景。
ToddlerBot的技术原理
- 数字孪生与零点校准：
  - 数字孪生：基于精确的物理模型和系统识别技术，创建高保真的模拟模型，确保模拟数据与现实世界的一致性。
  - 零点校准：用3D打印的校准设备，快速校准机器人的零点位置，确保运动控制的准确性。
- 电机系统识别（SysID）：基于命令电机跟踪扫频信号，收集位置跟踪数据，拟合执行模型，确保动态参数的准确性。让机器人在模拟和现实世界中具有相同的运动特性。
- 远程操作技术：用第二个上肢作为远程操作设备，基于力敏电阻和手持游戏电脑（如Steam Deck或ROG Ally X）控制机器人的运动。支持人类操作员直观地指导机器人完成复杂的任务。
- 强化学习与模仿学习：
  - 强化学习（RL）：基于MuJoCo和PPO算法训练步行和转向策略，输出关节位置设定值，实现高效的运动控制。
  - 模仿学习：基于远程操作收集现实世界数据，训练扩散策略（Diffusion Policy），实现复杂的操作任务。
ToddlerBot的项目地址
- 项目官网：https://toddlerbot.github.io/
- GitHub仓库：https://github.com/hshi74/toddlerbot
- arXiv技术论文：https://arxiv.org/pdf/2502.00893
ToddlerBot的应用场景
- 家庭玩具整理：两个机器人协作，一个捡玩具，一个推车，共同完成玩具收纳。
- 教育编程平台：学生编程让机器人完成步行、推-ups等任务。
- 实验室运动技能研究：强化学习训练机器人完成跳跃、攀爬等高难度动作。
- 家庭陪伴机器人：与儿童互动，完成拼图或运动游戏。
- 工业零部件操作：操作小型电子元件或机械零件。
February 20, 2025
MoBA – Moonshot AI 提出的新型注意力机制
MoBA是什么

MoBA（Mixture of Block Attention）是 Moonshot AI 提出的新型注意力机制，提高大型语言模型（LLMs）处理长上下文任务的效率。通过将上下文划分为多个块（block），引入无参数的 top-k 门控机制，让每个查询 token 动态选择最相关的键值（KV）块进行注意力计算。显著降低了计算复杂度，保持了与全注意力机制相当的性能。MoBA 的核心优势在于能无缝切换全注意力和稀疏注意力模式，同时遵循“少结构”原则，避免引入预定义的偏见，让模型自主决定关注点。实验表明，MoBA 在处理 100 万 token 的长文本时，速度比传统全注意力机制快 6.5 倍。MoBA 已经在 Kimi 平台上得到实际验证，开源了相关代码。

MoBA的主要功能
- 块稀疏注意力：MoBA 将上下文划分为多个块（block），每个查询 token 动态选择最相关的键值（KV）块进行注意力计算，实现长序列的高效处理。
- 无参数门控机制：通过一种新颖的 top-k 门控机制，MoBA 为每个查询 token 动态选择最相关的块，确保模型只关注最有信息量的部分。
- 全注意力与稀疏注意力的无缝切换：MoBA 设计为全注意力的灵活替代品，能在全注意力和稀疏注意力模式之间无缝切换，提高效率，不影响性能。
- 高性能实现：MoBA 结合了 FlashAttention 和 MoE（混合专家模型）的优化技术，显著降低了计算复杂度。在处理 1M token 的长文本时，MoBA 的速度比传统全注意力机制快 6.5 倍，而在处理 10M token 时，速度提升可达 16 倍。
- 与现有模型的兼容性：MoBA 可以轻松集成到现有的 Transformer 模型中，无需进行大量训练调整。
MoBA的技术原理
- 因果性设计：为了保持自回归语言模型的因果关系，MoBA 确保查询 token 不能关注未来的块，在当前块中应用因果掩码。避免了信息泄露，同时保留了局部上下文信息。
- 细粒度块划分与扩展性：MoBA 支持细粒度的块划分，类似于 MoE（混合专家模型）中的专家划分策略。这种设计提升了性能，使 MoBA 能扩展到极长的上下文（如 10M token），在长上下文任务中表现出色。
MoBA的项目地址
- Github仓库：https://github.com/MoonshotAI/MoBA
- 技术论文：https://github.com/MoonshotAI/MoBA
MoBA的应用场景
- 长文本处理：MoBA 通过将上下文划分为块并动态选择相关块进行注意力计算，降低了计算复杂度，能高效处理长文本，如历史数据分析、复杂推理和决策等任务。
- 长上下文语言模型：MoBA 已部署支持 Kimi 的长上下文请求处理，显著提升处理效率，在处理 1M 甚至 10M token 的超长文本时，速度分别提升 6.5 倍和 16 倍。
- 多模态任务：MoBA 的架构可以扩展到多模态任务中，处理和理解多种类型的数据（如文本和图像），结合长上下文处理能力，为复杂任务提供支持。
- 个人助理与智能家居：在个人助理和智能家居控制中，MoBA 可以高效处理用户的长指令，同时通过动态注意力机制快速响应，提升用户体验。
- 教育与学习：在教育领域，MoBA 可以帮助学生处理长篇学习资料，辅助完成作业，或提供基于长上下文的智能辅导。
- 复杂推理与决策：MoBA 的动态注意力机制能高效处理复杂的推理任务，如长链推理（CoT）和多步决策，同时保持与全注意力机制相当的性能。
February 19, 2025
配音神器Pro – AI配音软件，一键转换为流畅自然情感配音
配音神器Pro是什么

配音神器Pro是功能强大的AI配音软件，专为短视频创作者、自媒体人和有声内容制作者设计。通过先进的AI技术，将文字快速转换为自然流畅的语音，支持多种音色选择，包括男女声、童声以及不同风格的特色音色，满足不同场景的配音需求。软件具备实时语音转换、音频编辑、背景音乐添加等功能，用户可以轻松调整语速、音调、音量等参数，实现个性化的配音效果。智能情感识别技术能根据文本内容赋予配音更自然的情感表达，让作品更具感染力。

配音神器Pro的主要功能
- 文字转语音：用户输入文字后，软件可快速将其转换为语音，支持多种语言和方言，满足不同场景需求。
- 丰富音色库：提供多种音色选择，包括男声、女声、童声、萝莉音、大叔音等，每种音色还可调节语速、音调和音量，实现个性化配音。
- 音频编辑功能：支持音频剪辑、拼接、降噪、添加音效等操作，用户可对生成的配音进行精细调整，提升音频质量。
- 背景音乐添加：可为配音添加背景音乐，支持调节音量比例，使作品更具感染力。
- 实时预览与调整：在配音过程中，用户可以实时预览效果，随时调整音色、语速等参数，确保最终效果符合预期。
- 智能情感识别：根据文本内容识别情感标签，自动调整配音的语调和节奏，使配音更自然、更具感染力。
- 多格式导出：支持多种音频格式导出，如MP3、WAV等，方便用户在不同平台使用。
- 云端存储与分享：用户可将作品存储在云端，方便随时查看、编辑和分享。
- 批量配音：支持批量导入文本并生成配音，大大提高创作效率。
- 多场景适配：适用于短视频、影视解说、广告配音、有声读物等多种场景，满足不同用户需求。
如何使用配音神器Pro
- 下载与安装：配音神器Pro的官方网站，根据你的设备类型（Windows、Mac、Android、iOS）选择对应的版本进行下载。
- 注册与登录：首次使用需注册账号，已有账号可直接登录。
- 创建项目：登录后新建项目，输入项目名称（可选）。
- 输入文本：在文本框中输入或粘贴文字，也可批量导入文本文件。
- 批量导入：如果需要批量配音，点击“批量导入”按钮，选择多个文本文件（如TXT、Word文档等），软件会自动读取内容。
- 选择音色与参数：从音色库中选择合适的音色，调整语速、音调、音量和情感等参数。
- 添加背景音乐（可选）：选择内置或上传背景音乐，调整音量比例。
- 预览与调整：点击“预览”听配音效果，不满意可返回调整。可以使用软件的音频编辑功能，如剪辑、拼接、降噪等。
- 导出与保存：预览满意后，点击“导出”，选择格式和路径保存音频，也可存储到云端。
- 分享作品：将配音作品上传到社交媒体或通过其他方式分享。
配音神器Pro的应用场景
- 短视频创作：适用于抖音、快手等自媒体平台，可快速为视频添加生动有趣的配音，提升视频的吸引力和观看体验。
- 广告制作：用于广告宣传片、产品推广视频等，提供高质量的配音服务，增强广告效果。
- 有声读物：可将小说、童话、杂志、课本等文本转化为有声读物，满足用户的个性化听书需求。
- 企业宣传：适用于企业专题片、广告宣传、工程标书解说等，为企业的宣传内容提供专业的配音支持。
- 教育与培训：用于教材内容、电子词典、电子图书等教学资源的录制，帮助提升教学效果。
- 广播与播音：适用于地铁、车站、商场、学校等场所的广播播音，提供清晰自然的语音播报。
February 19, 2025
匡优Excel – 智能 Excel 分析工具，自然语言对话完成数据处理和分析
匡优Excel是什么

匡优Excel是智能 Excel 分析工具。通过自然语言交互的方式，帮助用户快速完成Excel数据的处理和分析。用户只需用简单的中文提问或下达指令，例如“计算本月销售额”或“生成销售趋势图”，匡优Excel能自动执行操作并生成结果。支持多种Excel文件格式，能快速生成可视化图表，如柱状图、折线图和饼图，帮助用户直观地理解数据。匡优Excel提供数据分析报告，包括关键指标、趋势分析以及数据建议，帮助用户快速洞察数据背后的商业价值。

匡优Excel的主要功能
- 自然语言交互：用户可以通过自然语言对话的方式提问或下达指令，无需掌握复杂的Excel函数或数据分析技能。
- 数据可视化：快速生成柱状图、折线图、饼图等可视化图表，帮助用户直观地理解数据。
- 数据分析与报告：提供详细的数据分析报告，突出关键指标和趋势，并给出数据解释和建议。
- 文件支持与操作便捷：支持常见的Excel文件格式（如.xlsx、.csv），用户只需上传文件即可开始分析。
- 安全可靠：采用256位加密保护，符合GDPR标准和SOC 2认证，确保数据安全。
如何使用匡优Excel
- 访问官网并注册：访问匡优Excel的官方网站。注册并登录账户。
- 上传Excel文件：登录后，找到“上传文件”或“开始分析”的按钮。选择需要分析的Excel文件（支持.xlsx、.xls、.csv等格式）。等待文件上传完成，系统可能会自动读取文件内容。
- 通过自然语言提问：在界面中找到对话框或输入框，使用自然语言描述你的需求，系统会根据你的指令自动处理数据并生成结果。例如：
  - “计算本月的销售总额”；
  - “生成第三季度的销售趋势图”；
  - “找出销售额最高的产品”。
- 查看结果与可视化：会以表格、图表或文字报告的形式展示分析结果。可以调整图表类型（如柱状图、折线图、饼图）或修改样式。
- 保存或导出结果：可以将分析结果保存为新的Excel文件，或导出为PDF、图片等格式。
匡优Excel的应用场景
- 销售数据分析：比较不同时间段（如季度、年度）的销售数据。分析各地区的销售表现。预测未来的销售趋势。
- 财务报表处理：计算各部门的支出比例。生成月度或季度财务摘要。分析成本结构。
- 库存管理：查找库存水平低的产品。计算产品周转率。预测补货需求。
- 市场与营销分析：跟踪营销活动的效果。分析用户参与度和行为模式。
- 数据清洗与整理：自动清洗数据，例如统一手机号格式。
February 19, 2025
浙大先生 – AI智能体平台，上线浙大满血版DeepSeek
浙大先生是什么

浙大先生是浙江大学推出的深度融合智能体平台。平台基于DeepSeek V3和R1模型，依托CARSI资源共享平台，覆盖教学、科研及生活等全场景。服务于浙江大学师生，也向全国829所CARSI联盟高校开放，师生可通过校园账号免费登录使用。

平台的核心优势包括强大的算力支持、丰富的AI应用以及开放的自主开发环境。依托“西湖之光”算力联盟，构建了超过1000Pflops的本地算力资源，与云端算力打通，确保用户无需担心服务器繁忙。“浙大先生”集成了AI科学家、教务问答、心理咨询等多种应用，支持图片、视频和音乐的生成。平台连接浙大校内公共数据库，支持师生自主开发智能体应用。

浙江大学已部署DeepSeek V3/R1模型满血版服务，师生只需通过校园账号登录，免费使用。

浙江大学推出了DeepSeek系列专题线上公开课，自2月17日起每周一晚上19:30直播，分享DeepSeek的技术突破与应用前景。

浙大先生的主要功能
- 强大的算力支持：依托“西湖之光”算力联盟，平台构建了超过1000Pflops（FP16）的本地算力资源，与数千P云端算力打通，确保用户无需再担心“服务器繁忙”的问题。
- 全国高校共享：通过CARSI资源共享平台，平台面向全国829所CARSI联盟高校的师生开放，师生可通过校园账号免费登录使用。
- 丰富的AI应用生态：
  - 集成AI科学家、教务问答、心理咨询、AI生图、AI视频、音乐工坊等多种应用。
  - 支持个性化学习路径生成、实时课堂讨论与随堂测验（如智云课堂）。
  - 提供AI智慧学伴（如“学在浙大”）和外语学习支持（如ETalk口语平台）。
- 开放的开发平台：连接浙大校内公共数据库，支持师生自主开发智能体应用，鼓励创新和个性化开发。
- 教育资源共享与创新：平台支持科研助手功能，如学术资源搜索、知识理解和学术内容生产等，推动科研智能化。
如何使用浙大先生
- 登录平台：师生可通过校园账号登录“浙大先生”平台（chat.zju.edu.cn），无需担心校园IP限制。
- 选择应用：平台集成多种智能体应用，如AI科学家、教务问答、心理咨询、AI生图、AI视频和音乐工坊等。用户可根据需求选择相应应用。
- 使用智能体功能
  - AI科学家：提供科研辅助，如文献检索、数据分析等。
  - 教务问答：查询课程信息、考试安排等。
  - 心理咨询：提供心理健康咨询和建议。
  - AI生图、视频和音乐工坊：支持创意生成，如图片、视频和音乐创作。
- 自主开发智能体：平台连接浙大校内公共数据库，支持师生自主开发智能体应用。开发步骤如下：
  - 访问开发者中心（open.zju.edu.cn）。
  - 选择租户编码“ZJU”。
  - 通过SSO统一身份认证登录。
站长推荐：DeepSeek服务器繁忙怎么解决？16个免费R1满血版平替

浙大先生的应用场景
- AI科学家助手：为科研人员提供文献检索、数据分析等辅助功能，提升科研效率。
- 智能体开发：平台连接浙大校内公共数据库，支持师生自主开发智能体应用，鼓励创新实践。
- 虚拟实验室建设：结合多模态创意生产平台，支持教材插图智能创作、三维教学模型生成等。
- 心理咨询：提供心理健康咨询和建议，帮助学生应对学习和生活中的压力。
- AI生图与视频生成：支持创意生成，如图片、视频和音乐创作，丰富学生的课余生活。
- 校园生活助手：包括新生向导、活动搜索、食堂助手等功能，提升校园生活的便利性。
浙大先生的案例分享
- 智云课堂：通过生成个性化学习路径，支持实时课堂讨论与随堂测验，帮助学生更高效地学习。
- AI智慧学伴：在“学在浙大”平台上，为师生提供24小时在线的疑难解答支持。
- ETalk口语平台：基于DeepSeek技术，根据学生水平动态适配，提供主题对话和脚本练习功能，增强外语学习的趣味性和效果。
- 数学学习工具：在上海交通大学的实践中，DeepSeek用于高等数学、概率统计等课程，提供解题思路和引导式问题，提升学生的分析和推导能力。
February 19, 2025
交小智 – AI智能体平台，上线西安交大满血版DeepSeek
交小智是什么

交小智是西安交通大学推出的基于大语言模型技术的AI应用创建平台，为全校师生提供低代码、低门槛的智能体（Agent）创建与管理服务。通过平台，用户无需编程基础可快速创建智能体，用于教学、科研、校园生活等多种场景。

平台支持多种功能，包括定制化问答机器人、科研助手、校园生活小秘书、师生服务助手等。集成了DeepSeek、豆包、通义千问、智谱清言、Kimi等在内等主流大模型，能实现文献解读、智能辅助教学、跨学科资源整合等服务。交小智提供知识库管理功能，用户可上传文本、图像、音频等知识，智能体通过知识库检索相关内容来回答问题。创建的智能体可通过API对接到其他系统中，进一步扩展其应用场景。

交小智的主要功能
- 快速创建智能体：零编程基础用户可以通过平台快速搭建智能体，支持通过一句话、一个文档或引用插件等方式创建。
- 定制化问答机器人：用户可上传专业资料（如教学大纲、研究论文等），创建能回答专业问题的智能助手。
- 科研与教学辅助：为研究人员和教师提供文献搜索、数据分析、论文解读等服务，助力科研和教学。
- 校园生活服务：智能体可以查询图书馆藏书、食堂菜单等校园生活信息，方便师生的日常生活。
- 师生服务助手：提供学生事务咨询，如奖学金申请、职业规划等服务。
- AI工具生成：支持创建多种实用工具，如Excel公式专家、多语种翻译专家、PPT生成专家等。
- 插件扩展功能：平台内置多种插件（如PPT生成、OCR识别、arXiv论文检索等），用户可以通过插件扩展智能体的能力。
- 智能体广场：用户可以发布自己创建的智能体，在智能体广场中查看和使用其他师生发布的优秀智能体。
- 知识库管理：用户可以上传知识库，智能体通过检索知识库内容来回答问题。
- API集成与发布：创建的智能体可以通过API对接到其他系统中，进一步扩展其应用场景。
如何使用交小智
- 登录平台：通过西安交通大学统一身份认证登录交小智官方网站，校外需使用vpn并进行统一身份认证。
- 创建智能体：点击页面左上角的“创建智能体”按钮，输入智能体名称，选择或自动生成智能体头像，选择智能体类型（如对话型），输入功能介绍。
- 配置智能体：进入编排界面，可以选择“AI一键生成配置”，系统会根据智能体名称和功能介绍自动生成提示词，可点击“自动优化”按钮进行优化。
- 人工编排（可选）：在左侧提示词面板修改角色、功能、限制等内容；在中间技能面板为智能体添加扩展能力；在右侧预览与调试面板实时调试智能体。
- 调试与预览：在右侧的调试与预览区域选择对应的语言模型。进行问答体验，根据测试结果调整提示词或其他变量，直到达到满意效果。
- 发布与备案：调试完成后，点击右上角的“发布”按钮，选择发布方式。发布完成后，需通过平台进行备案，具体可参考《西安交通大学智能体备案指南》。
- 使用插件（可选）：如果需要为智能体添加更多功能，可以在编排页面的“技能”区域添加插件。例如，为学术写作机器人添加文献搜索插件。
- 体验智能体：发布后的智能体可以在“智能体广场”查看和使用，也可以通过API对接到其他系统中。
交小智的应用场景
- 文献搜索与数据分析：研究人员可以用“交小智”创建智能体，上传研究论文和相关资料。智能体能理解复杂的研究问题，提供文献搜索、数据分析等服务。
- 跨学科资源整合：通过“交小智”平台，研究人员可以整合不同学科的资源，医学研究人员可以结合生物信息学数据和临床试验结果，通过智能体进行深入分析。
- 智能辅助教学：教师可以用“交小智”创建智能助教，助教能根据教学大纲提供定制化的教学内容，如自动批改作业、提供学习建议。
- 课程内容生成：教师可以上传课程大纲，智能体根据大纲内容自动生成课程讲义、习题和考试题目。
- 校园活动信息获取：学生可以通过智能体获取校园活动信息，如讲座、比赛和社团活动。
交小智的案例分析
- “仙交小i”AI咨询助手：
  - 背景：为了给学生提供更加便捷周到的服务，西安交通大学多个部门联手打造了面向全体本科学生的AI咨询助手“仙交小i”。
  - 功能：提供课程、学籍、奖助金、住宿、就餐、实践、活动、交流等各方面的24小时实时咨询。
  - 表现：截至9月20日，“学业小管家”访问量达到2.9万人次，对话量达1.6万条，文件引用次数达到1.8万次
- “西迁博物馆”智能体：
  - 背景：西安交通大学网络信息中心为档案馆、博物馆的老师展开了一场基于“交小智”AI应用平台的专题实践培训。
  - 功能：用人工智能提升工作效率与服务质量，开发AI服务助手，减轻工作压力。
  - 表现：通过高质量数据和人性化的语言风格，对模型进行调优，提升信息咨询服务的专业性、全面性和人情味。
February 19, 2025