Author: Chimy

  • MMaDA – 字节联合普林斯顿大学等推出的多模态扩散模型

    MMaDA是什么

    MMaDA(Multimodal Large Diffusion Language Models)是普林斯顿大学、清华大学、北京大学和字节跳动推出的多模态扩散模型,支持跨文本推理、多模态理解和文本到图像生成等多个领域实现卓越性能。模型用统一的扩散架构,具备模态不可知的设计,消除对特定模态组件的需求,引入混合长链推理(CoT)微调策略,统一跨模态的CoT格式,推出UniGRPO,针对扩散基础模型的统一策略梯度强化学习算法,基于多样化的奖励建模,统一推理和生成任务的后训练,确保性能一致提升。MMaDA在多项任务上展现出超越现有模型的性能,为多模态AI的发展提供新的方向。

    MMaDA

    MMaDA的主要功能

    • 文本生成:能生成高质量的文本内容,支持从简单的文本描述到复杂的推理任务。
    • 多模态理解:理解和处理文本与图像的结合,支持对图像内容的详细描述和基于图像的问答。
    • 文本到图像生成:根据文本描述生成相应的图像,支持从抽象概念到具体场景的生成。
    • 复杂推理任务:支持处理数学问题、逻辑推理等复杂任务,提供详细的推理过程和准确的答案。
    • 跨模态协同学习:基于统一的架构和训练策略,实现文本和图像模态之间的协同学习和优化。

    MMaDA的技术原理

    • 统一的扩散架构:用统一的扩散架构,基于共享的概率公式和模态不可知的设计,消除对特定模态组件的需求。模型能无缝处理文本和图像数据。在预训练阶段,模型基于掩码标记预测任务联合训练文本和图像模态。模型学习从噪声数据中恢复原始数据。
    • 混合长链推理(Mixed Long Chain-of-Thought, CoT)微调策略:基于统一的CoT格式对齐不同任务的推理过程。CoT格式包括逐步推理轨迹和最终结果,模型能生成详细的推理过程。用多样化的推理数据进行微调,包括数学问题、逻辑推理和多模态推理任务。让模型在处理复杂任务时表现出色。
    • 统一的策略梯度强化学习算法(UniGRPO):UniGRPO基于多样化的奖励建模,统一推理和生成任务的后训练。奖励函数包括正确性、格式、CLIP分数等,确保模型在不同任务上都能表现出色。UniGRPO用多步去噪学习,让模型能从部分噪声数据中学习,更好地用扩散模型的多步生成能力。

    MMaDA的项目地址

    MMaDA的应用场景

    • 内容创作:生成文本和图像,用于写作、设计和艺术创作。
    • 教育辅助:提供个性化学习材料和详细解题步骤,助力教学。
    • 智能客服:基于文本和图像交互,解答用户问题,提升服务体验。
    • 医疗健康:辅助医学图像分析,提供健康建议,支持医疗决策。
    • 娱乐游戏:生成游戏内容和增强现实体验,丰富娱乐互动。
  • Amie – AI会议工具,快速生成会议总结和行动项

    Amie是什么

    Amie是AI会议记录工具,帮助用户高效管理会议内容和后续工作。通过自动录音和生成会议总结,让用户在短时间内分享会议要点、更新CRM、计划行动项以及安排下次会议。Amie支持多种视频会议平台,如Zoom、Google Meet、Slack Huddle和Microsoft Teams,能自动记录会议生成笔记。用户可以在会议前或会议中添加私人笔记,笔记将作为总结的重点参考,用户可以自定义标题和关键数字。

    Amie

    Amie的主要功能

    • 快速会议总结与行动计划:Amie能在47秒内总结会议要点、更新CRM系统、规划行动项目以及安排下次会议,提升工作效率。
    • AI会议记录与总结:提供AI驱动的会议记录功能,准确捕捉会议关键信息,生成清晰的总结,避免信息遗漏。
    • 跨平台会议记录:支持与多种视频会议平台集成,包括Zoom、Google Meet、Slack Huddle和Microsoft Teams等,方便用户随时记录会议。
    • 自定义会议总结:用户可添加私人笔记,作为会议总结的重点参考,自定义标题和重点数字,提高总结的针对性和准确性。
    • AI聊天与任务执行:内置AI聊天功能,支持用户通过自然语言提问,获取会议相关信息,执行创建或更新会议、撰写邮件等操作。
    • 多平台集成:可与Google、Apple日历、Slack、Notion、Hubspot和Pipedrive等工具集成,方便用户将会议记录和行动项目同步到其他系统。
    • 可共享的会议记录页面:提供可共享的会议记录页面,方便团队成员和客户随时查看和回顾会议内容。
    • AI智能日程安排:根据用户的会议记录和待办事项,自动安排日程,根据计划变化进行调整。

    Amie的官网地址

    Amie的应用场景

    • 日常任务安排:Amie可以帮助个人用户快速安排日常任务和会议,通过AI智能日程安排功能,自动调整日程以适应计划变化。
    • 学习与自我提升:学生和专业人士可以用Amie记录课程、讲座或研讨会内容,生成详细的笔记和总结,方便复习和回顾。
    • 会议记录与分享:团队成员可以用Amie记录会议内容,通过共享页面快速分享会议总结和行动计划,确保团队成员都能及时了解会议要点。
    • 项目管理:通过记录项目相关会议,Amie帮助团队成员跟踪项目进度,确保每个成员都清楚自己的职责和下一步行动。
  • Devstral – Mistral AI联合All Hands AI开源的编程专用AI模型

    Devstral是什么

    Devstral是Mistral AI和All Hands AI推出的专为软件工程任务设计的编程专用模型。Devstral在解决真实世界软件问题上表现出色,在SWE-Bench Verified基准测试中,得分46.8%大幅领先其他开源模型。Devstral支持处理复杂代码库中的上下文关系、识别组件间联系及发现细微的代码错误。Devstral轻量级,能在单个RTX 4090或32GB内存的Mac上运行,适合本地部署和企业级应用。

    Devstral

    Devstral的主要功能

    • 解决复杂问题:支持处理大型代码库中的复杂问题,识别组件关系和修复细微错误。
    • 代码生成与优化:生成高质量代码,对现有代码进行优化。
    • 本地与企业级部署:轻量级设计,适合本地设备运行,同时适用企业级隐私敏感代码库。
    • 集成与扩展:支持与开发工具无缝集成,提供即时代码建议和解决方案。
    • 持续学习:基于持续预训练和微调,不断学习新的编程模式和最佳实践。

    Devstral的技术原理

    • 代理式架构(Agentic Architecture):Devstral基于代理式架构,架构支持模型与环境(如代码库、测试框架等)的交互逐步解决问题。
    • 基于真实问题的训练:基于解决真实的GitHub问题训练,模型更好地理解和处理实际开发中的复杂场景。训练数据包括各种类型的软件问题和解决方案,增强模型的泛化能力。
    • 代码代理框架(Code Agent Frameworks):Devstral与代码Agent框架(如OpenHands)协同工作,框架定义模型与测试用例之间的接口,在实际的开发环境中进行有效的测试和验证。
    • 深度学习与强化学习的结合:结合深度学习和强化学习技术,用深度学习模型生成代码和解决方案,用强化学习优化模型的决策过程,确保生成的代码满足实际需求。
    • 持续预训练与微调:Devstral基于持续预训练不断更新知识库,针对特定任务或领域进行微调,提高模型在特定场景下的性能和适应性。

    Devstral的官网地址

    Devstral的应用场景

    • 本地开发:在个人设备上快速解决代码问题,提升开发效率。
    • 企业开发:处理企业内部隐私代码库,保障代码质量和安全。
    • IDE集成:作为插件增强IDE功能,提供智能代码建议。
    • 代码库维护:自动检测和修复问题,优化代码结构。
    • 自动化测试:生成测试代码,提高测试覆盖率。
  • Sparkify – 谷歌推出的AI动画视频生成工具

    Sparkify是什么

    Sparkify是谷歌推出的AI动画视频生成工具,基于Gemini 2.5Veo 2模型。用户输入问题或复杂概念后,Sparkify能在2分钟内生成直观的动画短视频,讲解知识点。Sparkify多模态处理能力结合Google Search数据,确保内容准确且与最新信息同步。Sparkify适用于教育、科普和企业培训等领域,提升理解效率和传播效果。Sparkify目前处于内测阶段,访问官网加入等候列表。

    Sparkify

    Sparkify的主要功能

    • 快速生成动画短视频:用户输入问题后,Sparkify能在2分钟内生成动画短片,讲解知识点。
    • 多模态输入支持:支持文本、图像和网页输入,结合Google Search的实时数据,确保内容准确且与最新信息同步。
    • 智能脚本生成:自动提炼输入问题的核心概念,生成结构化脚本,结合动态视觉元素,增强理解力。
    • 高质量视频输出:基于Veo2技术生成高质量动画,帧率达60FPS,支持多种风格(如卡通、写实)。

    Sparkify的官网地址

    Sparkify的应用场景

    • 教育领域:教师将复杂课程内容(如“细胞分裂”)转化为动画短片,帮助学生快速理解知识点,提升学习效率。
    • 科普传播:科普创作者快速生成短视频,用在YouTube或TikTok发布,例如将“气候变化的影响”转化为2分钟动画,吸引年轻观众。
    • 企业培训:企业上传内部文档,生成培训视频,讲解流程或政策,降低制作成本,提高培训效率。
    • 内容创作:创作者快速生成动画内容,用在社交媒体发布,提升内容的吸引力和传播效果。
  • DreamGen – 英伟达推出的新型机器人学习技术

    DreamGen是什么

    DreamGen是英伟达推出的创新的机器人学习技术,基于AI视频世界模型生成合成数据,让机器人能在梦境中学习新技能。DreamGen仅需少量现实视频数据,能生成大规模逼真的训练数据,实现机器人在新环境中的行为泛化和环境泛化。DreamGen的四步流程包括微调视频世界模型、生成虚拟数据、提取虚拟动作以及训练下游策略。DreamGen让机器人在没有真实世界数据支持的情况下,凭文本指令完成复杂任务,显著提升学习效率和泛化能力。

    DreamGen

    DreamGen的主要功能

    • 行为泛化:让机器人学习、执行新的行为,无需为每种新行为收集大量的真实世界数据。
    • 环境泛化:让机器人在未见过的环境中执行任务。基于在单一环境中收集的数据,机器人能在多种新环境中成功执行任务。
    • 数据增强:生成大规模的合成训练数据,提升机器人在复杂任务中的成功率。
    • 多机器人系统支持:支持多种机器人系统(如Franka、SO-100等)和不同的策略架构(如Diffusion Policy、GR00T N1等),具有广泛的适用性。

    DreamGen的技术原理

    • 微调视频世界模型:用目标机器人的遥操作轨迹数据,微调视频世界模型(如Sora、Veo等),捕捉机器人的运动学和动力学特征。基于低秩适应(LoRA)技术,减少模型对原始数据的遗忘,适应新的机器人特征。
    • 虚拟数据生成:给定初始帧和语言指令,视频世界模型生成描述预期行为的大量机器人视频序列。视频不仅包含已知行为,包括新环境中的新行为。基于过滤掉不符合指令的“噩梦”视频,确保生成的数据质量。
    • 虚拟动作提取:用潜在动作模型(LAPA)或逆动力学模型(IDM)解析生成的视频序列,提取伪动作序列,形成神经轨迹。伪动作序列用在训练下游的视觉运动策略。
    • 策略训练:用生成的视频动作序列对(即神经轨迹)训练下游的视觉运动策略。基于神经轨迹,机器人在没有真实世界数据的情况下学习新任务,实现零样本泛化。

    DreamGen的项目地址

    DreamGen的应用场景

    • 工业生产:助力机器人快速掌握装配、焊接等复杂任务,提升生产效率与质量。
    • 家庭服务:使机器人适应不同家庭环境,完成清洁、整理等多样化家务。
    • 医疗护理:辅助医疗机器人精准操作,提高手术、康复等医疗环节的效率和安全性。
    • 物流仓储:帮助机器人高效处理各类物品的分拣、搬运,优化物流流程。
    • 农业生产:支持农业机器人在复杂环境里完成种植、收割等任务,提高农业产出。
  • Context7 – 为大模型和AI编辑器提供最新文档和代码示例的平台

    Context7是什么

    Context7 是 Upstash 推出的AI编程辅助工具,为大型语言模型(LLMs)和 AI 代码编辑器提供最新、版本特定的文档和代码示例。通过解析文档、丰富内容、向量化和重新排名等步骤,确保开发者能获取到准确且最新的代码示例和文档。Context7 支持多种工具,如 Cursor、Windsurf、Claude Desktop 等,通过模型上下文协议(MCP)实现集成。

    使用 Context7 时,开发者只需在提示中添加 use context7,可自动获取相关上下文,提高代码生成的准确性和可靠性。适合快速更新的框架或小众包,显著减少生成错误或过时代码的风险。Context7 的安装和配置相对简单,支持多种安装方式,包括通过 Smithery、Docker 等。

    Context7

    Context7的主要功能

    • 实时文档获取:从官方源(如 GitHub、官方文档网站)拉取最新文档和代码示例,确保开发者获取到的信息是最新的。
    • 版本特定:能根据目标库的版本匹配相应的文档和代码示例,避免因版本不一致导致的问题。
    • 无缝集成:只需在提示中添加 use context7,可触发文档注入,与多种 MCP 兼容客户端(如 Cursor、Windsurf、Claude Desktop 等)集成。
    • 减少幻觉代码:降低 AI 生成不存在 API 或过时代码的可能性,提高代码生成的准确性。
    • 多平台支持:兼容多种开发工具,如 Cursor、Windsurf、VS Code 等。
    • 精准的上下文提取:从最新文档中提取干净、相关的代码片段,仅包含代码和描述,没有多余内容。
    • 广泛的库支持:目前已支持超过 6000 个流行库,主流框架基本都能找到。
    • 免费使用:个人使用每天可免费查询多达 50 次。
    • resolve_library_id:通过提供指定库的模糊关键字,找到具体所指的包。
    • get_library_docs:获取指定包的文档内容,提供真正的文档而非搜索结果。

    Context7的工作原理

    • 解析:从文档中提取代码片段和示例。
    • 丰富:使用 LLMs 添加简短解释和元数据。
    • 向量化:嵌入内容以便进行语义搜索。
    • 重新排名:使用自定义算法对结果进行相关性评分。
    • 缓存:从 Redis 提供请求,以获得最佳性能。

    Context7的安装与配置

    • Node.js:需要 Node.js >= v18.0.0。
    • 安装方式
      • 通过 Smithery 安装
        • Claude Desktop

        npx -y @smithery/cli install @upstash/context7-mcp --client claude

      • 在 Cursor 中安装
        • 打开 Settings -> Cursor Settings -> MCP -> Add new global MCP server
        • 或者在 ~/.cursor/mcp.json 文件中添加以下配置:
        {
          "mcpServers": {
            "context7": {
              "command": "npx",
              "args": ["-y", "@upstash/context7-mcp"]
            }
          }
        }
      • 在 Windsurf 中安装
        {
          "mcpServers": {
            "context7": {
              "command": "npx",
              "args": ["-y", "@upstash/context7-mcp"]
            }
          }
        }
      • 在 VS Code 中安装
        {
          "servers": {
            "Context7": {
              "type": "stdio",
              "command": "npx",
              "args": ["-y", "@upstash/context7-mcp"]
            }
          }
        }
      • 使用 Docker 安装
        • 创建 Dockerfile
        FROM node:18-alpine
        
        WORKDIR /app
        
        # Install the latest version globally
        RUN npm install -g @upstash/context7-mcp
        
        # Expose default port if needed (optional, depends on MCP client interaction)
        # EXPOSE 3000
        
        # Default command to run the server
        CMD ["context7-mcp"]
        • 构建镜像:

        docker build -t context7-mcp .

        • 配置 MCP 客户端:
        {
             "mcpServers": {
               "Сontext7": {
               "autoApprove": [],
               "disabled": false,
               "timeout": 60,
                 "command": "docker",
                 "args": ["run", "-i", "--rm", "context7-mcp"],
                 "transportType": "stdio"
               }
             }
        }

    Context7的项目地址

    Context7的应用场景

    • 客服多轮对话管理:在客服场景中,用户咨询时多次切换话题,Context7 能保持上下文连贯并避免冗余。
    • 长文档分析:对于长文档(如法律合同),Context7 可以分段处理并整合关键条款,突破 LLM 原生上下文长度限制。
    • 实时数据分析:在电商用户行为监控等实时数据分析场景中,Context7 能结合历史行为和实时流数据生成推荐或风险预警。
    • AI 辅助编程::在使用 AI 编程助手时,如 Cursor,添加 use context7,Context7 会自动拉取相关的最新文档和代码示例,供 AI 模型生成更准确的回答。
  • Head – AI市场营销工具,自动生成跨平台营销策略

    Head是什么

    Head是全球领先的 AI 市场营销工具,基于 AI 技术自动生成秒级部署的跨平台营销策略,精准计算病毒式传播路径,帮助品牌主和创作者将市场预算转化为可量化增长。Head 已为多品牌提供服务,覆盖电商、科技、游戏和 AI 等多个领域,业务范围触及全球 200 多个国家和地区。

    Head

    Head的主要功能

    • 品牌DNA生成:一键生成品牌核心价值观、视觉元素和市场定位,确保营销信息一致。
    • 营销策略生成与执行:自动生成跨平台营销策略,快速部署并执行广告优化、影响者营销等。
    • 传播路径优化:精准计算病毒式传播路径,动态调整策略,确保营销活动高效扩散。
    • 预算优化与ROI提升:智能分配预算,提升投资回报率,降低无效预算。
    • 数据驱动的持续优化:24/7学习优化,基于实时数据调整策略,保持最佳效果。

    Head的官网地址

    Head的产品定价

    • 影响者营销:$1,500 美元,包含在 Aha 百万补贴计划内,用户无需额外支付费用。用户启动一个影响力营销活动,用 AI 技术来优化和管理营销活动。
    • 联盟营销:根据用户输入的预算和联盟数量动态计算。用户需要支付一定的费用来招募联盟合作伙伴。根据销售业绩向联盟合作伙伴支付佣金。
    • 销售拓展(Cold Email):根据用户输入的预算和潜在转化线索数量动态计算。用户支付一定的费用获取转化线索。

    Head的应用场景

    • 电商营销:为电商品牌生成营销策略,优化广告投放,提升销售额。
    • 科技推广:助力科技公司快速推广新产品,精准触达目标客户。
    • 游戏营销:帮助游戏开发者制定推广计划,吸引更多玩家。
    • 个人品牌塑造:为个人品牌打造独特形象,提升知名度和影响力。
    • 全球市场拓展:支持品牌在全球200多个国家和地区开展营销活动。
  • 如何用AI写长篇小说,1小时自动生成100章

    今天聊一个群友们关注度很高的话题:怎么用AI搞钱。

    很有友友表示想把日常的空闲时间利用起来,做点副业增加收入。

    送外卖、跑滴滴又需要先投入一些成本,还很累。

    这时一位群友晒出来用AI自动完成1000章长篇小说的截图,让大家思路大开。

    另一位友友直接化身天蚕土豆,新小说立马就投稿上架了。

    不过,还有不少友友表示,没看懂,求教程。。。

    这篇内容给大家整理了用AI写长篇小说的详细步骤,0成本、时间灵活,0基础的友友们也能快速上架自己的小说。

    如果小说热度不错,收益也是非常可观的。

    用AI辅助写小说

    很多人觉得,用AI写小说,比自己动笔简单得多。

    实际用起来却发现:

    • 明明给了提示词,但是AI输出的文案总是篇幅不够。
    • 写到一半剧情崩了,或者AI味太重,自己都读不下去。

    但Flowith最新推出的创新智能体Agent Neo是真能写啊!

    给它一个选题,喝杯咖啡的时间,它就哐哐输出几万字了,后台自动运行,自写自查,你可以放心去做其他事情

    我们打开Agent模式,把输出长度拉到最大(无限)

    提示词可以参考友友 @你的名字🔒 的分享,大概要包含这些方面:

    创建一本XXX主题的小说+故事主线+整体要求。

    比如,我想写一篇快穿女频文,输入提示词:

    创建一篇女频快穿长篇小说,爽文,故事主线是:主人公顾清霜,通过快穿体验不同人生,完成个人成长。

    我希望你帮我完成大纲、章节规划和小说内容创作,直至情节完整收官,坚决不能烂尾。最终篇幅目标为约1000章或更多。

    根据我的指示,我希望系统从第1章开始写作,严格按照之前的规划和既定要求进行: 

    1. 每一章节的字数目标为2000+字。

    2. 章节之间需要合理衔接,分章依据要吸引眼球,能够吸引读者追更。 

    3. 情节必须跌宕起伏,扣人心弦,早期埋下伏笔并在后期有呼应。 

    4. 人物设定好坏分明,好人极致善良,坏人极致邪恶。

    5.模仿人类的表达方式,长短句结合,减少使用列表和总结,减少连接词,贴近人类表达方式。

    Agent Neo不到十分钟,就已经完成了好几章,这效率10个我也比不上.。。。

    我们一起看看它生成的内容:

    第一个节点中,它按照我们的要求完成了小说创作规划书:包含整体故事大纲快穿世界的初步构想情节规划章节规划等等。

    根据章节的规划,在完成部分章节的输出后,它还会自动审阅内容,总结评估前面已经生成的内容,再做出后续内容的规划

    一边思考、一边规划、一边写、一边审核,Neo真的非常严谨了。

    如果对生成的内容不满意,可以点击内容上方的重新运行节点

    它就会根据前文,再次生成内容。

    我们一起看一下生成的小说内容:

    可读性还是非常不错的,就在我写教程的时间,它已经自动更新了一百多章!这样的写作方式也太轻松了~

    投稿发布

    创作的小说内容,我们可以投稿到一些小说平台,获得稿费。

    越热门的内容,稿费越高。

    稳定更新的优质创作者,还有机会直接与平台签约,获得一些额外的奖励。

    这里以番茄小说为例,我们进入番茄小说作家专区,创建一个账号。(其他平台也可以参考这个流程~)

    审核通过后,可以在首页创建新书

    完成书名简介的填写。

    点击创建章节,把刚才的小说内容完整的复制过来,上传,就搞定啦。

    内容审核通过后,会直接上架到番茄小说。

    更新达到2万字后,可以在平台上进行签约评估。

    一些分享

    用一句提示词,就能让AI生成几十万字的长篇小说,这效率真没得说!

    我们可以快速表达出脑海中的故事构想。

    即使是0基础的普通人,也有机会创作出爆文变现。

    感兴趣的友友可以直接去Flowith官网体验:

    Agent-Neo

    不过Agent Neo目前还处于内测阶段,需要邀请码才能使用。

    扫码关注评论区留言,领取Agent Neo邀请码

    原文链接:AI副业教学,1小时肝完100章小说!

  • MedGemma – 谷歌开源的AI医疗领域模型

    MedGemma是什么

    MedGemma是谷歌推出的开源AI模型,专门用在医疗图像与文本分析。模型基于Gemma 3架构,包含4B参数的多模态模型和27B参数的纯文本模型。4B模型擅长解读医疗图像(如胸部X光、皮肤病学图像等),支持生成诊断报告或解答图像相关问题。27B模型针对医疗文本理解与临床推理,支持患者分诊和决策辅助。模型支持本地运,或基于Google Cloud的Vertex AI部署实现大规模应用,谷歌提供Colab笔记本等资源助力模型微调和集成。

    MedGemma

    MedGemma的主要功能

    • MedGemma 4B模型
      • 医疗图像分类与解读:支持生成诊断报告,为医生提供图像解读的参考依据。
      • 图像相关问题解答:解答与医疗图像相关的问题,辅助医生进行诊断决策。
    • MedGemma 27B模型
      • 医疗文本理解与临床推理:对患者的病历、症状等文本信息进行分析,进行临床推理。
      • 患者分诊:根据患者的病历和症状,初步判断病情的严重程度和可能的疾病类型,为患者提供合理的就医建议。
      • 临床决策辅助:为医生提供诊断和治疗决策的辅助,推荐可能的诊断方向和治疗方案。

    MedGemma的技术原理

    • 基于Gemma 3架构:MedGemma是基于Gemma 3架构开发的,架构为模型提供强大的多模态处理能力,能处理图像和文本数据。
    • 多模态模型设计:MedGemma 4B模型是多模态模型,图像和文本数据结合起来进行分析。模型能更全面地理解医疗场景,例如在分析一张X光图像时,参考患者的病历文本信息,提高诊断的准确性。模型基于SigLIP图像编码器,专门用在处理图像的编码器,将图像数据转化为模型理解的特征表示,为后续的分析和推理提供基础。
    • 大规模预训练:MedGemma 4B模型的预训练数据涵盖胸部X光、皮肤病学、眼科及组织病理学等多种医疗图像,让模型具备对不同类型医疗图像的识别和理解能力。MedGemma 27B模型专注于医疗文本的理解,对大量医疗文本数据的学习,掌握医疗领域的专业术语、疾病描述、治疗方案等内容,进行准确的文本分析和推理。

    MedGemma的项目地址

    MedGemma的应用场景

    • 医疗图像诊断:辅助医生解读多种医疗图像,生成诊断报告,解答图像相关问题。
    • 远程医疗支持:为远程医疗提供图像诊断辅助,优化患者就医流程,提高资源利用效率。
    • 临床决策辅助:根据病历和症状分析,为患者分诊,为医生提供诊断和治疗建议。
    • 医学研究助力:分析大量医疗数据,挖掘疾病特征,为疾病研究和药物研发提供支持。
    • 智能系统集成:与医疗设备集成,开发智能医疗系统,提升医疗服务智能化水平。
  • Graphiti – 开源AI动态知识图谱生成框架

    Graphiti是什么

    Graphiti 是为动态环境设计的 AI 知识图谱生成框架,为 AI 智能体构建能查询、具有时间感知能力的知识网络。Graphiti 能实时摄取和处理结构化与非结构化数据,支持动态数据整合、状态推理与自动化,及混合检索。Graphiti 适用于 AI 智能体记忆层、实时交互系统和企业知识管理等场景,为智能体提供强大的动态记忆和推理能力,助力实现更智能、更高效的 AI 应用。

    Graphiti

    Graphiti的主要功能

    • 动态数据整合:实时摄取结构化和非结构化数据,支持增量更新。
    • 时间感知能力:跟踪事实和关系随时间的变化,支持时间点查询。
    • 混合检索:结合语义搜索、关键词搜索和图遍历,实现低延迟查询。
    • 状态推理与自动化:支持智能体基于图谱进行任务自动化与推理。
    • 可扩展性:设计用在处理大规模数据集,支持并行化处理。
    • 自定义实体类型:支持定义特定领域的实体类型,实现更精确的知识表示。
    • 多模态搜索:支持语义、关键词及图结构的复杂查询。

    Graphiti的技术原理

    • 时间感知图谱:在图边添加时间元数据记录关系的生命周期。图谱中的每个关系都有一个时间戳,能追踪从创建到结束的整个过程。
    • 事件驱动架构:基于事件驱动架构,将数据摄取为离散事件。每个事件都包含数据来源和时间戳,支持增量处理。
    • 混合检索引擎:结合语义嵌入、关键词搜索和图遍历技术,实现低延迟的复杂查询。语义嵌入基于向量空间模型理解文本内容,关键词搜索快速定位文本片段,图遍历用图结构进行关系推理。查询结果用与中心节点的距离重新排序,进一步优化查询结果的相关性。
    • 并行化处理:Graphiti支持并行化处理,能同时处理多个数据流,提高数据处理效率。

    Graphiti的项目地址

    Graphiti的应用场景

    • AI智能体记忆层:为AI助手提供长期记忆,支持个性化服务。
    • 实时交互系统:支持动态更新和历史查询,适用智能家居、智能客服等。
    • 企业知识管理:高效管理企业数据,支持复杂查询和决策支持。
    • 医疗健康:管理病历和治疗信息,辅助医疗AI进行诊断和建议。
    • 金融分析:实时更新市场数据,支持风险评估和决策优化。