Author: Chimy

  • 福棠·百川 – 百川智能联合北京儿童等推出的儿科大模型

    福棠·百川是什么

    福棠·百川是是国家儿童医学中心、首都医科大学附属北京儿童医院联合百川智能、小儿方健康共同发布的全球首个儿科大模型。覆盖了儿童常见病及疑难病症的立体化知识体系,具备强大的儿科临床推理能力,首创儿科“循证模式”,能像专业儿科医生一样整合最佳医学证据,为患儿制定科学、个性化的诊疗方案。模型基于万亿级token的专业医疗数据,涵盖中英文专业医疗论文、医疗指南、教材和书籍等全方位医学知识,整合了超过300位北京儿童医院知名儿科专家的临床经验和数十年脱敏后的高质量病历数据。

    基于模型推出了“福棠·百川”AI儿科医生基层版和专家版两款应用。基层版面向日常儿科疾病诊疗场景,诊断能力已达到北京儿童医院主治医生水平,可帮助提升基层医生的儿科诊疗水平。专家版聚焦儿科疑难罕见病的诊断和治疗,于2025年2月在北京儿童医院“上岗”,诊疗方案与专家会诊结果吻合率达95%。

    福棠·百川

    福棠·百川的主要功能

    • 立体化知识体系:涵盖儿童常见病及疑难病症。整合中英文专业医疗论文、医疗指南、教材和书籍等全方位医学知识。融合超过300位北京儿童医院知名儿科专家的临床经验和数十年脱敏后的高质量病历数据。
    • 儿科临床推理能力:能像专业儿科医生一样整合最佳医学证据。为患儿制定科学、个性化的诊疗方案。在循证、推理、记忆、对话、多模态方面进行强化。
    • 儿科“循证模式”:首创儿科“循证模式”。通过“摆事实、讲道理”的方式提供有理有据的回答。自建高可信的循证医学知识库,包含中英文指南及专家共识4万余篇、科研论文3800余万篇、药品说明书近17万篇。
    • 多轮问诊和沟通:面对患者家长时,能自主进行多轮问诊和耐心沟通。通过病情询问功能,形成初步诊断并给出检查建议。

    福棠·百川的技术原理

    • 人工智能技术:“福棠·百川”儿科大模型使用了最新的人工智能技术,自然语言处理(NLP)和机器学习(ML)。使模型能理解和处理自然语言数据,从中学习和提取有用的信息。模型还具备强大的儿科临床推理能力,能像专业儿科医生一样整合最佳医学证据。
    • 数据来源:模型的数据来源非常广泛和权威,包括:
      • 中英文专业医疗论文:涵盖了国内外权威的儿科临床指南和科研文献。
      • 医疗指南和教材:包括了儿科领域的标准治疗指南和教科书。
      • 专家临床经验:整合了超过300位北京儿童医院知名儿科专家的临床经验。
      • 高质量病历数据:使用了数十年脱敏后的专家高质量病历数据。
    • 模型训练方法:“福棠·百川”儿科大模型的训练采用了以下方法:
      • 海量专业医疗数据训练:构建了万亿级token的专业医疗数据库。
      • 临床经验融合:将专家的临床经验与模型训练相结合。
      • 多维度技术增强:在循证、推理、记忆、对话、多模态五个方面对模型进行强化。
      • 自建循证医学知识库:包含4万余篇中英文指南及专家共识、3800余万篇科研论文、17万篇药品说明书。

    福棠·百川的具体应用

    • AI儿科医生基层版
      • 面向日常儿科疾病诊疗场景。
      • 以儿童病毒性脑炎诊断为例,AI儿科医生可形成初步诊断并给出检查建议。
      • 门诊病例诊断能力已达到北京儿童医院主治医生水平。
      • 将在国家区域医疗中心、儿科医联体、县级三甲医院、社区医院等展开试点应用。
    • AI儿科医生专家版
      • 聚焦儿科疑难罕见病的诊断和治疗。
      • 已于2025年2月在北京儿童医院“上岗”。
      • 参加了10余次疑难罕见病多学科会诊、儿科大查房等。
      • 诊疗方案与北京儿童医院专家会诊结果吻合率达95%。

    福棠·百川的应用场景

    • 在线问诊:患者可以通过在线平台向AI儿科医生咨询,获得初步诊断和建议。
    • 远程会诊:支持远程多学科会诊,专家可以通过AI辅助进行诊断和治疗决策。
    • 医疗教育与培训:为基层医生和医学生提供培训和教育支持。通过模拟病例,帮助基层医生和医学生进行临床推理训练。提供最新的儿科医疗知识和指南,帮助医生和医学生及时更新知识体系。
    • 公共卫生与疾病预防:支持公共卫生部门进行疾病监测和预防工作。通过大数据分析,监测儿科疾病的流行趋势提供针对儿童常见疾病的预防建议和健康指导。
    • 科研与数据分析:支持儿科领域的科研工作,提供数据支持和分析工具。对大量儿科病例数据进行分析,挖掘潜在的疾病模式和治疗效果。为科研人员提供数据支持,辅助科研项目的开展。
  • Tesseract – 开源的光学字符识别引擎,支持多种语言文字识别

    Tesseract是什么

    Tesseract 是开源的光学字符识别(OCR)引擎,Google 赞助开发的高精度免费的应用。支持多种语言,能识别 JPEG、PNG、TIFF 等常见图像格式中的文字内容。Tesseract 提供了丰富的语言库,用户可以根据需求下载对应的语言包,实现对不同语言文字的识别。

    Tesseract

    Tesseract的主要功能

    • 多语言文字识别:Tesseract 支持多种语言的文字识别,包括但不限于英语、中文、日语、韩语、法语、德语、西班牙语等。用户可以通过下载对应的语言包来扩展其语言支持范围,满足不同场景下的多语言识别需求。
    • 多种图像格式支持:Tesseract 能处理常见的图像格式,如 JPEG、PNG、TIFF、BMP 等。支持从扫描文档、照片或屏幕截图中提取文字。
    • 高精度文字识别:能准确识别图像中的文字内容,转换为可编辑的文本格式。对于清晰的图像,识别准确率非常高,在经过适当的预处理(如去噪、二值化等)后,识别效果更佳。
    • 页面分割模式:Tesseract 提供多种页面分割模式(PSM),用户可以根据图像内容选择合适的模式以优化识别效果。
    • 编程接口支持:Tesseract 提供了丰富的编程接口,支持多种编程语言,如 Python、Java、C++ 等。通过这些接口,开发者可以将 Tesseract 集成到各种应用程序中,实现自动化的文字识别功能。
    • 自定义训练:Tesseract 支持自定义训练功能,用户可以根据自己的需求对特定字体或文字进行训练,提高识别的准确率。
    • 跨平台支持:Tesseract 支持多种操作系统,包括 Windows、Linux 和 macOS。
    • 文本后处理功能:除了基本的文字识别功能外,Tesseract 还提供了一些文本后处理功能。可以输出识别结果的置信度评分,帮助用户评估识别的准确性;可以输出识别结果的格式化文本,方便后续处理和分析。
    • 与其他工具集成:Tesseract 可以与其他工具和框架无缝集成。可以与图像处理库(如 OpenCV)结合,对图像进行预处理;可以与自然语言处理工具(如 spaCy)结合,对识别后的文本进行进一步分析和处理。

    Tesseract的技术原理

    • 图像预处理:在识别文字之前,Tesseract 首先对输入图像进行预处理,提高后续文字识别的准确性和效率。预处理操作包括:
      • 灰度化:将彩色图像转换为灰度图像,减少颜色信息的干扰。
      • 二值化:将灰度图像进一步转换为黑白二值图像,使文字与背景形成更明显的对比。
      • 去噪:去除图像中的噪声点,避免干扰文字识别。
      • 倾斜校正:对倾斜的图像进行校正,使其更接近水平方向。
    • 文本检测与分割:预处理后的图像会进入文本检测阶段,Tesseract 通过以下步骤定位和分割文字区域:
      • 连通区域分析:检测出字符区域的轮廓外形,并将轮廓集成为块区域。
      • 文本行分割:根据字符轮廓和块区域,识别出文本行,并通过空格或间隔分割单词。
      • 字符分割:将文本行中的每个字符分割出来,为后续的特征提取和识别做准备。
    • 特征提取:对于每个分割出的字符,Tesseract 提取其特征,这些特征包括:
      • 形状特征:如笔画宽度、形状轮廓、方向等。
      • 结构特征:如边缘、角点、线段等。 这些特征用于描述字符的形态和结构,为后续的分类器匹配提供依据。
    • 字符识别:特征提取完成后,Tesseract 使用机器学习算法(如神经网络 LSTM)将提取的特征与预训练的模型进行比对,识别出每个字符。识别过程会结合上下文信息和语言模型,提高识别的准确性。
    • 后处理:识别完成后,Tesseract 还会对结果进行后处理,包括:
      • 纠正错误:通过语法检查和上下文推理修正可能的拼写错误。
      • 格式调整:处理特殊字符和标点符号,确保输出文本的格式正确。

    Tesseract的项目地址

    Tesseract的应用场景

    • 文档数字化:将纸质文档(如书籍、报纸、合同等)扫描后,通过 Tesseract 识别文字内容,转换为电子文档(如 PDF、Word 等),方便存储、检索和编辑。
    • 表格数据提取:从扫描的表格文档中提取文字信息,自动转换为电子表格(如 Excel),提高数据录入的效率和准确性。
    • 发票识别:识别发票上的文字信息(如金额、日期、税号等),并提取到相应的系统中,用于财务管理和税务申报。
    • 移动 OCR 应用:集成到移动设备(如智能手机和平板电脑)中,开发各种 OCR 应用,如翻译工具、笔记应用、文档扫描工具等。
    • 教材数字化:将纸质教材转换为电子版,方便学生和教师使用。
  • GPT-4o mini TTS – OpenAI 推出的文本转语音模型

    GPT-4o mini TTS是什么

    GPT-4o mini TTS 是 OpenAI 推出的轻量级文本转语音模型,支持将文本内容转换为自然流畅语音的同时,开发者能用指令控制语音的语调、情感和风格,例如“平静”“鼓励”“严肃”等,适应不同场景需求。模型基于先进语音合成技术,生成高质量语音输出,支持多种语言及不同性别、年龄和口音的语音,满足多样化用户需求。GPT-4o mini TTS的定价为每分钟 0.015 美元。

    GPT-4o mini TTS

    GPT-4o mini TTS的主要功能

    • 文本转语音:支持多种语音控制选项,如口音、情感、语调、印象、语速、语气、耳语,生成高质量的语音文件。
    • 语音选项:提供 11 种内置声音控制将文本转换为语音,如:如alloy、ash、coral等。
    • 多语言支持:支持多种语言的语音合成。
    • 实时音频流处理:支持实时音频流的生成和输出,在语音生成过程中逐步播放,无需等待完整音频文件生成。
    • 支持多种输出格式:支持多种输出格式,如mp3、opus、aac等。

    GPT-4o mini TTS的技术原理

    • 基于GPT-4o mini模型:基于 GPT-4o mini(快速且强大的语言模型)构建的文本转语音模型。让文本转换为听起来自然的口语文本。最大输入标记数为 2000。
    • 情感和风格控制:在模型训练中引入额外的控制信号实现的。控制信号可以是文本中的特殊标记、元数据或直接的指令,模型学习信号与语音特征之间的关系,在生成语音时调整语调、情感和风格。
    • 多语言数据集:在训练阶段用多语言数据集,学习不同语言的语音特征和发音规律,生成多种语言的自然语音。
    • 实时音频流处理:基于流式处理技术,模型在生成语音时逐步输出音频数据,让模型快速响应用户的语音指令,提供流畅的交互体验,适合实时语音对话系统等应用场景。

    GPT-4o mini TTS的项目地址

    GPT-4o mini TTS的应用场景

    • 智能客服:为用户提供语音交互的客服服务,快速响应问题,提升用户体验。
    • 教育学习:朗读教材、提供语音反馈,帮助学生学习,增强学习兴趣。
    • 智能助手:在智能家居、移动设备等场景中,提供语音交互服务,如日程提醒、信息查询等。
    • 内容创作:将文本转换为语音,生成有声读物、播客、语音新闻等。
    • 无障碍辅助:为视障或阅读困难者提供语音辅助,帮助用户更好地获取信息。
  • gpt-4o-transcribe – OpenAI 推出的语音转文本模型

    gpt-4o-transcribe是什么

    gpt-4o-transcribe是 OpenAI 推出的高性能语音转文本模型。基于最新的语音模型架构,用海量多样化音频数据训练,精准捕捉语音细微差别,显著降低单词错误率(WER),优于前代 Whisper 模型。模型支持多种语言和方言,适合处理口音多样、环境嘈杂、语速变化等复杂场景,如呼叫中心、会议记录等。gpt-4o-transcribe的定价为每分钟 0.006 美元。

    gpt-4o-transcribe

    gpt-4o-transcribe的主要功能

    • 低错误率:经过海量音频数据训练,精准识别语音中的细微差别,显著降低单词错误率(WER)。
    • 多语言支持:涵盖多种语言和方言,适用于不同语言环境的转录任务,满足全球化应用场景的需求。
    • 实时交互:支持语音流式处理,实时接收音频输入,返回文本响应。

    gpt-4o-transcribe的技术原理

    • 基于 Transformer 的架构:底层架构基于 Transformer,基于自注意力机制高效地处理序列数据,捕捉语音信号中的长距离依赖关系和上下文信息。让模型更好地理解语音中的语义和语法结构。
    • 大规模数据训练:用海量的多样化音频数据进行训练,数据涵盖多种语言、方言、口音及不同的录音环境。基于在大规模数据上进行训练,模型能学习到语音信号的各种特征和模式,提高在不同场景下的鲁棒性和准确性。
    • 强化学习优化:在训练过程中融入强化学习(Reinforcement Learning, RL)。强化学习基于奖励机制优化模型的行为,让模型在转录过程中减少错误和“幻觉”现象(即生成与实际语音不符的内容)。

    gpt-4o-transcribe的项目地址

    gpt-4o-transcribe的应用场景

    • 会议记录:实时转录会议内容,生成详细文本记录。
    • 客服支持:快速准确转录客户语音,提升服务效率。
    • 智能设备:集成语音助手,实现语音指令识别与响应。
    • 教育领域:转录授课和发言内容,便于复习和分享。
    • 新闻采访:高效整理采访录音,快速生成文本稿件。
  • Kimi招聘助手 – 月之暗面推出的飞书字段捷径AI工具

    Kimi招聘助手是什么

    Kimi 招聘助手是月之暗面推出的飞书字段捷径AI工具,为 HR 提供高效招聘支持。通过强大的文本分析能力,实现“简历信息提取-候选人匹配评测-面试建议生成”的一站式服务。用户只需输入候选人简历和职位需求,系统可快速提取关键信息并排序,同时生成针对性面试建议。

    Kimi 招聘助手

    Kimi招聘助手的主要功能

    • 简历信息提取:能精准解析候选人简历,快速提取关键信息(如教育背景、工作经验、技能等),按照优先级排序,帮助 HR 快速了解候选人核心资质。
    • 候选人匹配评测:基于候选人简历和职位需求(JD),自动评估候选人与岗位的匹配度,为 HR 提供客观的匹配结果,辅助筛选合适候选人。
    • 面试建议生成:根据候选人的简历和岗位特点,生成针对性的面试问题和建议,帮助 HR 更高效地准备面试,提升面试质量。

    如何使用Kimi招聘助手

    • 登录飞书平台:登录飞书 PC 客户端或网页端。
    • 创建多维表格:在飞书中选择“云文档”,然后创建一个多维表格。
    • 添加 Kimi 招聘助手:在多维表格中,找到单元格表头的“字段捷径中心”。在字段捷径中心搜索 “Kimi 招聘助手” 并添加。
    • 输入参数
      • 必需参数:输入一份候选人简历和一份职位描述(JD),二者通过引用方式传入。
      • 选填参数:可自定义提示词以优化匹配效果和面试建议的生成。
    • 查看输出结果:Kimi 招聘助手会自动生成多列输出参数,包括简历信息提取结果、匹配度评估和面试建议等。用户可根据需要勾选或取消勾选某些列。

    Kimi招聘助手的应用场景

    • 简历筛选:在招聘过程中,HR 面对海量简历,需要快速筛选出符合岗位要求的候选人。
    • 候选人匹配评估:HR 需要评估候选人与岗位的匹配度,手动对比简历和职位要求耗时且容易遗漏。
    • 面试准备:HR 和面试官需要为候选人准备有针对性的面试问题,手动准备耗时且可能不够全面。
    • 招聘流程管理:HR 需要管理整个招聘流程,包括候选人信息录入、筛选、面试安排等,手动操作容易出错效率低。
  • HuggingSnap – Hugging Face 推出的 AI 助手,能离线识别视觉内容

    HuggingSnap是什么

    HuggingSnap 是 Hugging Face 推出的 AI 助手应用,基于轻量级多模态模型 SmolVLM2,参数规模从 2.56 亿到 22 亿不等,能离线处理图像、视频和文本输入,生成文本输出。 用户可以通过手机摄像头拍照或录像,HuggingSnap 可以即时识别物体、解释场景、读取文字,为视障人士提供导航辅助。应用支持多语言文字识别与翻译,适合旅行中翻译路牌。所有计算均在本地完成,无需上传云端,确保了用户的隐私安全。

    HuggingSnap

    HuggingSnap的主要功能

    • 即时视觉描述:用户可以通过手机摄像头拍照或录像,HuggingSnap 能即时生成关于图像或视频内容的描述。
    • 多语言文字识别与翻译:支持识别多种语言的文字,提供翻译功能,适合旅行中翻译路牌。
    • 多模态任务处理:基于轻量级多模态模型 SmolVLM2,HuggingSnap 能处理图像、视频和文本输入,生成文本输出。
    • 隐私保护:所有计算均在本地设备完成,无需上传云端,确保用户数据的隐私和安全。

    HuggingSnap的官网地址

    HuggingSnap的应用场景

    • 日常生活:用户可以使用 HuggingSnap 来识别和描述街景,获取关于周围建筑、商店或地标的信息。
    • 旅行:HuggingSnap 可以即时翻译路牌和标识,帮助旅行者更好地导航和理解当地环境。能识别和描述历史遗迹和文化地标,为旅行者提供丰富的文化背景信息。
    • 辅助视障人士:HuggingSnap 可以通过分析周围环境的图像和视频,为用户提供详细的描述,帮助他们更好地理解和导航周围的世界。
    • 医疗领域:可以用于辅助诊断,通过分析医学图像来提供潜在的诊断信息。
    • 零售行业:可以用于增强购物体验,通过识别商品并提供详细的产品信息来帮助消费者做出购买决策。
  • Uthana – AI 3D角色动画生成平台,文字描述角色动作生成逼真动画

    Uthana是什么

    Uthana 是专注于3D角色动画生成的AI平台。平台基于简单的文字描述、参考视频或动作库搜索,快速为用户生成逼真的动画,支持适配任何骨骼结构的模型。Uthana 提供风格迁移、API集成和定制模型训练等功能,满足不同用户需求。平台提供免费试用,每月赠送20秒动画生成额度。Uthana 主要面向3D动画师、游戏开发者和工作室,助力高效创作,节省时间和精力。

    Uthana

    Uthana的主要功能

    • 生成动画:用户简单输入文字描述角色的动作,生成逼真的动画。
    • 上传参考视频:用户上传参考视频,快速将视频中的动作应用到自己的角色上。
    • 搜索动作库:平台拥有包含 10,000 种动作 的库,用户从中搜索到所需的动作。
    • 支持任意骨骼结构:Uthana 的专有逆向动力学(IK)重定向技术可以支持任何骨骼结构。
    • 输出格式灵活:支持多种输出格式,方便用户将其应用于不同的工作流程。
    • 播放速度调整:用户调整动画的播放速度,找到最适合的节奏。
    • 骨骼旋转调整:基于简单的滑块工具,用户调整模型骨骼的位置。
    • 剪辑、保存和下载:用户能剪辑动画片段、保存和下载,无需手动编辑关键帧。
    • 风格迁移:将通用动作风格化,适应游戏或项目的特定风格。
    • API 集成:用户在开发环境或游戏中直接调用 Uthana 的 AI 功能。

    Uthana的官网地址

    Uthana的产品定价

    • Dreamer(免费+早期访问):用户享受免费加早期访问的待遇,包括对任何角色或装备的无限预览(PreVis)、无限动作生成、调整、混合、修剪和剪辑工具,用户创建的动画将受到创意共享许可的保护,每月20秒动画生成额度。
    • Pro(月费):价格联系客服,用户访问超过10,000个动作的库,包括手指数据,支持每月下载多达100个角色秒数的内容,用户能商用创建的所有动画,享受优先电子邮件支持。
    • Studio(定制计划):价格定制,包含所有Pro计划的功能外,提供团队账户、专用支持Slack频道、API访问便于直接集成Uthana的AI功能,提供数据隔离服务,支持用户用机器学习工具训练自定义模型或组织和标记数据,享受优先推理和处理服务。

    Uthana的应用场景

    • 游戏开发:游戏开发者快速生成角色动作,如行走、奔跑、战斗等,节省传统动画制作的时间和成本。
    • 影视动画制作:动画师快速生成动画片段,作为初步的动画设计参考,或直接应用于短片制作。
    • 虚拟角色与数字人:为虚拟角色或数字人快速生成逼真的动作,如手势、表情或全身动作,在虚拟直播、虚拟客服等场景中更具表现力。
    • 教育与培训:在教育领域,以快速生成教学动画,如人体运动学、动物行为学等,帮助学生更直观地理解复杂的动作原理。
    • 广告与营销:制作3D广告动画时,快速生成产品演示动画或角色互动动画,提升广告的吸引力和制作效率。
  • OpenJobs AI – AI求职平台,精准推荐匹配的职位

    OpenJobs AI是什么

    OpenJobs AI是AI求职平台,基于AI技术为用户提供高效便捷的求职服务。用户用自然语言输入职位需求,如岗位类型、地点、薪资要求等,平台精准推荐匹配的职位。OpenJobs AI支持简历生成与优化,帮助用户打造更符合岗位需求的简历。OpenJobs AI将进一步拓展服务范围,助力用户更好地规划求职路径。

    OpenJobs AI

    OpenJobs AI的主要功能

    • 职位搜索:用户输入职位要求AI自动搜索相关工作。
    • 学习指导:平台支持回答一些常见问题,例如“如何从零开始学习 Python?”
    • 文档生成:支持用户直接请求生成或优化简历。

    OpenJobs AI的官网地址

    OpenJobs AI的应用场景

    • 求职者:正在寻找工作的人员,进行职位搜索、简历优化、职业咨询。
    • 技术新手和学习者:希望学习新技能(如 Python 编程)的初学者,用于学习指导、技能提升建议。
    • 职场人士:已经在职但希望提升职业素养、优化职业发展路径的人员,用在职业咨询。
    • 应届毕业生:即将步入职场,需要职业规划和求职指导的学生,用在职位搜索、简历优化、职业规划建议。
  • Zencoder – AI编程助手,提供代码补全和生成建议

    Zencoder是什么

    Zencoder 是 AI编程助手,基于核心的 Repo Grokking™ 技术深度分析代码库,提供精准的上下文感知代码建议,支持 70 多种编程语言,与主流 IDE(如 VS Code 和 JetBrains)无缝集成。Zencoder 配备智能 AI Agents,支持实时修复代码、自动化生成文档和单元测试,提升开发效率和代码质量。

    Zencoder

    Zencoder的主要功能

    • 集成:与超过 20 个开发人员环境集成,简化和自动化整个开发生命周期。
    • 代码生成与补全:提供精准的代码补全和生成建议,支持自然语言描述生成代码。
    • 代码修复与优化:实时修复代码错误,优化代码结构。
    • 文档与测试生成:自动生成代码注释和文档,智能生成单元测试代码。
    • 智能交互:提供AI聊天助手,实时解答编程问题,提供高效解决方案。
    • 开发流程集成:支持70多种编程语言,无缝集成主流IDE,支持多环境开发。
    • 项目管理:深度分析代码库,自动化处理重复性任务,提升开发效率。

    Zencoder的官网地址

    Zencoder的产品定价

    • 免费计划:最多10个用户,无限的代码补全,无限的聊天信息,有限的高级AI请求,有限的AI代理,20多种集成和MCP支持,团队管理。
    • 商业计划:每月每用户19元,最多200个用户,10倍更多的高级AI请求,增强的AI代理,高级代码库分析,高级代码修复,提前访问新功能,无AI训练。
    • 企业计划:每月每用户39元,无限用户,无限的高级AI请求,无限的AI代理,优先支持,单点登录(SSO),审计日志,可选的自定义微调。

    Zencoder的应用场景

    • 独立开发者:独立工作的程序员简化编码任务,更快地完成项目。
    • 小型开发团队:刚开始创业的团队或小型工作室,协作和推进项目,无需投入大量资金。
    • 中大型企业:中大型企业提高开发效率,确保代码质量,支持大规模的团队协作。
    • 教育和研究机构:教师和学生作为学习工具,帮助理解编程概念,或在研究项目中实现自动化编码。
    • 自由职业者:自由职业开发者快速响应客户需求,提供专业的代码编写和维护服务,同时保持竞争力。
  • Dify-Plus – 基于 Dify 二次开发的企业级增强版项目

    Dify-Plus是什么

    Dify-Plus 是基于 Dify 二次开发的企业级增强版项目,集成基于 gin-vue-admin 的管理中心。Dify-Plus在 Dify 基础上新增用户额度、密钥额度、Web 公开页登录鉴权、应用中心等功能,优化了权限管理,适合企业场景使用。Dify-Plus项目开源,解决行业痛点,适合需要在企业场景中对资源进行精细化管理的用户使用。

    Dify-Plus

    Dify-Plus的主要功能

    • 用户额度管理
      • 对话余额限制:限制用户对话的使用次数。
      • 异步计算用户额度:后台异步处理用户额度的计算逻辑。
      • 额度显示:在界面左上角显示用户的使用额度。
      • 个人监测页:用户能查看自己的额度使用情况。
    • 密钥管理
      • 密钥额度设置:限制应用 API 调用的余额。
      • 密钥使用分析:提供密钥使用情况的分析和报表。
      • 每月密钥额度花费:统计密钥的每月使用费用。
    • 安全管理
      • Web 公开页登录鉴权:确保只有授权用户可以访问。
      • 鉴权 Cookie:支持安全的 Cookie 鉴权机制。
    • 应用管理
      • 应用中心页面:集中管理所有应用。
      • 应用使用次数记录:记录每个应用的使用次数,按使用次数排序。
      • 同步应用到模板中心:管理员能将应用同步到模板中心。
    • 管理中心
      • 用户同步:同步用户信息到管理中心。
      • 模型同步工作区:同步模型到工作区。
      • 用户额度修改:管理员修改用户的额度。
    • 费用报表:生成费用报表,方便财务管理和分析。
    • 权限管理
      • 权限调整:普通成员无法关闭模型,非管理员无法查看密钥。
      • 优化 CSV 编码监测:修复批量请求问题,支持 Windows 下载后保存再上传。
      • Markdown 图片放大优化:提升用户体验。

    Dify-Plus的技术原理

    • 基于 gin-vue-admin 的管理中心
      • 前端:基于 Vue.js 构建现代化的用户界面,提供良好的用户体验。
      • 后端: Go 语言的 Gin 框架构建高效的后端服务。
      • JWT 认证:基于 JSON Web Tokens (JWT) 实现用户认证和授权,确保系统的安全性。
    • 与 Dify 的集成:基于 RESTful API 与 Dify 进行交互,实现功能扩展。同步用户、模型和应用数据,确保管理中心与 Dify 的数据一致性。
    • 异步处理:用异步任务处理用户额度计算等耗时操作,提升系统性能。

    Dify-Plus的项目地址

    Dify-Plus的应用场景

    • 企业资源管理:基于用户额度和密钥额度管理,合理分配资源,避免滥用。
    • 应用开发与管理:集中管理应用,支持应用同步到模板中心,便于复用。
    • 安全管理:提供 Web 登录鉴权和安全的 Cookie 鉴权机制,确保访问安全。
    • 数据分析与报表:生成费用报表和密钥使用分析,助力企业优化成本和运营。
    • 团队协作与权限管理:根据角色分配权限,同步用户信息,方便团队协作。