JoySafety – 京东开源的大模型安全框架

JoySafety是什么

JoySafety 是京东开源的大模型安全框架,为企业提供成熟、可靠、免费的大模型安全防护方案。模型基于多种原子能力模块(如 BERT、FastText、Transformer 等)和灵活的架构设计,支持高并发、高扩展性及动态策略更新,能有效拦截高风险内容,保障 AI 应用的安全稳定运行。模型具备易用性,支持一键 Docker 启动和标准化 API 接口,方便快速集成。

JoySafety

JoySafety的主要功能

  • 内容安全检测:通过敏感内容拦截、红线代答和智能纠偏,确保输出内容符合法规和道德要求,为企业和用户提供安全可靠的 AI 交互环境。
  • 数据安全防护:检测、防止数据泄露,对用户输入和模型输出中的敏感信息进行识别和保护,确保数据处理过程符合隐私法规要求。
  • 提示词攻击防御:基于多轮对话识别技术,智能分析上下文,识别、防御恶意提示词攻击,保障 AI 对话系统的安全性和稳定性。
  • 策略编排与动态更新:支持通过 API 动态调整安全策略,实现原子能力热插拔,灵活适应不同业务场景,无需中断服务即可更新检测模块。
  • 高扩展性与负载均衡:支持集群化部署,通过水平扩展和智能负载均衡技术,提升系统并发处理能力,满足高并发业务需求。
  • 易用性与集成:通过 Docker Compose 实现一键启动,提供标准化 API 接口,支持多语言调用,方便与现有系统快速集成。

JoySafety的技术原理

  • 多模型协同检测:通过多种预训练模型(BERT/FastText/Transformer 等模型)对输入内容进行分类和检测,识别潜在风险。:结合敏感词库和红线知识库,提供精准的拦截和代答策略。
  • 异步检测机制:采用异步输出机制,将检测任务与主业务流程解耦,大幅提升响应速度,减少用户等待时间。通过多轮对话上下文,智能识别潜在的提示词攻击或恶意引导,确保对话安全。
  • 动态策略更新:原子能力热插拔支持在运行时动态更新检测模块,无需重启服务。通过轻量级编排引擎,灵活配置检测策略,适应不同业务需求。
  • 智能负载均衡:支持水平扩展,通过负载均衡技术提升系统并发处理能力。基于窗口化检测策略在性能与准确性之间找到平衡,优化系统资源利用率。

JoySafety的项目地址

  • GitHub仓库:https://github.com/jd-opensource/JoySafety

JoySafety的应用场景

  • AI 导购:为电商平台提供安全可靠的推荐内容,避免误导消费者,确保推荐信息符合法规和道德标准。
  • 物流客服:在物流客服场景中,拦截不当言论和敏感信息,提供合规的客户支持,提升服务质量。
  • 销售助手:帮助销售人员在与客户沟通时防止敏感信息泄露,保障商业机密安全,避免法律风险。
  • 医疗问诊:在医疗咨询中过滤不合规内容,确保提供的医疗建议安全可靠,符合医疗法规和伦理要求。
  • 商家工作台:保护商家在平台上的数据安全,防止隐私泄露,确保商家信息符合隐私法规。