破解大模型安全难题,360推出大模型安全能力框架

360大模型安全解决方案树立行业新标杆。数字化浪潮中,大模型作为新质生产力的代表成为新一轮工业革命的核心引擎。然而,随之而来的安全挑战也日益凸显,急需有效的大模型安全防护实践总结、体系化的安全框架、解决方案以及能力支撑。在3月20日举办的360安全大模型3.0发布会上,360数字安全集团重磅发布大语言模型安全防护方案,展示了360在该领域的最佳实践、理论创新、系统化框架方案和核心能力成果。推荐智东西年度会议。4月18-19日,2024中国生成式AI大会将在北京举行。免费报名或购票通道开放中,期待你的参会~
01.解决大模型安全问题亟需全新战法


在数字中国建设和全球数字化转型的浪潮下,大模型技术由于其令人耳目一新的强大智能化能力,正在被快速应用于千行百业,成为新质生产力的代表。然而,大模型的全新特性也带来的前所未有的安全挑战,既存在传统上的网络与数据安全,又新出现了内容可信、模型失控和和合规向善等多方面的安全挑战。“这些安全挑战,只有传统的网络安全与部分数据安全问题可以用传统的安全方法解决,其它以语料和内容为核心的安全问题都源于大模型自身特性。因此,不做大模型的传统安全企业,无法深刻洞察大模型自身安全特性所带来的内容安全问题,也就无法构建大模型原生安全能力。”360数字安全集团副总裁李博表示。解决大模型问题首先需要顶层逻辑与方法论。360率先提出了大模型的安全四原则:可靠、可信、向善、可控,旨在从顶层设计上全面保障大模型的安全。为了实现这些原则,360又进一步提出了一套核心战法,包括建立“网络与数据安全与大模型自身安全”的双轮驱动体系,坚持以内容安全为核心,在大模型内部内置原生安全机制,采用“小模型”的技术思路保障大模型安全的技术路线,同时构建大模型安全实战对抗评估体系对打模型安全实战能力进行评估,并进一步构建以服务运营为核心的大模型安全持续治理体系等。
02.360提出大模型安全解决方案,构筑大模型安全底座


大模型安全战法的落地需要足够的硬核安全能力支撑。360基于大模型领域的实践,提出了大模型安全能力体系框架(AISF框架)。这个框架将大模型安全能力分为两部分,一是传统网络与数据安全能力,二是需要嵌入到大模型内部,以解决大模型内容可信、合规向善为目标的大模型原生安全能力。为了将360大模型安全的核心能力输出给千行百业,360提出了“双轮驱动”的大模型安全解决方案框架。在框架中,一方面,利用360安全云围绕“数据、探针、平台、专家、AI”这五个核心要素,在网络与数据安全层面对打模型进行全面防护;另一方面,通过“360大模型原生安全能力增强包”解决大模型在内容可信、合规向善、模型可控上存在的安全问题,并利用360独有的大模型安全评估系统,对大模型的安全能力进行实战评估。

▲“双轮驱动”的360大模型安全解决方案

这套360大模型安全解决方案可以平移、复制给有需求的行业客户与合作伙伴和,并以标准化的能力产品方式对其他大模型企业进行安全赋能,确保360的大模型安全成果与积累发挥最大价值。
03.360引领大模型安全实践,助力企业“数转智改”


只有躬身入局才能攻克大模型安全难题。凭借安全和大模型双重能力,360的大模型创新能力不仅得到了政府机构的认可与赞誉,更在多个行业中实现了落地应用,展示了其实际应用价值。在与某金融机构合作中,360利用私有大模型为其部署了多套AI生产力工具,从企业入职培训、合规文档编写、电销意向判断,到催收分案、系统告警提示等,同时在大模型内部集成了360大模型安全解决方案,在帮助该企业降本增效的同时,确保了大模型的安全。此外,360大模型安全解决方案还在政务、税务、医疗等多个重点行业完成了落地,为这些行业的数字化转型提供了坚实的安全保障。随着数字化时代的快速推进,大模型技术的安全问题将变得愈发重要。360大模型安全解决方案的成功实践,不仅为行业树立了大模型安全建设的典范,更为整个行业的安全发展指明了方向。未来,360将继续引领大模型安全领域的发展,为构建更加安全、可靠的数字化世界贡献力量。

2024年中国生成式AI大会预告



相关推荐

  • 联合国通过首个全球AI决议;曝微软6.5亿美元买下Inflection AI员工;联想首款AI PC下月发布丨AIGC大事日报
  • 微软深夜首推AI PC!新AI功能戳中打工人,月减10小时工作量
  • 突发:拜登对苹果下狠手,令市值暴跌6700亿,苹果强硬回应“不妥协”!
  • 换掉ES!Redis官方搜索引擎来了,效率大幅提升
  • 沉寂 600 多天后,React 憋了个大招
  • Vue 团队正式开源 Rolldown
  • 为什么阿里不推荐使用 keySet() 遍历HashMap?
  • 新零售SaaS架构:线上商城系统架构设计
  • 别做老实人了!这才是 HR 喜欢听的离职原因!
  • Vite为什么快呢?快在哪?说一下我自己的理解吧
  • Vue 的 style 加了 scoped 也会样式冲突?可怕!
  • 我真服了!媳妇刚发3.8万年终奖,就要拿出四十万还房贷,说她不愿给银行付利息。可我觉得不应该提前还房贷。
  • 5个9可用性如何实现?图解业务系统健康度检查
  • Bruno - 开源IDE,用于探索和测试API
  • 阿里限流神器Sentinel夺命连环 16 问?
  • 生存分析是什么?手动和使用R的示例
  • 全球最强大模型一夜易主,GPT-4时代终结!Claude 3一夜颠覆AI界!
  • 大模型如何用于游戏?游戏玩家代理与大模型综述:方法、应用与挑战
  • 如何从头开始编写LoRA代码,这有一份教程
  • 突发!Stable Diffusion核心团队被曝集体离职