西安电子科大沈玉龙团队发布”玄知”密码大模型 开启密码学AI新时代

2025年8月15日,在陕西周至召开的第四届西部网络安全大会上,西安电子科技大学计算机科学与技术学院沈玉龙教授团队正式发布了全球首个专注于密码学领域的智能大模型——”玄知大模型”(CryptoLLM)。这一突破性成果标志着密码学研究正式迈入智能化新阶段,为密码算法分析、协议设计与工程实现提供了全流程的智能支持,开创了密码学与人工智能融合应用的新纪元。

突破性技术架构

“玄知大模型”由西电NSS实验室沈玉龙教授团队精心研发,基于国产开源大模型构建,并融合了超百亿级密码学专业数据与创新的分阶段精调策略。该模型在三大核心能力上实现了显著突破:首先,在密码算法智能分析方面,能够自动识别算法缺陷,辅助进行安全性验证与漏洞定位;其次,在密码协议智能设计领域,支持协议设计与安全推理,大幅提升协议生成效率与质量;最后,在密码工程高效实现方面,实现了密码库集成、自动代码生成及部署优化等关键功能。

西安电子科技大学作为我国密码学研究的发源地,拥有军外唯一国家级密码学重点学科,被誉为”密码学黄埔军校”,为国家培养了大批顶尖人才。沈玉龙教授团队传承先辈使命,以”玄知”大模型为支点,肩负起智能时代密码学创新的历史责任,推动密码技术从传统的”护卫国家安全”向”赋能数字文明”跨越发展。

创新研发历程

为打造”玄知”大模型的核心竞争力,团队组建了超百人专项数据工程组,经过6个月的攻坚克难,建成了规模达50Btokens的垂直领域知识池。该知识池全面覆盖了密码学权威著作、顶级会议论文、开源协议库、算法代码库及技术博客等多元高价值数据源。

团队自主研发的全栈式数据处理平台实现了多模态数据的深度结构化解析:通过论文智能解析系统,能够精准提取公式、图表及算法描述语义,突破了非结构化数据处理的技术瓶颈;代码知识蒸馏引擎可自动构建调用链拓扑,完成安全关键点的形式化验证;跨模态语义对齐技术则实现了文本、代码、数学符号的联合表征建模。

基于这些技术创新,团队构建了千万级精标指令数据集,并通过双轮人工校验机制,确保指令集兼具场景覆盖广度与专业认知深度,为模型训练提供了高价值知识基座。

先进训练策略

在模型训练方面,团队基于国产开源千问2.5通用模型,创新性地采用了分阶段微调策略。这一策略通过四个递进阶段——沉淀行业知识、淬炼行业技能、对话交互增强、强化人类偏好,全面提升了模型在密码学领域的通用能力基础,并在特定密码任务上达到了专家级水平。最终模型不仅能够精准解析密码学专业语言,更能进行类人推理、设计与优化,为密码学领域提供了强大的智能解决方案。

行业标准与测评基准

西安电子科技大学同步发布了全球首个密码学专业测评基准CryptoBench,填补了该领域的空白。该基准覆盖密码算法、协议、工程三大板块、12个核心方向、74个细分领域,包含10,000+道精编题目,能够实现对模型能力边界的精准探测,并建立了版本迭代流程,持续适配密码技术的演进需求。

在权威测评基准CryptoBench的全面评估中,”玄知”大模型(CryptoLLM)展现出全球领先的密码学专业能力:其综合性能超越当前最优模型GPT-4o达8.8%,并在密码算法分析(+8.6%)、协议设计(+6.8%)、工程实现(+5.1%)三大核心维度全面领先GPT-4o、Claude4.0、Gemini2.5等国际顶尖产品。值得注意的是,在对称加密、安全模型证明等12个细分方向中的11项显著优于国际竞品。这一卓越成果基于仅32B参数的国产基座模型实现,充分验证了专领域深度定制能够在小领域中实现质的飞跃。

实际应用价值

“玄知”大模型聚焦密码工程实际应用,面向产业界提供开放API与SDK工具包,显著降低了密码技术应用门槛。目前,该模型已成功支持在安全多方计算、隐私计算等核心领域的广泛应用,为推动密码技术在各行各业的落地应用提供了强有力的技术支撑。

沈玉龙教授团队的这一突破性成果,不仅展示了中国在密码学与人工智能交叉领域的创新能力,更为全球密码学研究开辟了新的发展方向,对提升我国在网络安全领域的核心竞争力具有重要意义。

为您推荐