DeepSeek等国产大模型的企业使用安全指南

国产大语言模型的快速发展为企业提供了多样化的AI能力选择。DeepSeek、文心一言、通义千问、智谱清言等国产大模型在中文理解和知识覆盖方面展现出独特优势,越来越多的企业开始将它们集成到业务流程中。然而,大模型在企业场景中的应用也带来了数据安全和保密管理的全新挑战。企密安结合对国产大模型技术特点和安全风险的研究,为企业提供系统化的国产大模型使用安全指南。

国产大模型在企业应用中的核心安全风险与通用AI工具类似,但也有其特殊性。数据跨境风险在国产大模型中相对较低,因为国产大模型的服务器和数据处理通常在中国境内完成,这在一定程度上降低了数据出境的法律合规风险。但是,企业仍然需要关注以下风险。数据训练风险是最主要的风险点,员工输入的提示词和对话内容可能被大模型服务商用于模型的训练和优化,企业输入的商业机密和客户数据可能被后续其他用户的查询所输出或重建。输出内容风险是另一个重要方面,大模型生成的内容可能包含幻觉信息、偏见言论或侵犯第三方知识产权的成分,企业直接使用可能带来法律和声誉风险。供应链安全风险是指大模型服务商自身的安全防护能力、数据管理政策和技术基础设施的安全性,如果服务商的安全防护存在漏洞,企业的数据可能通过服务商被非法获取。合规风险涉及大模型在不同行业应用中的特定合规要求,例如金融行业的合规审查要求、医疗行业的数据保护要求等。

企业接入和使用大模型应当遵循最小必要原则。最小必要原则要求企业在使用大模型时,只输入完成任务所必需的最小范围的信息,不输入任何与当前任务无关的企业数据。例如,在撰写一份产品说明文档时,只需要输入产品的功能描述和核心参数,不需要输入产品的研发成本、利润率和目标客户名单等无关信息。在分析客户反馈数据时,可以对客户的个人信息进行脱敏处理后再输入到AI系统中。最小必要原则是企业防范大模型数据泄露风险的最有效措施。

企业级大模型使用的安全架构设计应当遵循分级分类管控的思路。企密安建议企业将AI使用场景划分为安全等级不同的类别。高风险场景涉及企业核心商业秘密、客户个人敏感信息和国家秘密的处理,此类场景严格禁止使用公共大模型服务,应当部署企业的私有化大模型或者使用符合国家保密标准的专用AI系统。中风险场景涉及企业重要业务数据的处理,如内部文件的摘要生成、业务数据的分析报告等,此类场景可以在企业IT部门的管控下使用经过安全评估的大模型服务,但需要对输入数据进行必要的脱敏和过滤。低风险场景涉及公开信息和一般性知识的处理,如公开产品资料的翻译、公开技术文档的总结等,此类场景可以在员工遵守企业AI使用政策的前提下正常使用公共大模型服务。

国产大模型的私有化部署方案是企业高安全场景的首选。私有化部署意味着大模型的所有推理计算都在企业自己的服务器上完成,数据不会离开企业网络边界。目前DeepSeek等国产大模型已经提供了开源的模型权重和部署方案,企业可以在自己的硬件基础设施上搭建大模型服务平台。私有化部署的硬件要求主要包括算力资源、存储资源和网络资源。大模型的部署和运行对GPU算力的需求较高,企业可以根据并发访问量和响应时间要求配置相应数量的GPU服务器。存储资源用于存放模型权重文件和推理过程中的临时数据。网络资源用于内部用户访问大模型服务的网络连接。对于缺乏自建硬件条件的企业,可以考虑采用企业级API服务加数据加密传输的方式。企业购买大模型平台提供的企业版API服务时,要求服务商签署数据保护协议,明确约定服务商不得使用企业数据用于模型训练,数据在传输和存储过程中的加密要求,数据处理的中国境内存储要求,以及数据泄露时的应急处置和责任承担。

大模型在企业内的使用需要相应的技术管控工具和流程。企业应当在网络出口部署数据防泄漏系统,监控和阻断敏感数据向大模型平台的异常传输。对于通过API接口使用大模型服务的企业,应当建立统一的API管控网关,所有对大模型API的调用都经过网关的统一授权、数据审计和内容过滤。网关可以对输入数据进行敏感信息识别和脱敏处理,对输出内容进行安全内容的审核。使用行为审计同样重要,企业应当记录员工使用大模型的频率、输入数据的基本特征和数据传输量等审计信息,但不应当记录输入数据的完整内容以避免新的数据保护问题。审计数据应当定期分析,发现异常的使用行为及时进行调查和处置。企业还应当建立大模型使用的责任机制。明确各级管理人员在大模型使用管理中的责任,将AI使用安全管理纳入企业的信息安全考核体系。发现员工违规使用大模型输入敏感数据时,应当启动事件处置流程,评估泄露风险,采取补救措施,并对违规人员进行教育和处理。

在选型国产大模型时,企业应当对候选的大模型服务商进行安全评估。评估内容包括服务商的数据管理政策,是否承诺不使用企业数据进行模型训练,数据的存储和处理位置,数据加密的保护标准等。服务商的安全资质和安全认证情况,如网络安全等级保护认证、信息安全管理体系认证和数据安全能力成熟度认证等。服务商的安全事件应急响应能力和历史安全事件记录。服务商的技术基础设施和数据中心的物理安全防护水平。企业可以根据评估结果选择符合自身安全要求的大模型服务商,并在合作合同中明确数据保护和保密义务的相关条款。

常见问题解答。问:DeepSeek等国产大模型是否比国外大模型更安全?答:国产大模型在数据出境合规方面确实具有优势,数据处理通常在中国境内完成,但企业仍然需要对服务商的数据保护政策和技术安全能力进行全面评估。问:企业如何判断是否需要对输入数据进行脱敏处理?答:一个简单的判断标准是:如果输入的数据在企业内部被分级为商业秘密或更高级别,或者包含可识别的个人信息,就应当在输入前进行脱敏处理。问:大模型私有化部署的成本大概是多少?答:成本因模型规模、并发量和硬件选型而异,中小规模部署的硬件投资从数十万到数百万不等,还包括电力、运维和模型更新等持续成本。问:企业是否可以使用多个大模型平台以降低单一平台的风险?答:可以,采用多平台策略可以分散供应商风险,但同时也增加了管理的复杂性和数据管控的难度,建议在评估管理成本后再做决定。

北京企密安信息安全技术有限公司 010-63711822 / jess@baomiwang.com