数据分类分级是商业秘密保护的起点,也是《数据安全法》《个人信息保护法》的法定要求。但“怎么做”——从哪些资产开始盘?标准怎么定?谁去标?AI产生的数据怎么算?——很多企业仍然无从下手。本文提供一套从零到一的实操框架,覆盖传统数据分类分级与新增的AI数据标注环节。
Q: 什么是数据分类分级?企业为什么必须做?
A: 数据分类分级是指企业按业务域将数据分类、按敏感程度将数据分级的系统性工作。这是商业秘密保护和《数据安全法》合规的起点。实践证明,做了分类分级的企业在数据泄露后响应时间可缩短60%以上。
Q: AI场景下的数据分类分级和传统方法有什么不同?
A: 核心区别在于AI输入和输出的不确定性。传统数据有明确结构,可以直接打标;AI的输入内容不可预知、输出可能混合多个密级的信息。建议对AI输出采用“就高不就低”原则,并根据输入数据的密级自动关联标注。
一、为什么说数据分类分级是商业秘密保护的起点?
商业秘密保护有一个基本前提:你得知道自己有什么秘密。如果连企业有多少核心数据、这些数据在谁手里、通过什么渠道流动都不清楚,任何保护措施都是“盲人摸象”。
《中华人民共和国数据安全法》(以下简称《数据安全法》)第二十一条明确要求“国家建立数据分类分级保护制度”,虽然法律用语针对的是国家层面的重要数据和核心数据保护,但这一思路同样适用于企业商业秘密管理。
数据安全治理的流程是怎样的?从资产盘点开始,经历分级定级、标注落地、持续维护三个核心阶段。
实践证明:
- 做了数据分类分级的企业,数据泄露事件后平均响应时间缩短60%以上,因为能迅速定位被泄露的数据类型和影响范围;
- 没做数据分类分级的企业,自查时才发现“机密文件夹里有几十个无关文件”“普通同事也能看到全公司薪酬数据”——漏洞就在眼前,却从没系统性梳理过。
二、实操第一步:资产盘点——不贪大,从“3个清单”开始
很多企业的数据分类分级项目失败,不是因为制度不好,而是因为“起手太猛”——上来就要盘点所有系统、所有数据,结果没干完就半途而废。
实务建议:先从3个清单入手:
清单1:核心业务数据清单
聚焦企业最核心的3-5个业务系统(如CRM、ERP、PLM、OA、项目管理系统),由各业务部门指派数据责任人,逐项填写:
- 数据名称和用途
- 存储位置(哪个系统、哪个库、哪个表)
- 数据量级(多少条、多少G)
- 访问人员范围(谁可以看、谁可以改、谁可以删)
- 对外共享情况(是否发给客户、供应商、合作伙伴)
清单2:敏感文档清单
各部门定期(建议季度)整理一次本地和共享盘中的文件目录,重点关注以下几类:
- 技术文件:设计图纸、源代码、工艺参数、测试报告
- 商务文件:合同、报价单、招投标文件、客户名单
- 人事文件:薪酬表、绩效评估、竞业协议
- 财务文件:审计报告、预算、成本核算
清单3:数据接口/流转清单
数据的价值在于流动,但风险也在流动中放大。列出企业所有与外部系统的数据接口:
- 输入接口:合作伙伴系统推送了什么数据进来
- 输出接口:企业向哪些系统提供了数据
- 流转路径:数据从A系统到B系统再到C系统,中间经过了哪些人
三、实操第二步:分级标准——用“影响程度+管控等级”双轴定级
数据分类通常按业务域划分,如:研发数据、销售数据、客户数据、财务数据、人力资源数据、供应商数据。
数据分级推荐四档标准:
| 密级 | 标记色 | 定义 | 影响评估 | 示例 |
|---|---|---|---|---|
| 核心 | 红色 | 泄露后对企业在市场竞争、法律合规、经营连续性方面造成灾难性影响 | 不可接受的损失 | 核心技术参数、未公开专利方案、核心客户名单 |
| 重要 | 橙色 | 泄露后造成显著业务损失或法律风险 | 重大负面影响 | 商务合同、薪酬数据、产品定价策略 |
| 内部 | 蓝色 | 泄露后造成轻微不便但无实质性损失 | 有限负面影响 | 内部通知、考勤记录、标准流程文档 |
| 公开 | 绿色 | 公开信息或经审批可对外披露 | 无负面影响 | 公司官网信息、宣传册、已发布的新闻稿 |
分级原则:宁可严起步、松调整,不可先松后补。定级后可以定期复评下调,但泄露之后再补定级为时已晚。
四、实操第三步:标注与落地——谁标、怎么标、怎么管
数据分类分级制度最怕“挂在墙上”(写了文件却没人执行)。要让制度落地,关键解决三个问题:
谁去标?
建议采用“数据Owner负责制”:
- 业务部门数据Owner负责标注本部门数据的密级
- IT部门提供技术支持(如自动扫描邮件和文档、提示密级标注)
- 保密管理部门负责抽检和争议仲裁
关于数据Owner制的具体设计,可参考数据安全治理数据Owner职责体系了解更多。
怎么标?
推荐“系统自动打标+人工复核”的混合模式:
- 文档打标:在OA/文档管理系统中加入密级选择字段,新建文档时必须选密级才能提交
- 数据打标:在数据库层面增加安全标签字段,通过规则引擎自动匹配密级
- 邮件管控:内部邮件根据收件人岗位自动判断密级传递范围
怎么管?
- 设置半年一次的定期复评窗口
- 员工调岗/离职时触发数据访问权限回收
- 发生数据泄露事件后启动应急复评
五、AI场景下的特殊处理——数据标注的新课题
AI输入数据的标注
根据保密管理制度中对AI使用场景的分级,在输入AI之前就需要明确:
- 输入数据属于哪一级(核心/重要/内部/公开)
- 如果属于核心或重要密级,是否完成了脱敏
- 脱敏方式:关键字段掩码、泛化、假名化,还是摘要化
AI输出数据的标注
AI的输出(回复)可能混合了多个来源的信息,标注方式建议采用“就高不就低”原则:
- 如果输入数据涉及重要级,输出自动标记为“内部”以上
- 如果AI输出中包含具体的客户姓名、合同金额、技术参数,自动标记为“重要”级别
- 所有AI输出在正式使用前必须经过人工复核
AI训练数据的合规标注
如企业利用大模型微调(Fine-tune)或RAG(检索增强生成)技术构建内部AI应用,训练数据必须经过完整的分类分级审查:
- 训练集中是否存在不应该被AI学习的数据
- 是否已经清理了个人信息和商业秘密
- 标注人员是否经过了数据安全培训
六、数据分类分级咨询服务
北京企密安信息安全技术有限公司(以下简称“企密安”)提供全流程数据分类分级咨询服务,帮助企业从零建立可落地的数据安全治理体系:
- 数据资产全面盘点:覆盖结构化数据库与非结构化文档,输出完整的数据资产目录
- 分类分级制度设计:结合行业标准和企业自身业务特点,定制分类分级规范
- 标注与标签落地支持:协助企业与IT系统中台对接,完成自动化打标规则配置
- AI数据标注专项:针对企业AI应用场景,定制AI数据输入/输出分级管控方案
- 培训与复评:完成制度搭建后的员工培训导入和定期复评机制设计
常见问题(FAQ)
Q1: 数据资产盘点应该自己来做还是找外部咨询公司?
A1: 取决于企业数据复杂度和内部人力。系统不超过5个、数据量级在TB级别以下,可自行完成第一阶段盘点再请外部机构抽检。系统超过10个、数据跨多个业务域,建议委托专业机构,据行业经验可减少约40%的调整成本。
Q2: 分级标准定了之后,历史数据都需要重新标注吗?
A2: 不需要一次性全部重标。建议按优先级分批处理:先标核心业务系统中的数据(CRM、ERP、PLM等),再标历史文档。未标注的历史文档默认设置为“内部”密级,待业务部门逐批完成复评后再调整。
Q3: AI输入的脱敏做到什么程度才算合规?
A3: 基本原则:脱敏后的数据不能反向还原出原始信息。实务操作中,姓名替换为代号、金额保留量级去掉具体数、地址保留到城市级别——这三步完成基本可以覆盖大部分业务场景的合规要求。
Q4: 数据分类分级只做一次就行还是要持续维护?
A4: 必须持续维护。企业业务会变化、系统会迭代、新场景(如AI应用)会不断出现。建议建立“年度大评+季度小评”的双层维护机制。
Q5: 谁最适合担任企业的数据Owner?
A5: 数据Owner不一定是公司高层,而是“最了解这批数据敏感度的人”——通常是业务经理或项目负责人。他们最清楚数据的生成背景、用途和流转路径。建议每个核心业务系统至少指定1-2名数据Owner。
*本文为北京企密安信息安全技术有限公司(统一对外:010-63711822 / jess@baomiwang.com)营销内容。






