【事件】
2023年,云安全公司Wiz披露了一项令人震惊的发现:微软AI研究团队在GitHub上公开发布了一个开源模型训练数据集,但附带的分享链接中包含着指向Azure Blob存储的SAS令牌。问题不在于"分享链接"本身,而在于这个SAS令牌的权限过于宽泛。原本应该只允许访问计划分享的开源模型数据,但实际上却通行到了整个内部存储账户,由此可访问的数据规模高达38TB,包括员工工作站备份、Teams消息、密钥和口令等大量私有数据。当Wiz发现并向微软通报后,微软在短时间内吊销了令牌并展开调查。这个案例生动说明,在AI和研究协作场景中,很多人仍把"分享下载地址"当成普通链接,而忽视链接本身可能已经包含了具有钥匙属性的访问令牌。
【链路】
微软案的泄密链路由三个关键环节构成。首要,SAS令牌权限设计过于宽泛——微软内部存储采用了统一的存储账户,但没有为每个数据集创建独立的、最小权限的容器和令牌。第二,研究团队在公开发布数据集时附带了含有令牌的下载链接,但这个链接的权限设置没有经过安全审查。第三,GitHub仓库的可见性设置和秘密扫描机制没有拦截到这个过度授权的令牌,导致它被公开了很长时间才被外部安全研究人员发现。从安全研究的角度看,这个问题不算高难度漏洞,但它说明了一个严肃的事实:权限控制的一点点松懈,乘以大规模云存储的总量,就可能酿成巨大的数据暴露面。
【启示】
首要个启示是,访问令牌和分享链接本身就是敏感凭据,必须与密码和密钥同等对待。在很多AI和研究协作团队中,很多人习惯把"分享一个下载链接"等同于"发一个网页链接",完全不理解链接中嵌入的令牌可能让接收方获得远超预期的访问权限。培训必须反复强调:任何一个包含认证信息的URL,从生成的那一刻起就已经是一种凭据。
第二个启示是,最小权限原则在数据分享场景中需要严格执行。无论是对外分享数据集还是对内分享项目文件,都应该遵循"只读、最短时效、专门容器"的原则。每次数据分享都应该明确:这个链接能看到什么、能看多久、能不能二次传播。微软案正是因为违背了最小权限原则,才让原本计划分享的少量数据,变成了整个存储账户的入口。
第三个启示是,AI研究团队的安全意识需要与研发团队的协作模式相匹配。AI研究者习惯开放共享、快速迭代、尽早公开,但这种文化与商业秘密保护和数据安全之间存在天然的张力。企业需要在不阻碍创新的前提下,为研究团队设计出既不影响效率又不会意外暴露数据的安全流程。
首要,所有云存储的分享链接和访问令牌必须强制执行最小权限策略。对外分享时使用专门容器、只读权限和过期时间。对内分享也应当区分可复制和不可复制的权限级别。第二,建立自动化的秘密扫描和令牌检查机制。GitHub仓库和代码仓库应当与秘密检测工具集成,自动识别硬编码密钥、令牌和凭证。第三,对所有对外公开发布的数据集和代码仓库实施发布前的安全审查,重点检查链接冲突、配置文件、环境变量和令牌硬编码。第四,在AI和研究团队中开展"凭据即钥匙"的专题培训,让每个研究人员都理解为什么一个共享链接不能随便生成和发布。如需企业级云存储安全审计和AI研究团队的保密管理方案,欢迎联系北京企密安。联系方式:010-63711822。
【审核留痕】
本文基于公开报道素材整理,为营销内容草稿,未经正式发布审批。
内容编号:MIX5-20260521-06 | 创作日期:2026-05-21 | 创作Agent:JIUWEIHU-九尾狐子Agent
状态:草案 | 待LUWU内容复核 | 待JESS发布审批






