很多企业的会议室里现在都摆着智能音箱或者带有语音助手功能的会议设备。开会的时候喊一声就能设置提醒、查询日程、控制灯光和投影,确实很方便。但很少有人仔细想过一个问题:当这些AI语音助手一直处于待机状态时,它在听什么?

去年,有一家提供法律咨询服务的事务所在接待一位重要客户的商业秘密纠纷案件时,发现了一个让人极度不安的事情。他们在会议室里讨论案件策略的录音,在未经任何授权的情况下,出现在了一个非授权的设备上。事情的起因是会议室里有一台智能会议音箱,这台音箱具有远场语音拾取和云端语音识别功能。事务所在采购这台设备时,供应商明确告知它只有在唤醒词触发后才会开始录音,平时处于待机状态。但技术人员在对设备日志进行审计时发现,这台音箱在待机状态下也向云端上传了大量的音频片段,原因是它的语音活动检测算法对某些低频人声产生了误判,把会议讨论中的很多句子当成是唤醒指令,从而触发了录音和上传。

技术团队进一步分析后发现,这台设备在出厂时的固件中默认开启了辅助唤醒功能。所谓辅助唤醒,指的是设备为了提升语音助手的响应灵敏度,会在待机状态下持续分析环境中的声音特征,当检测到可能包含唤醒词的声音片段时,就会把这段音频上传到云端做二次确认。而法律团队在会议室里讨论案件时说的很多内容,包含了大量的专有名词和特定短语,其中一些恰好触发了云端匹配规则,导致完整音频被上传。

这个案例暴露出的问题其实不只存在于这一款设备上。目前市面上主流的智能音箱、智能会议设备、甚至智能电视和智能空调的语音控制模块,都存在着类似的隐私安全隐患。设备厂商为了优化语音助手的唤醒成功率和响应速度,会在本地储存一段循环的音频缓冲区,缓冲区里的音频数据在上传到云端进行匹配分析之后才会被清除。而这段缓冲区的时长通常在几秒到十几秒之间,这个窗口足以捕捉到很多敏感信息。

更要命的是智能会议设备的权限管理问题。很多企业采购了智能会议设备之后,维护人员使用默认的管理员密码登录后台,后续也没有修改过密码。还有一些设备直接连接到了公司的主干网络,却没有做网络隔离,这意味着一旦设备被远程攻破,攻击者就可以通过设备的麦克风实时获取会议室的音频流。

企业在使用AI语音助手设备时需要做好的几件事。第一,在核心会议室、高管办公室和涉及敏感讨论的区域,不要放置任何具有远场语音拾取功能的智能设备。如果必须使用,建议选择那些支持纯本地语音处理、不需要上传音频到云端的设备型号。第二,智能会议设备的网络连接应该被隔离到一个独立的VLAN中,禁止设备与公司核心业务网络直接互通。第三,定期检查智能设备的固件版本、管理密码和日志记录,关闭一切不必要的网络服务和辅助功能,特别是所谓的增强唤醒、语音分析、数据共享等隐私风险较高的选项。第四,在购买设备前仔细阅读隐私政策和数据安全声明,了解设备厂商如何处理用户的声音数据。

那家法律事务所在发现问题后,立即停用了所有智能会议音箱,并更换成了纯物理按键控制的会议麦克风,同时在会议室门口张贴了告示,要求所有人员在进入会议室前关闭随身携带的智能设备上的语音助手功能。他们的IT负责人说了一句很实在的话:对着智能音箱喊一声"帮我记录会议纪要"确实很方便,但你不知道在你喊出那一声之前,它已经听了多久。AI语音助手的便利性无可否认,但当你最核心的商业机密被一台小小的音箱当作语音样本来分析和上传时,这个代价可能远远超过了它带来的那点方便。