AI知名创业公司企业超过六成AI机密资讯外流GitHub

云计算安全公司Wiz研究发现，在GitHub上，可以找到众多组织的机密凭证，包括65%的知名AI创业公司。

Wiz这项研究是分析知名AI创业公司的安全作业。该公司假设任何AI公司若在GitHub有够多软件程序代码，绝对会泄露一些凭证。因此他们研究对象锁定AI未上市公司，特别是具有指标性的福布斯AI 50（Forbes AI 50），大到Anthropic、小到创业公司如Glean和Crusoe等，并着手在GitHub扫描。

研究扫描的范围除了提交历史记录、已删除分叉（fork）、工作流程日志（logs）、gist等常见地方，还包括拓扑（topology）、以及周围区域如组织关注者（metadata中引用组织名称的账户）、程序代码贡献者、与HuggingFace和npm等相关网络中的相关性。

Wiz发现，在Forbes AI 50中，将近2/3，约65%可在GitHub上找到机密资讯，像是API密钥、令牌、和敏感凭证等。这些数据可能藏在已删除的分叉、gist或开发人员repository中，多数扫描工具可能忽略这些地方。研究人员表示，这些资讯可能导致泄露组织架构、AI训练数据甚至模型。

Wiz估计，这些经验证的机密资讯价值超过4000亿美元。

在这些外流的组织中，在GitHub上足迹（footprint）最小的是没有公开程序库，但仍然有14家公司成员泄露了其他数据。最大足迹者而没有外流资讯的，拥有60个公开程序库，分属28个成员。研究人员表示这些组织具有完善的机密管理策略。

从外流的机密类型分布来看，主要三类都和AI有关，分别是WeightsAndBiases、ElevenLabs和HuggingFace。Google API为第四大。

Wiz也分析了披露或公开渠道。近半通报消息未能真正到达受影响的公司或未接获回应。许多公司没有官方披露渠道、未能回应或无法解决问题。但研究人员发现，AI公司这方面逐步改善。例如LangChain和ElevenLabs API密钥都很快解决。

但也有一家AI 50公司在已删除的分叉中泄露了HuggingFace令牌，后者可访问1000个不公开模型。此外，Wiz也发现多个WeightsAndBiases API密钥，泄露了不公开模型的训练数据。

Wiz建议这些AI公司最好能使用执行公开VCS （Version Control System）扫描机密资讯，并设立公布渠道，确保和大众的资讯流通，最好也考虑专属机密数据侦测，防范资讯外流。