
云计算安全公司Wiz研究发现,在GitHub上,可以找到众多组织的机密凭证,包括65%的知名AI创业公司。
Wiz这项研究是分析知名AI创业公司的安全作业。该公司假设任何AI公司若在GitHub有够多软件程序代码,绝对会泄露一些凭证。因此他们研究对象锁定AI未上市公司,特别是具有指标性的福布斯AI 50(Forbes AI 50),大到Anthropic、小到创业公司如Glean和Crusoe等,并着手在GitHub扫描。
研究扫描的范围除了提交历史记录、已删除分叉(fork)、工作流程日志(logs)、gist等常见地方,还包括拓扑(topology)、以及周围区域如组织关注者(metadata中引用组织名称的账户)、程序代码贡献者、与HuggingFace和npm等相关网络中的相关性。
Wiz发现,在Forbes AI 50中,将近2/3,约65%可在GitHub上找到机密资讯,像是API密钥、令牌、和敏感凭证等。这些数据可能藏在已删除的分叉、gist或开发人员repository中,多数扫描工具可能忽略这些地方。研究人员表示,这些资讯可能导致泄露组织架构、AI训练数据甚至模型。
Wiz估计,这些经验证的机密资讯价值超过4000亿美元。
在这些外流的组织中,在GitHub上足迹(footprint)最小的是没有公开程序库,但仍然有14家公司成员泄露了其他数据。最大足迹者而没有外流资讯的,拥有60个公开程序库,分属28个成员。研究人员表示这些组织具有完善的机密管理策略。
从外流的机密类型分布来看,主要三类都和AI有关,分别是WeightsAndBiases、ElevenLabs和HuggingFace。Google API为第四大。
Wiz也分析了披露或公开渠道。近半通报消息未能真正到达受影响的公司或未接获回应。许多公司没有官方披露渠道、未能回应或无法解决问题。但研究人员发现,AI公司这方面逐步改善。例如LangChain和ElevenLabs API密钥都很快解决。
但也有一家AI 50公司在已删除的分叉中泄露了HuggingFace令牌,后者可访问1000个不公开模型。此外,Wiz也发现多个WeightsAndBiases API密钥,泄露了不公开模型的训练数据。
Wiz建议这些AI公司最好能使用执行公开VCS (Version Control System)扫描机密资讯,并设立公布渠道,确保和大众的资讯流通,最好也考虑专属机密数据侦测,防范资讯外流。











