字节跳动大模型训练遭实习生攻击细节曝光|代码|大模型|字节跳动|模型训练

来源：中国经营报

近日，多个微信群流传一则消息：“某头部大厂的大模型训练被实习生入侵，注入了破坏代码，导致其训练成果不可靠，可能需要重新训练。据称遭到入侵的代码注入了8000多张卡，带来的损失可能超过千万美元。”

记者从知情人士处获悉，该头部大厂为字节跳动。此事发生在今年6月，起因是某高校的博士在字节跳动商业化技术团队实习，因对团队资源分配不满，使用攻击代码破坏团队的模型训练任务。

传闻显示，该田姓实习生利用了HF（huggingface）的漏洞，在公司的共享模型里写入破坏代码，导致模型的训练效果忽高忽低，无法产生预期的训练效果，而且AML团队无法核查原因。但传闻曝出之后，该实习生还在某微信群里辟谣称，自己发完论文后就从字节跳动离职，这个当口有另一个人钻漏洞改模型代码，把锅扣到自己头上。

一位前字节技术员工表示：“字节AI Lab的实习生权限和正职员工差异不大，也使得此次事件有了发生的机会，”其也对此次事件带来的恶性影响表达了担忧，“这件事之后肯定会极大地收缩实习生的权限”。

记者从知情人士处了解到，字节跳动内部已经调查明确此事为田姓实习生所为。目前，该实习生已被辞退，字节跳动同时把此事同步给阳光诚信联盟和企业反舞弊联盟，以及该实习生所在的学校。但这名实习生被辞退后到处“辟谣”甩锅，称是其他人所为。

有相关知情人士在Gitbub上表述，“你（指田某）在长达2个月的时间里对集群代码进行恶意攻击，对公司近30位各级员工造成巨大伤害，让你的同事近一个季度的工作白费。所有的记录和审查都证明这是不容狡辩的事实！”

该名人士还分享了一则调查人员对田姓实习生的询问录音，录音中的对话还原其攻击的过程：田某最先输入的code本来是被用于影响通讯和随机性的，“最开始的时候它并不是以攻击为目的，它是为了debug，但这确实会涉及程序的一些运行情况。但是后面它经过一些文件，就是那些upload文件，code也会被update，code就变成了攻击code。它大概的作用就是去修改code，然后就会造成一些后果”。

录音中疑似田某本人的回应承认了其通过update使得code带有了攻击性。其也对问询人员明确表示，“就是因为某些原因导致了我们都非常不满”。

据了解，该实习生攻击的并不是豆包大模型，而是商业化技术团队的模型训练任务，影响了该技术团队的一些业务进展，但整体对公司造成的损失并没有传闻中的超过千万美元那么大。

一位技术安全专家表示，HF漏洞产生肯定是单一性集中训练，此事暴露了字节跳动技术训练存在安全管理问题。公司既没做权限隔离，也没有做好共用代码的审计。正常情况下，每次大的代码变动必须做审计，无论谁做操作都有痕迹记录，一个人想动代码是不可能的。

上述技术安全专家表示，目前行业通用的做法是做三级隔离导向性部署，每一级只有镜像，每次先扫描。调用按次算、必须密钥。每一级完成后，才能进入下一级，而上一级自动删除，进行分级训练。

截至发稿，字节跳动方面仍未对此事进行公开回应。

来源：《中国经营报》综合自界面新闻、凤凰网科技等