捷克团队用遗传算法攻破Linux杀毒AI

固件更新中

2026-04-28 15:53 ·北京

布拉格的两位研究者往恶意代码里塞了点"正常文件该有的字符串"，就把知名深度学习检测模型的信心打掉了50%。

他们动了什么手脚

捷克理工大学的研究者卢卡斯·赫尔东卡（Lukáš Hrdonka）和马丁·尤雷切克（Martin Jurecek）盯上了Linux ELF二进制文件。这个格式支撑着全球云基础设施、物联网设备和高性能计算系统，但在对抗样本研究领域长期被忽视——Windows PE文件才是主流靶子。

他们的工具基于遗传算法，对7种不同数据源施加12类修改。核心约束极其严格：改完后的二进制必须能正常跑，功能一点不能丢。

目标选的是MalConv，深度学习恶意软件检测领域的标杆模型。最终交出的成绩是67.74%的逃逸率，同时payload完全可用。

为什么"塞字符串"这招特别损

研究团队发现最有效的技巧，是往恶意文件里注入良性文件常见的字符串。更麻烦的是，MalConv对这些字符串的位置不敏感——开头、中间、末尾，放哪儿都能骗过模型。

「攻击者不需要精确了解文件内部结构，就能操纵分类器输出。」研究者在arXiv预印本论文中写道。这意味着攻击门槛被大幅降低。你不需要逆向工程专家，不需要懂ELF格式细节，批量往黑样本里灌白样本的字符串特征就行。

团队还引入了两个新指标：扩展逃逸率（EER）和置信度偏移量。平均情况下，生成器把MalConv的恶意分类置信度拉低了-0.50。这个数字的潜台词是：模型不是"不太确定"，而是被系统性推往错误方向。

Linux安全工具的盲区被照亮了

这项研究补上了一块关键拼图。此前的ADVeRL-ELF框架用强化学习，在ARM架构物联网二进制文件上实现了59.5%的逃逸率。新工具把天花板抬到67.74%，而且针对的是更广泛的Linux终端、容器和云工作负载。

云原生安全的从业者需要警惕这个信号。Linux在服务器市场的统治地位意味着，针对ELF格式的对抗攻击一旦成熟，影响面远超Windows桌面端。容器镜像、CI/CD流水线、边缘节点——这些ML检测器守护的环节都可能被绕过。

研究者给出的建议很直接：别把鸡蛋放一个篮子。纯ML检测在Linux环境需要叠加行为分析、特征码检测等传统手段。这不是技术倒退，是承认当前深度学习模型在对抗样本面前的结构性脆弱。

这篇4月24日挂到arXiv的论文，标题很学术，但指向的问题很现实。当攻击者能用遗传算法自动批量生产"看起来正常"的恶意ELF文件，安全团队的检测流水线是否做好了准备？

如果你负责Linux服务器或云原生安全，现在该去检查一下：你的ML检测器有没有对抗训练？置信度阈值设在哪里？有没有二次验证机制？赫尔东卡和尤雷切克的研究不是末日预言，是一份免费的压力测试报告——趁真正的攻击者还没大规模用上类似工具。

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴