打开网易新闻 查看精彩图片

2019年,Sara Metwalli在东京开始写博士申请。同期,全球量子计算论文年发表量刚破4000篇,投资人连PPT都懒得看完。6年后,她坐在苏格兰的实验室里,收到的问题是:「我的TensorFlow模型能不能跑在量子芯片上?」

这种转变不是渐进式的。2023-2024年,IBM、Google、IonQ相继发布千量子比特级设备, error correction(量子纠错)从理论概念变成可演示的工程模块。对数据科学家而言,这意味着一件事:你熟悉的采样、优化、线性代数问题,突然有了指数级加速的物理载体。

从「物理课作业」到「软件工程问题」

从「物理课作业」到「软件工程问题」

Metwalli的转折点发生在2018年。当时她在埃及读硕士,给量子物理课当助教。「教授把叠加态讲成了概率分布的另一种写法」,她说。这种翻译能力后来成了她的核心技能——把量子力学翻译成程序员能调用的API。

她的博士论文做的是量子机器学习(Quantum Machine Learning,量子机器学习)。这个领域有个尴尬的历史:2019年前后,大量论文声称量子神经网络能秒杀经典模型,结果复现不出来。Metwalli的选择是退后一步,先做基础设施——怎么写能实际运行的量子代码,而不是在模拟器里跑demo。

这种务实路线现在看起来押对了。2024年,她加入爱丁堡大学的Quantum Software Lab,团队接到的项目 increasingly 来自金融和制药公司:用quantum annealing(量子退火)做投资组合优化,用VQE(变分量子特征值求解器)模拟分子基态。客户不关心量子优越性,只关心能不能比GPU快一个数量级。

「研究走出实验室的速度,比研究者预期的快得多。」Metwalli在采访中说。她指的是LLM(大语言模型)的爆发,但这句话同样适用于她自己的领域。

LLM改变了什么,又没改变什么

LLM改变了什么,又没改变什么

打开网易新闻 查看精彩图片

2022年底ChatGPT发布时,Metwalli刚提交博士论文。她的第一反应是职业层面的:「我写了五年教别人写代码的文章,现在一个对话框就能生成?」

但她很快调整了策略。LLM对量子计算写作的冲击是双向的:一方面,基础概念解释确实可以被替代;另一方面,技术细节的准确性成了稀缺资源。她观察到,GPT-4在解释Grover算法时会漏掉oracle(预言机)构造的关键假设,在讨论NISQ(含噪声中等规模量子)设备时会混淆相干时间和门保真度。

「这些错误对初学者是致命的」,Metwalli说。她开始把写作重点转向「边界知识」——哪些东西LLM能写对,哪些必须靠领域经验判断。这种内容反而在2023-2024年流量翻倍。

更深层的变化发生在研究传播方式上。她提到COVID期间的隔离经历:「写TDS文章是我和外界的主要连接」。这种习惯延续下来,让她比多数学术同行更早意识到,量子计算需要「实时科普」——不是等论文发表后再写解读,而是在arXiv预印本阶段就介入讨论。

数据科学家该关心什么,以及什么时候

Metwalli给了一个具体的时间表。如果你在做传统监督学习,「未来3-5年不需要动量子计算」。经典神经网络的规模效应还没触顶,量子设备的比特数和连通度还撑不起实用模型。

但有两个例外场景值得现在投入:

第一,组合优化问题。物流路径规划、芯片布局、药物分子筛选——这些问题的结构天然适配quantum approximate optimization algorithm(量子近似优化算法,QAOA)。Metwalli提到一个2024年的案例:某制药公司用20量子比特设备模拟二氢化锂分子,精度超过经典方法但耗时从数小时降到分钟级。

打开网易新闻 查看精彩图片

第二,线性代数密集型任务。量子主成分分析、量子支持向量机的理论加速比是指数级的。限制在于需要把数据编码到量子态,这个loading(加载)过程本身可能是瓶颈。「不是每个矩阵都值得上量子」,Metwalli强调。

她建议数据科学家从Qiskit或Cirq开始,但目的不是写量子代码,而是理解「什么算难,什么算容易」。这种直觉在评估供应商方案时至关重要——量子计算的商业化阶段,营销话术和实际能力的差距可能比AI领域更大。

从东京到苏格兰,一个观察者的位移

从东京到苏格兰,一个观察者的位移

Metwalli的履历轨迹本身说明了领域变化。2019年她在日本做理论物理,2024年中转到美国做outreach(科普推广),年底又折返学术界做postdoc(博士后)。这种跳跃在量子计算领域不算特例——产业化和基础研究的节奏差太大,很少有人能单脚站稳。

她现在的位置在爱丁堡,离英国国家量子计算中心车程两小时。这个选址有刻意成分:苏格兰的量子生态集中在光量子路线,和她博士期间的超导量子背景形成互补。「你需要看多种硬件路线才能判断哪个问题该用哪种方案」,她说。

这种跨路线视野在2025年变得关键。IBM押注超导,IonQ专注离子阱,PsiQuantum在搞光子集成——没有单一赢家,但每个路线都有特定的算法适配性。数据科学家如果现在要布局,需要理解的不仅是量子力学,还有硬件工程的现实约束。

采访结束前,Metwalli提到一个细节:她2024年写的最多评论的文章,标题是《量子机器学习死了吗?》。写于某篇Nature论文声称量子神经网络无优势的两个月后,她的论点是没有死,只是「换了一种死法」——从追求通用优越性,转向特定问题的实用加速。

这种措辞是她风格的典型:不回避负面结论,但拒绝简单的死亡宣告。对读者来说,这可能比任何乐观预测都更值得信任。

量子计算对数据科学家的真正冲击,会发生在什么时候?