做数据科学到底要懂多少数学?这个问题像问"做厨师要认识多少种盐"——听起来专业,实际上多数人炒菜靠的是尝,不是元素周期表。

行业里有个公开的秘密:80%的日常工作是清洗数据、调包、和产品经理吵架。线性代数的直觉?有用。能手动推导出PCA公式?三年用不上一次。一位从生物转行的数据科学家说,「我花了两个月死磕特征值分解,入职后发现全公司都在用sklearn.fit()」。

真正卡脖子的不是数学深度,是问题拆解能力。知道什么时候该用模型、什么时候该直接看分布、什么时候该告诉老板"这数据根本不支持结论"——这些决策不需要证明中心极限定理,需要的是对业务的嗅觉和对模型边界的清醒。

当然,数学不是没用。它是你的逃生通道:当模型表现诡异、当标准工具箱失效、当你必须从零写一段训练逻辑时,底子厚的人能自己造轮子,底子薄的人只能等社区更新。问题是,这个场景在职业生涯中出现的频率,远低于招聘JD里写的"精通数学优化"。

一位在Netflix干了八年的工程师在评论区留了句话,被顶到最上面:"我招人的时候看的是你有没有调通过一个烂模型,不是你能不能证明它收敛。"