arXiv 要独立了。

近日,这个托管近 240 万篇论文、每月下载量超千万次的学术预印本平台,正式宣布将结束与康奈尔大学长达二十多年的合作关系,转为独立运营的非营利组织。与此同时,arXiv 正通过全球知名猎头公司 Spencer Stuart 公开招募其历史上首任 CEO,预期年薪 30 万美元左右。

(来源:jobs.chronicle)
打开网易新闻 查看精彩图片
(来源:jobs.chronicle)

消息传出后,迅速引起了学术社区的广泛讨论。在 Mastodon 上,加州大学河滨分校数学物理学家 John Carlos Baez 率先转发招聘信息,Tildes 论坛的讨论帖迅速涌入数十条评论,主要讨论 CEO 的薪资水平问题,观点各有侧重,从"这薪水是否偏高"到"在纽约 30 万美元只是正常中产水平"不一而足。

但在薪资问题背后,或许更值得追问的是:arXiv 为何选择此时脱离康奈尔?这个行为对其有何意义?

答案其实可以用一句话总结:arXiv 已经发展到一定规模,康奈尔大学的附属架构难以完全适配其发展需求。

(来源:QGM)
打开网易新闻 查看精彩图片
(来源:QGM)

过去几年,arXiv 的资金来源发生了根本性变化。根据其官方披露,康奈尔大学的直接补贴和实物支持目前仅占总运营费用的 37%左右。其余资金来自西蒙斯基金会(Simons Foundation)的持续捐赠、全球约 220 家会员机构的年费,以及各类基金会的大额赠款:2023 年西蒙斯基金会与美国国家科学基金会联合提供超过 1,000 万美元,2025 年施密特科学与 NASA 又追加了 700 万美元。

换句话说,arXiv 实际上早已不是康奈尔"资助"的项目,而是一个由全球学术共同体共同支持的公共基础设施。但在组织架构上,它仍然只是康奈尔计算与信息科学学院下属的一个"项目",人事、财务、技术决策都需要遵循大学的行政流程。

这种架构与规模的不匹配带来了实际的运营挑战。arXiv 现任执行主任、Cornell Tech 计算机科学教授 Ramin Zabih 在接受《美国数学学会通报》采访时,曾将 arXiv 比作"一所大学里配备大型科学仪器的公共设施",挂靠于某个院系、由一位教授牵头、配有相应支持团队。

这种模式在 arXiv 规模较小时运转顺畅,但当平台需要服务全球数十万研究者、管理 600 万美元年度预算、协调 27 名员工和 200 多名志愿审核员时,"大学附属项目"的身份便显得制约明显。招聘启事中明确列出了独立运营的优势:加快技术迭代、提升组织灵活性、拓展合作伙伴关系、实现长期财务可持续。

还有一个微妙但重要的因素:arXiv 作为全球学术基础设施,若长期被视为"康奈尔大学的项目",就可能引发中立性质疑。Tildes 上一位用户指出了这一点:独立运营有助于避免因依附单一大学而产生的利益协调问题,例如在资源分配上是否可能向康奈尔研究者倾斜。对于一个旨在中立服务全球学术社区的平台而言,淡化特定机构的标签,或许是发展的必然方向。

至于为何选择此时?只能说时机也确实趋于成熟。arXiv 正在推进代号"arXiv CE"的云迁移项目,目标是将系统从康奈尔自有服务器迁移至 Google Cloud;近年累计获得的大额捐赠使资金储备较为充裕;加之需要遴选新的领导层,正好借此机会优化组织架构。

不过这并非 arXiv 首次变更归属。1991 年,美国物理学家 Paul Ginsparg 在洛斯阿拉莫斯国家实验室(LANL)搭建了这一系统的前身:一个用于存储和分发高能物理预印本的邮件服务器,域名为如今看来颇具年代感的 xxx.lanl.gov。

图 | Paul Ginsparg (来源:Wikipedia)
打开网易新闻 查看精彩图片
图 | Paul Ginsparg (来源:Wikipedia)

十年后,因 LANL 对项目持续扩张兴趣有限,Ginsparg 将项目转入康奈尔大学,并更名为 arXiv.org(由于"archive"域名已被注册,于是他将"chi"替换为希腊字母χ的拉丁转写"X",并为保持对称去掉了字母"e")。次年,Ginsparg 因创建 arXiv 获得麦克阿瑟基金会"天才奖"。

在康奈尔大学的二十余年中,arXiv 从一个物理学家的个人项目,逐步发展为全球重要的学术基础设施之一。截至 2025 年中,平台托管论文总量已超过 230 万篇,涵盖物理学、数学、计算机科学、量化生物学、量化金融、统计学、电气工程与系统科学以及经济学八大学科。在数学和理论物理的多个细分领域,绝大多数重要成果会在正式发表前先上传至 arXiv。

例如俄罗斯数学家 Grigori Perelman 证明庞加莱猜想的论文,至今仅见于 arXiv,未提交至任何期刊。但这并未影响他获得菲尔兹奖和克雷千禧年大奖(尽管他最终拒绝领取)。Perelman 曾表示:"如果有人对我的解法感兴趣,内容都在那里,可以自行查阅。"

在 arXiv 的推动下,"先发布预印本、再投稿期刊"的模式逐渐成为理工科研究的常规流程,也为后续"开放获取"(Open Access)运动的发展奠定了基础。与传统学术期刊不同,arXiv 对作者和读者均免费开放,不收取投稿费或访问费。论文上传后会经过志愿审核员的初步筛查,确保内容符合相关学科的基本规范。但这并非同行评审,arXiv 不对论文的学术正确性提供背书。

然而,独立运营也意味着需要直面更多不确定性。在 Tildes 论坛的讨论中,有用户表达了谨慎态度:"我担心这可能是平台体验下滑的起点。arXiv 应当作为公共服务来运营。"也有观点回应:"非营利组织的设立初衷就是服务公共利益,这正是其存在价值。

这类担忧并不是没有依据。近年来,学术界见证了不少曾承诺"免费开放"的平台逐步转向收费或设置访问限制的例子。例如,Academia.edu 和 ResearchGate 最初以免费分享论文为特色,如今平台中付费内容与广告比例明显上升。

更现实的隐忧在于,在当前人工智能发展的背景下,arXiv 作为计算机科学领域重要的论文资源库,对大型语言模型训练数据具有显著价值。一位 Tildes 用户写道:"我不希望 arXiv 利用其作为计算机科学论文核心资源库的地位,从人工智能热潮中谋取短期收益。除非他们计划将所得资金全部投入自给自足的捐赠基金,并长期不动用本金。"

图 | 该用户评论(来源:Tildes)
打开网易新闻 查看精彩图片
图 | 该用户评论(来源:Tildes)

若新任管理层尝试通过与科技公司合作筹措资金,是否会影响 arXiv 作为中立学术基础设施的定位?这点我们还需等待观察。

不过,也有观点对转型持审慎乐观态度。

因为独立运营使 arXiv 能够更直接地参与全球学术治理相关讨论,无需经由康奈尔作为中介;可以更灵活地接受和使用多元资金来源;可以更高效推进技术迭代与学科扩展。招聘启事显示,新任首席执行官将直接向新组建的董事会汇报,董事会成员将包括康奈尔大学与西蒙斯基金会的代表,以保障过渡平稳与支持延续。这表明独立是一个渐进过程,而非骤然割裂。

值得补充的是,在此番独立表态之前,arXiv 自身也已经开始调整内容接收策略。2025 年 11 月,平台宣布不再接收未经学术期刊或会议审核的计算机科学综述类文章与立场论文,理由是应对人工智能生成内容增多带来的质量挑战。这可以说是它在探索与自身体量和价值观相匹配的治理形式上,迈出的重要一步。

除 27 名正式员工外,arXiv 目前有超过 200 名无偿服务的志愿审核员。这些审核员的职责更接近期刊编委会成员,而非传统审稿人。他们主要确认论文是否归属合适的学科类别,不对内容进行实质性学术评审。这种轻量级审核机制是 arXiv 保持高效运转的关键。转型为独立组织后,如何持续维系这一志愿者网络,将是新任管理者需要面对的重要课题。

截止新闻发出,arXiv 尚未公布独立后的组织架构细节,包括董事会完整构成、新的资金来源规划,以及过渡期间的具体运营安排。

1.https://mathstodon.xyz/@johncarlosbaez/116223948891539024

2.https://tildes.net/~science/1t7g/arxiv_is_separating_from_cornell_university_and_is_hiring_a_ceo_who_will_be_paid_roughly_300_000

3.https://jobs.chronicle.com/job/37961678/chief-executive-officer/