集智斑图顶刊论文速递栏目上线以来,持续收录来自Nature、Science等顶刊的最新论文,追踪复杂系统、网络科学、计算社会科学等领域的前沿进展。现在正式推出订阅功能,每周通过微信服务号「我的集智」推送论文信息。

扫描下方二维码,关注“我的集智”服务号,即可订阅Complexity Express:

Complexity Express 一周论文精选

以下是2022年12月12日-12月18日来自Complexity Express的复杂性科学论文精选。如果Complexity Express列表中有你感兴趣的论文,欢迎点赞推荐,我们会优先组织解读~

目录:

1. 随机种子场的超分辨率生成对抗网络

2. 量子变分算法充斥着陷阱

3. 蛋白质表达深度学习模型的精度和数据效率

4. 基于多模态深度学习的单细胞多组学数据聚类

5. 在长期草地试验中,生物多样性与稳定性的关系随着时间推移加强

6. 类睡眠的无监督回放减少人工神经网络中的灾难性遗忘

7. 模拟松弛强化学习的高速四足运动

1. 随机种子场的

超分辨率生成对抗网络

打开网易新闻 查看精彩图片

论文题目:Super-resolution generative adversarial networks of randomly-seeded fields 论文来源:Nature Machine Intelligence 论文链接:https://www.nature.com/articles/s42256-022-00572-7

从稀疏测量中重建场量是广泛的应用场景中都会出现的问题,当稀疏测量和场量之间的映射是以无监督的方式进行时,这项任务就变得特别具有挑战性。移动传感器和/或随机开关状态进一步增加了复杂性。在这种情况下,最直接的解决方案是将分散的数据插值到规则网格上。然而,通过这种方法实现的空间分辨率最终受到稀疏测量之间的平均间距的限制。

在这项工作中,我们提出了一个超分辨率生成对抗网络框架,来估计来自随机稀疏传感器的场量。该算法利用随机抽样来提供高分辨率底层分布的不完整视图。它被称为随机种子超分辨率生成对抗网络 (RaSeedGAN) 。这项研究所提出的技术在流体流动模拟的合成数据库、海洋表面温度分布测量数据、以及零压力梯度湍流边界层的粒子图像测速的数据上进行了测试。即使在具有高稀疏度或噪声水平的情况下,结果也显示出出色的性能。这种生成对抗网络算法从随机种子的场提供全场高分辨率估计,而不需要全场高分辨率表示进行训练。

打开网易新闻 查看精彩图片

图:RaSeedGAN 架构示意图。

2. 量子变分算法充斥着陷阱

打开网易新闻 查看精彩图片

论文题目:Quantum variational algorithms are swamped with traps 论文来源:Nature Communications 论文链接:https://www.nature.com/articles/s41467-022-35364-5

经典神经网络最重要的特性之一是具有惊人的可训练性,尽管它们的训练算法通常依赖于对复杂的、非凸的损失函数进行优化。以前的结果表明,与经典神经网络的情况不同,变分量子模型往往是不可训练的。研究最多的现象是这些量子模型的训练景象中出现了贫瘠高原 (barren plateaus) ,通常是在模型非常深的时候。对贫瘠高原的关注使得这一现象几乎成为量子模型可训练性的同义词。

在这里,我们表明贫瘠高原只是故事的一部分。我们证明,在来自全局最小值的任何恒定能量内,一大类变分量子模型——它们很浅,并且没有表现出贫瘠高原——只有超多项式量级的小部分的局部极小值,如果对最优参数没有很好的初始猜测,这些模型将无法训练。我们还从统计查询框架研究了变分量子算法的可训练性,并表明各种量子模型的噪声优化在亚指数级的查询次数下是不可能的。最后,我们在各种问题实例上用数字证实了我们的结果。尽管我们在这里排除了各种各样的量子算法,但对某些类别的变分算法给出了乐观的理由,并讨论了在展示这些算法的实际效用方面的潜在途径。

打开网易新闻 查看精彩图片

图:损失景观的典型形状,这里将损失景观绘制成(a)曲面和(b)等高线图。参数不足的量子变分算法的损失情况通常显得“崎岖不平”,充满了各种局部极小值和陷阱。

3.蛋白质表达深度学习模型的

精度和数据效率

打开网易新闻 查看精彩图片

论文题目:Accuracy and data efficiency in deep learning models of protein expression 论文来源:Nature Communications 论文链接:https://www.nature.com/articles/s41467-022-34902-5

合成生物学经常涉及到工程微生物菌株以表达高价值的蛋白质。由于快速 DNA 合成和测序方面的进展,深度学习已经成为建立“序列到表达”模型以优化菌株的一种有前途的方法。但是这样的模型需要大量昂贵的训练数据,这给许多实验室带来了陡峭的研究壁垒。

在这里,我们研究了在不同规模和序列多样性的数据集上训练的机器学习模型集的准确性和数据效率之间的关系。我们表明,深度学习可以用比以前想象的小得多的数据集达到良好的预测精度。我们证明了受控的序列多样性导致了数据效率的大幅提高,并采用了可解释人工智能 (Explainable AI) 来证明卷积神经网络可以对输入的 DNA 序列进行精细的判别。我们的结果为设计基因型-表型筛选提供了指导方针,以平衡训练数据的成本和质量,从而有助于促进深度学习在生物技术领域的广泛采用。

打开网易新闻 查看精彩图片

图:训练数据的特征。(A)在大肠杆菌23中采用了一个大型的表型筛选,即在一个可变的 96nt 序列之前的 sfGFP编码基因。(B)对所有 228,000 个序列计算的重叠 4-mers 的二维 UMAP27 可视化。(C)突变系列具有不同的表型分布,通过 FACS 测序将 sfGFP 的荧光归一化为其最大测量值。

4. 基于多模态深度学习的

单细胞多组学数据聚类

打开网易新闻 查看精彩图片

论文题目:Clustering of single-cell multi-omics data with a multimodal deep learning method 论文来源:Nature Communications 论文链接:https://www.nature.com/articles/s41467-022-35031-9

单细胞多模态测序技术被用于同时分析同一细胞中不同模式的数据。它提供了一个独特的机会,可以在单细胞水平上联合分析多模态数据,以识别不同的细胞类型。正确的聚类结果对于下游复杂的生物功能研究至关重要。然而,将不同的数据源结合起来进行单细胞多模态数据的聚类分析,仍然是一个统计和计算上的挑战。在这里,我们开发了一种新的多模态深度学习方法 (scMDC) ,用于单细胞多组学数据聚类分析。

ScMDC 是一个端到端的深度模型,它显式地描述了不同数据源的特征,并共同学习深度嵌入的潜在特征,以用于聚类分析。大量的仿真和实际数据实验表明,scMDC 在不同的单细胞多模态数据集上优于现有的单细胞单模态和多模态聚类方法。运行时间的线性可伸缩性使得 scMDC 成为分析大型多模态数据集的一种有前途的方法。

打开网易新闻 查看精彩图片

图:(a)scDMC的架构,(b)基于聚类结果,scDMC使用 ACE 检测不同聚类中的标志基因,(c)基于标志基因可进行通路分析。

5. 在长期草地试验中,生物多样性

与稳定性的关系随着时间推移加强

打开网易新闻 查看精彩图片

论文题目:Biodiversity–stability relationships strengthen over time in a long-term grassland experiment 论文来源:Nature Communications 论文链接:https://www.nature.com/articles/s41467-022-35189-2

许多研究表明,生物多样性驱动着生态系统的功能,但生物多样性的丧失如何改变生态系统的功能和长期稳定性却缺乏实验证据。在一个草原生物多样性的长达17年的实验中,我们分析了物种丰富度对群落生产力、稳定性、物种异步性和互补性的时间影响,以及它们之间的关系变化。

在多样性较差的群落中,生产力下降得更快,导致丰富度对生产力、互补性和稳定性的积极影响在时间上得到加强。在后来的几年里,由于丰富度对种群稳定性的负面影响减少,异步性在增加群落稳定性方面发挥了更重要的作用。只有在后期,物种互补性才与物种异步性有关。这些结果表明,物种互补性和异步性需要十年以上的时间,才能对不同植物群落的生态系统功能产生强大的稳定作用。因此,稳定生态系统功能的机制随着群落年龄的增长而变化。

打开网易新闻 查看精彩图片

图:播种物种丰富度与生产力的关系。显示了各年播种物种丰富度与(a)群落地上净初级生产力(ANPP在分析前进行平方根转换)和(b)群落相对产量(ANPP除以该年单株平均ANPP)之间的对数线性关系(1=2003,17=2019)。(c)对数关系的斜率,对应于每年每个新增物种的生物量相对于所有单株植物的平均ANPP的增加。(d)群落的ANPP相对于其在第1年的ANPP的变化,对于每个播种物种丰富度水平。

6. 类睡眠的无监督回放

减少人工神经网络中的灾难性遗忘

打开网易新闻 查看精彩图片

论文题目:Sleep-like unsupervised replay reduces catastrophic forgetting in artificial neural networks 论文来源:Nature Communications 论文链接:https://www.nature.com/articles/s41467-022-34938-7

众所周知,人工神经网络容易遭受灾难性遗忘:当依次学习多个任务时,它们在最近的任务中表现良好,但以牺牲之前学习的任务为代价。在大脑中,睡眠通过回放最近和过去相互冲突的记忆痕迹,在持续学习 (incremental learning) 中发挥着重要作用。在这里,我们测试了这样一个假设:在人工神经网络中实施类睡眠阶段,可以在新的训练过程中保护旧的记忆,减轻灾难性遗忘。

睡眠被实施为离线训练,使用局部无监督的 Hebbian 可塑性规则和噪声输入。在持续学习框架下,睡眠能够恢复原来被遗忘的任务。以前学过的记忆在睡眠期间自发地回放,对每一类输入形成独特的表征。与旧任务相对应的表征稀疏度和神经元活动增加,而与新任务相关的活动减少。这项研究表明,模拟睡眠式的动力学的自发回放可以减轻人工神经网络中的灾难性遗忘。

打开网易新闻 查看精彩图片

图:将新任务训练与睡眠交错进行,可以恢复 MNIST 数据集上旧任务的性能。

7. 模拟松弛强化学习的

高速四足运动

打开网易新闻 查看精彩图片

论文题目:High-speed quadrupedal locomotion by imitation-relaxation reinforcement learning 论文来源:Nature Machine Intelligence 论文链接:https://www.nature.com/articles/s42256-022-00576-3

腿式机器人的快速和稳定运动涉及到苛刻而矛盾的要求,特别是快速的控制频率以及准确的动力学模型。受益于神经网络的普遍近似能力和离线优化,强化学习已被用于解决腿部机器人运动中的各种挑战性问题;然而,四足机器人的优化控制需要优化多个目标,如保持平衡、提高效率、实现周期性步态和遵循指令等。这些目标不可能总是同时实现,特别是在高速情况下。

在这里,我们引入了一种模拟松弛强化学习 (imitation-relaxation reinforcement learning,IRRL) 方法来分阶段优化这些目标。为了弥补模拟和现实之间的差距,我们进一步将随机稳定性的概念引入系统稳健性分析。状态空间熵减速率是一个定量指标,可以敏锐地捕捉到周期倍增分岔和可能出现的混沌。通过在训练中采用 IRRL 和随机稳定性分析,我们成功演示一个类似 MIT-MiniCheetah 机器人以5.0米/秒的速度稳定奔跑。

打开网易新闻 查看精彩图片

图:哺乳动物和四足机器人的最大速度和身体质量的统计,以对数尺度计算。

关于Complexity Express

Complex World, Simple Rules. 复杂世界,简单规则。

由于学科交叉融合,大量针对复杂系统的研究成果散落在人工智能、统计物理、网络科学、数据科学、计算社会科学、生命科学、认知科学等等不同领域的期刊会议中,缺乏整合。

为了让大家能及时把握复杂系统领域重要的研究进展,我们隆重推出「Complexity Express」服务,汇总复杂系统相关的最新顶刊论文。

Complexity Express 是什么?

Complexity Express 每天爬取复杂系统领域最新发表的顶刊论文,每周通过“我的集智”服务号汇总推送。

进入 Complexity Express 页面即可随时查看顶刊论文更新,你也可以通过微信接收研究更新推送和一周汇总。

Complexity Express 为谁服务?

  • 如果你是复杂系统领域的研究者,可获得重要论文上线通知,每周获取最新顶刊论文汇总。

  • 如果你是复杂系统领域的学习者,可了解学界关注的前沿问题,把握专业发展脉络。

  • 如果你是传统的生命科学、社会科学等学科中的研究者/学习者,可以从复杂科学和跨学科研究中获得灵感启发。

  • 如果你是关注前沿研究发现的知识猎手,可获得复杂系统研究对自然和人类世界的最新洞见。

Complexity Express 栏目也是集智俱乐部公众号的主要选题来源,诚挚邀请你订阅,与我们信息同步。

Complexity Express 论文从哪里来?

考虑复杂系统研究往往属于跨学科工作,我们主要抓取综合类和泛物理类/计算机类的顶级期刊,从每周新发表的数百篇论文中精选出与复杂系统相关的论文。

Complexity Express 参考影响因子和学者口碑,选择了如下期刊,每日爬取其论文更新:

  • Nature

  • Science

  • PNAS

  • Nature Communications

  • Science Advances

  • Physics Reports

  • Physical Review Letters

  • Physical Review X

  • Nature Physics

  • Nature Human Behaviour

  • Nature Machine Intelligence

  • Review of Modern Physics

  • Nature Review Physics

  • Nature Computational Science

  • National Science Review

  • 更多期刊持续增补中,欢迎推荐你认为重要的期刊!

如果你在 Complexity Express 中发现了感兴趣的论文,请立刻“点赞”!每周最高赞的论文,集智编辑部将组织专业解读~

Complexity Express 追踪哪些领域?

我们力求兼顾热点追踪与领域覆盖,目前筛选的论文主要集中在如下与复杂性关系密切的领域:

  • 复杂系统基本理论

  • 复杂网络方法及应用

  • 图网络与深度学习

  • 计算机建模与仿真

  • 统计物理与复杂系统

  • 量子计算与量子信息

  • 生态系统、进化、生物物理等

  • 系统生物学与合成生物学

  • 计算神经科学与认知神经科学

  • 计算社会科学与社会经济复杂系统

  • 城市科学与人类行为

  • 科学学

  • 计算流行病学

  • 以及一些领域小众,但有趣的工作

由于复杂性研究领域横跨多个学科,研究论文散落在不同的期刊上,很难不重不漏地把握最新工作。针对复杂性领域的论文筛选,我们专门设计了算法。经过数月的训练迭代优化,目前对上述领域爬取准确率达到90%以上。

将来我们还会根据你的具体研究领域,推出研究分类与个性化的订阅服务,敬请期待!

由于复杂性领域涉及的论文关键词和研究问题纷繁复杂,所以算法难免有不成熟的地方,如果你发现我们有漏掉的重要论文,或者爬到了领域有偏差的论文,欢迎联系我们 (小助手微信:swarmaAI) ,帮助我们持续优化算法。

如果你对科学学、计算术语学等感兴趣并有代码能力,欢迎报名成为集智算法志愿者/实习生 (具体请邮件联系算法组负责人huqiao@swarma.org) 。

如果你对复杂科学及相关跨学科研究有长期兴趣,并乐于解读分享,欢迎加入集智作者团队 (具体请邮件联系编辑部负责人liupeiyuan@swarma.org)

更多论文

更多复杂性顶刊论文,请到Complexity Express页面查看。订阅即可每周获取更新提醒。