4月16日,同济大学在校内新闻网发表情况说明,全文如下——
针对近日网络上对我校教师王某发表的相关论文数据存疑的反映,学校高度重视,已成立调查组,启动调查程序。
学校一贯对学术不端行为秉持“零容忍”态度,将根据调查情况严肃认真处理。
感谢社会各界的关心与监督。
2026年4月16日
事件回顾:
近日,有博主曝光同济大学某教授花费上百万经费发表在国际顶刊Nature的论文,出现多处糊弄的造假 ...
今日,饶毅教授(在其公众号)发声:“ 中国科学界,从来无人认错,多位校长就死不认错,不认错的就在最近还可以升校长副校长,死不认错以前多位院士、最近还当选院士,死不认错是江湖颠扑不破的成功之路,教授学生千万别怂 - 耿同学说王P教授参选院士是痴心妄想(大意),这就要批评耿同学了:是你不懂科学院的标准,你才是十足的外行!科学院以学术为唯一标准、以学术为最高标准的日子早就过时了,在耿同学出生前就过时了。”
以下全部是转发:
这篇论文来自2024年发表的Nature顶刊,来自同济大学某教授团队完成,近期论文图片重复,数据严重造假等质疑问题引起热议。
论文信息
标题:Human HDAC6 senses valine abundancy to regulate DNA damage
作者:Jiali Jin, Tong Meng, Yuanyuan Yu, Shuheng Wu, Chen-Chen Jiao, Sihui Song, Ya-Xu Li, Yu Zhang, Yuan-Yuan Zhao, Xinran Li, Zixin Wang, Yu-Fan Liu, Runzhi Huang, Jieling Qin, Yihua Chen, Hao Cao, Xiao Tan, Xin Ge, Cong Jiang, Jianhuang Xue, Jian Yuan, Dianqing Wu, Wei Wu, Ci-Zhong Jiang, Ping Wang
期刊:Nature
DOI:10.1038/s41586-024-08248-5
发表日期:2025 Jan
质疑内容
1 Corallium abyssale
comment accepted June 2025
意外的重叠区域。我添加了彩色的形状来显示我的意思。请作者们检查并评论一下。
2 Corallium abyssale
comment accepted June 2025
The other two fugures is the same, but different experiment.
3 Jiali Jin (作者回复)
comment accepted June 2025
abyssale,感谢您指出我们论文中的错误。我们真诚地为疏忽道歉,并已联系编辑更正错误,以纠正该特定面板的错位
Jiali Jin and Ping Wang
4 Idas washingtonia
comment accepted June 2025
研究对氨基酸缺乏的反应是困难的。在图4c中,通过计算每个视野中γ H2AX阳性细胞的百分比来估计由缬氨酸缺乏诱导的DNA损伤。根据图例,每个条件检查35个视场。因此,源数据中的每列包含35个值。有一个区域的第二个小数位都是4(黄色)。对于许多值,绿色和蓝色列的第二个小数位为5。为什么?
5 Idas washingtonia
comment accepted June 2025
图4c(也参见注释):向shHDAC 6 VR(24 h)柱中的每个γ H2AX阳性细胞百分比添加0.3%产生VR(0 h)柱中的相邻百分比。类似地,将每个黄色百分比加上2.15%会产生相应的蓝色百分比。似乎还有其他类似的关系。怎么会这样?
6Jiali Jin(作者回复)
comment accepted June 2025
尊敬的david,感谢您的提问,并为延迟回复表示歉意。使用Gen5软件进行γH2AX灶的定量。“数据缩减”功能用于从整个图像中提取统计信息。基于软件分析的数据,我们计算了包含病灶的细胞核占细胞核总数的百分比。为方便起见,我们在下面粘贴了原始数据,以说明分析是如何进行的。
7 Idas washingtonia
comment accepted March 2026
Thank you for your reply.
图4c:即使软件的分析表明了这一点,我们能相信它吗?shHDAC 6的0小时和24小时数据点的分布几乎相同-事实上,如,所有数据点相差0.3。
8 Yong‐Chang Zhou
comment accepted April 2026
很有意思作者对此有何评论?
9 Yong‐Chang Zhou
comment accepted April 2026
在图4f中,有一些数据显示了一个规则的模式。作者对此有何评论?
10 Jiali Jin(作者回复)
comment accepted April 2026
亲爱的Idas washingtonia,感谢您对我们研究数据的关注和周到的问题。我们非常感谢有机会进一步详细澄清量化方法。为了定量肿瘤中γ H2 AX foci阳性细胞的百分比,检查每个肿瘤的至少三个非连续切片,所述非连续切片获自注射有稳定过表达或敲除HDAC 6的HCT 116细胞的裸鼠。考虑到肿瘤区域的细胞分布不均匀,选择细胞密度相对较低(100~500个细胞)和细胞密度较高(500~10000个细胞)的区域进行分析。每个切片至少计数3个显微镜视野。使用Gen 5软件(Chloe C Lepage等人,Cells,2020; Felicite K Noubissi et al.,Sci Rep,2021),遵循Agilent官方应用指南(γ H2 AX病灶的自动成像和双掩模斑点计数以确定单个细胞基础上的DNA损伤)。“数据缩减”功能用于根据软件分析的数据从整个图像中提取统计信息。如前所述,根据公式(γ H2 AX foci阳性细胞/核× 100)计算γ H2 AX foci阳性细胞的比例(Michael-Christopher Keogh等人,Nature,2005; Haipeng Liu等人,Nature,2018; Simon Gemble等人,Nature,2022.)。鉴于该软件的广泛应用,认为该软件的分析是可靠的。为方便起见,我们在下文中纳入了原始数据,以说明如何进行分析。 关于您深思熟虑的观察结果“shHDAC 6的0小时和24小时数据点的分布几乎相同”,我们分别分析了总细胞计数和γH2AX灶计数,并根据公式进行了计算。我们希望这些澄清有助于解决您的担忧。再次感谢您的时间和善意的关注。
11 Jiali Jin(作者回复)
comment accepted April 2026
-Chang Zhou,感谢您对我们研究数据的关注和周到的问题。我们非常感谢有机会进一步详细澄清量化方法。为了定量肿瘤中γ H2 AX foci阳性细胞的百分比,检查每个肿瘤的至少三个非连续切片,所述非连续切片获自注射有稳定过表达或敲除HDAC 6的HCT 116细胞的裸鼠。考虑到肿瘤区域的细胞分布不均匀,选择细胞密度相对较低(100~500个细胞)和细胞密度较高(500~10000个细胞)的区域进行分析。每个切片至少计数3个显微镜视野。使用Gen 5软件(Chloe C Lepage等人,Cells,2020; Felicite K Noubissi et al.,Sci Rep,2021),遵循Agilent官方应用指南(γ H2 AX病灶的自动成像和双掩模斑点计数以确定单个细胞基础上的DNA损伤)。“数据缩减”功能用于根据软件分析的数据从整个图像中提取统计信息。如前所述,根据公式(γ H2 AX foci阳性细胞/核× 100)计算γ H2 AX foci阳性细胞的比例(Michael-Christopher Keogh等人,Nature,2005; Haipeng Liu等人,Nature,2018; Simon Gemble等人,Nature,2022.)。使用Gen 5软件对所有数据进行计数,随后使用上述公式在Microsoft Excel中进行计算。鉴于上述方法的广泛应用,分析和结果被认为是可靠的。为方便起见,我们在下文中纳入了原始数据,以说明如何进行分析。 我们希望这些澄清有助于解决您的担忧。再次感谢您的时间和善意的关注。
12 Jiali Jin(作者回复)
comment accepted April 2026
-Chang Zhou,感谢您对我们研究数据的关注和周到的问题。我们非常感谢有机会进一步详细澄清量化方法。为了定量肿瘤中γ H2 AX foci阳性细胞的百分比,检查每个肿瘤的至少三个非连续切片,所述非连续切片获自注射有稳定过表达或敲除HDAC 6的HCT 116细胞的裸鼠。考虑到肿瘤区域的细胞分布不均匀,选择细胞密度相对较低(100~500个细胞)和细胞密度较高(500~10000个细胞)的区域进行分析。每个切片至少计数3个显微镜视野。使用Gen 5软件(Chloe C Lepage等人,Cells,2020; Felicite K Noubissi et al.,Sci Rep,2021),遵循Agilent官方应用指南(γ H2 AX病灶的自动成像和双掩模斑点计数以确定单个细胞基础上的DNA损伤)。“数据缩减”功能用于根据软件分析的数据从整个图像中提取统计信息。如前所述,根据公式(γ H2 AX foci阳性细胞/核× 100)计算γ H2 AX foci阳性细胞的比例(Michael-Christopher Keogh等人,Nature,2005; Haipeng Liu等人,Nature,2018; Simon Gemble等人,Nature,2022.)。使用Gen 5软件对所有数据进行计数,随后使用上述公式在Microsoft Excel中进行计算。鉴于上述方法的广泛应用,分析和结果被认为是可靠的。为方便起见,我们在下文中纳入了原始数据,以说明如何进行分析。 我们希望这些澄清有助于解决您的担忧。再次感谢您的时间和善意的关注。
13 Maarten Van Kampen
comment accepted April 2026
Introduction
May and June 2025 a number of issues were reported for this paper:
荧光图像重叠
不可能的数字数据
该论文于2025年7月更正。然而,作者仅解决了图像重叠。在我看来,数据的问题要糟糕得多,而且大多与捏造相符。
Impossible data
注释、。第一作者只是通过提供更详细但仍然不可能的原始数据来回应这一点
在下面,我将只关注:图4(c)中的两个测量系列之间的差异对于所有35行测量数据来说正好是0.3%。
shHDAC6(24 h) = hHDAC6(0 h) - 0.3%.
在文章的底部,我附上了第一作者在。
作者多次解释说,数值代表表达某种标志物的细胞百分比。在至少三个非连续切片上进行细胞计数,并且每个切片至少计数三个显微镜视野。从作者的原始数据中,我们可以看到这种分析是在每个显微镜视野100到10,000个细胞之间的任何地方进行的。在0 h和24 h计数的细胞总数之间没有逐行相关性。尽管如此,阳性细胞百分比的差异正好是0.3%,并且可以看到一些奇怪的模式:
主要的问题是:上述情况发生的可能性有多大。我对我的分析还不完全满意。尽管如此,我还是得到了小于十分之一的概率 2222 。这是这篇论文中最重要的发现。它也表明结果是假的。
Probability calculation
作者提供的原始shHDAC 6数据显示,每行的0 h和24 h值之间的差异恰好为0.3%。通过观察产生这种差异的组合,人们已经可以感觉到这是多么不可能。坐第四排。在0小时,作者共计数250个细胞,发现3个阳性细胞。在24小时,他们计数了1000个细胞,发现9个阳性。分数差异为3/250 - 9/250 = 0.3%。人们可以搜索其他组合,给出这个确切的差异:
这已经给了一个直观的感觉,这一定是多么罕见:在1000小时的集合中有许多“禁止”的正计数。事实上,有许多总细胞计数组合甚至不能产生0.3%的差异(100-100,100-200,100-500,100-1250,200-200,500-500,500-1250,...)。由于运气不好,作者碰巧错过了这些组合,这将使他们无法找到0.3%的差异。
我对概率进行了数值分析,发现两个数据集之间阳性细胞比例的差异为0.3%。第一数据集总共有N个单元格,第二数据集有M个单元格。如上所示,只有有限数量的组合(n,m)导致n/N-m/M = 0.3%。分析开始于枚举给出期望的0.3%差异的所有(n,m)对。
在下一步中,计算绘制这些对中的任何一个的概率。在N次尝试中找到n次成功的概率由二项式概率质量函数给出:
f(n, N, p_1) = (Nn)p1n(1−p1)N−n(nN)p1n(1−p1)N−n
我们知道n和N,但p1并不确切知道。这同样适用于我们在M细胞中发现m阳性的第二次抽签,
f(m, M, p_2) = (Mm)p2m(1−p2)M−m(mM)p2m(1−p2)M−m,
其中p 22 并不完全已知。为了解决这种不确定性,我简单地尝试所有有点现实的p 11 -p 22 组合,请参阅此Colab脚本。下面是一个代表性的结果:
该图显示了N=1000和M=200时,发现0.3%差异的概率作为p 11 和p 22 的函数。
当p 11 -p 22 = 0.3%时,该概率最大,这并不奇怪。这是图中的白色线。
事后看来,发现p 11 = 0.3%和p 22 = 0的最大概率为0.224也不足为奇。对于p 22 0,每次将找到0个阳性细胞,因此是无限尖锐的分布。同时,较低的p 11 = 0.003值将给出相当尖锐的分布,因此实际上从1000个细胞中抽取3个阳性细胞的机会很大。最大概率0.224就是 (10003)0.0033(1−0.003)1000−3(31000)0.0033(1−0.003)1000−3 。
不同的N、M总细胞计数组合导致找到0.3%差异的不同最大概率。我检查了作者报告的所有组合。上述22%的概率是找到0.3%差异的最大概率。作者连续35次报告了同样的差异。发生这种情况的可能性是 0.22435=10−230.22435=10−23 。这是一种礼貌的方式说“不可能”。
Caveats
在上面我计算了找到0.3%差异的概率。这是非常具体的:当发现任何其他固定差异时,论文也会被标记。在实践中,第一行用于观察实际差异,并且对于其余34行,检查这些行是否具有完全相同的差异。当最大概率保持为0.22时,这将归结为 0.2234=10−220.2234=10−22 概率。
我检查了0.3%以外的一些差异,确实发现了一些依赖性。发现的最大概率是0.36,导致最多有 0.3634=10−150.3634=10−15 的机会偶然发现这样的序列。这仍然是“零”,也太乐观了,因为仅对(N,M)组合之一发现了更高的概率。作者还总是测量3个或更多个细胞,表明概率方面的最佳p 22 = 0的解决方案是不正确的。
Conclusion
找到35个独立的测量值来显示0.3%的差异是不可能偶然发生的。最重要的是,上面的评论指出了更多的巧合序列。该概述也是不完整的,例如shHDAC 6(24 h)柱也显示出与其shTET 2(0 h)相邻柱的非常有规律的差异。
我认为这些数据是伪造的。
14 Maarten Van Kampen
comment accepted April 2026
再看一下数据,我发现了另一个明显的捏造迹象。而这一个带有非常简单的统计数据,显示它是不可能的水平之一在 10321032 。宇宙的年龄大约是1,所以即使从时间的黎明开始每秒运行一次这些实验,也不会得到这个结果。
在,Yong-Chang Zhou在图4(f)中注意到shNC(0 h)和shTDG(0 h)数据块之间存在令人惊讶的-0.1%的差异。然后,第一作者在:
图4(f)背后的数据更令人惊讶:所列值中没有一个小数点后超过一位(黄色突出显示)。这可能是一个四舍五入的问题,但提交人提供的数据表明情况并非如此。以第一个值0.3%(左上角)为例。在,可以看出,该值对应于总共9000个测量细胞中的27个阳性细胞,因此恰好27/9000= 0.3%的分数。如果作者测量了28个阳性细胞,他将得到0.3111.. %,0.2888. % 26个阳性细胞,找到小数点后最多一位的百分比值的概率取决于测量的细胞数N。下表显示了 nNNn [%],N每列变化,n每行递增。绿色值小数点后最多有一位数字:
“有效”数字以固定的间隔出现。对于N=9000,每9行出现一个有效值,概率约为11%。对于N=4000、2000和1000,这增加到1/4(25%)、1/2(50%)和1/1(100%)。然而,对于N=650,找到“有效”数字也很罕见,1/13(~8%)。
在,第一作者提供了0 h shNC和shTDG组中所有70次测量的n和N。每个报告的百分比在小数点后最多有一位数字。在下表中,我使用总细胞计数 NN 计算每次测量发生这种情况的概率p。对于所有70次测量,在该点后找到不超过一位数的概率是所有单个 pp 值的乘积。这个概率是“零”: 1.5⋅10−321.5⋅10−32 。
这些数据不可能是测量的结果。根据所列出的发表值,报告的总细胞计数 NN 和阳性细胞计数 nn 似乎最有可能是在事后生成的,这些发表值恰好在该点后最多有1位数字。
图4f shNC的数据由作者在
最后一列p是找到小数点后最多一位的 nNNn [%]值的概率。
图4f作者在
15 Maarten Van Kampen
comment accepted April 2026
ImageTwin发现了一些图形装配错误。是的,在这一点上,这应该不再重要了。
图图3(j)和扩展的图5(o)在广泛不同的条件下(0.5/1 μμ g 5fC对1/3 μμ g 5hmC,不相关的柱)共享斑点印迹测定:
使用对比度增强的动画显示背景也是相同的:
扩展数据图2(k):H3和微管蛋白对照共享相同的空图像。
16 Scholtzia involucrata
comment accepted April 2026
正如,从统计学上讲,来自不同/独立实验的数据不可能显示出一对一的相关性。
图4c由Maarten和Yong讨论和分析。此外,当把所有数据绘制成折线图时,图4c中8列中的7列在某种程度上是相关的(见线模式非常相似)。请注意,所有8列数据应来自不同/独立的实验。不可能的
不幸的是,我发现更多:
扩展图5c+图5f,每个第一列应该来自不同的实验,但两组数据是一一相关的,这可能是不可能的。
扩展图6c,不同实验
延伸Fig6m
但最令人震惊的是,就在发送评论之前,我发现我在这条评论中绘制的所有直线曲线都是相关的(共享类似的曲线模式)。
同济大学王平团队的Nature更正后,又遭数值“神巧合”质疑
来源:诚信探索
在2025年5月30日,编辑部首次指出了2024年11月20日,同济大学医学院/附属第十人民医院王平团队在Nature 在线发表题为“Human HDAC6 senses valine abundancy to regulate DNA damage”的研究论文,发现文章内存在4对图片重复使用。
有4对图片重复使用:图E7K-10与E7K-11出现部分重叠,但是代表明显不一样的实验结果;E10E-11与E10E-15出现部分重叠,但是代表明显不一样的实验结果,由于诚信科研获取的是Merge后的图片,发现Merge前E10E-9与E10E-13的图片也出现重叠;E10E-27与E10M-11出现部分重叠,但是代表明显不一样的实验结果;后续有相关的同行上传到了Pubpeer。
在2025年7月25日,作者在Nature 对于我们指出的重复图片进行了更正。
另外,在近期有相关的同行向编辑部反映,图4c的数据存在异常。
参考信息
https://www.nature.com/articles/s41586-025-09409-w
https://www.nature.com/articles/s41586-024-08248-5
https://pubpeer.com/publications/429F23C68462E5C1A09175C3CD8B07
(来源:饶议科学版权属原作者 谨致谢意)
热门跟贴