你大概见过无数次这样的标题“每天喝咖啡,癌症风险降低20%!""多吃西兰花,肠癌风险下降17%!"看起来言之凿凿,仿佛背后有一张精确的统计报表。你有没有想过这样的数据是怎么得到的?

打开网易新闻 查看精彩图片

其实这些数据的核心都是对照和实验组的实验。就看你拿什么做对照了,是处理的,还是没处理的之类的。今天从三部分来和大家聊聊这个问题。

01,科学依据是什么?

01,科学依据是什么?

一般情况下,对某个疾病是否有效,通常是看对这个疾病影响。比如,治愈了,或者降低了之类的。但是,如果多个样本,那么如何确定是否有影响?

打开网易新闻 查看精彩图片

这个时候,需要统计学来出现了。比如甲乙组各50个人,甲组抽烟,10个肺癌,乙组不抽烟,5个肺癌,甲组概率是0.2,乙组是0.1,很明显,抽烟导致肺癌发病率上升。

但是有的时候,有些没有这么明显。比如癌症治疗后,生存期差别就很大。这个时候就需要借助各种统计方法去解读了,比如p值<0.05 啊之类的。

02,数据如何得到的?

02,数据如何得到的?

一般分为三个层面

第一个层面:基因证明/细胞实验。常见的一些癌症指标啊,比如基因表达差异,癌细胞的生长速度变化,癌细胞的迁移能力,癌细胞的侵袭能力,癌细胞的凋亡之类等等,这类文章。

就像这种图,处理和不处理,差别明显

第二个层面:模式动物。

常见是小鼠啊,线虫啊之类的。

打开网易新闻 查看精彩图片

一般是做小鼠成瘤实验以及一堆基因的巴拉巴拉检测。

比如这个,左边是没处理的,右边是处理的,明显有差别。

打开网易新闻 查看精彩图片

第三种是人群数据。人群数据就是本答案里诸多答主提到的,发病率,死亡率,生存率之类的。

有各种做法,比如我曾经写过一篇关于身边认识的医护人员(尤其是医生)得癌症/恶性肿瘤越来越多的回答,就是人群数据。这是一个农村城市的比较。

打开网易新闻 查看精彩图片

肺癌(lung),城市发病率明显高于农村(445vs288),考虑到城市和农村吸烟率基本一致(城市17.5%,农村19.2%,),我认为,空气质量应该是非常关键的因素

食管癌(esophagus)和胃癌(stomach),农村发病率明显高于城市发病率(食管癌364vs113;胃癌444vs235),这说明,在饮食方面,农村出现了非常大的问题。我想,这有可能是农村营养问题,以及饮食结构问题,比如腌制类食物的大量摄入,以及剩饭剩菜的问题。还有饮食卫生问题。

结肠癌城市发病明显高于农村(263vs113),结肠癌的主要原因是高脂肪食谱和纤维素摄入不足。这也就是说,城市人在饮食结构方面,似乎也不是那么健康,尤其是纤维类摄入,所以,要多吃蔬菜粗粮和水果哇!

03,存在哪些问题?

03,存在哪些问题?

看起来好像挺给力的,然而, 问题总是存在的。

第一,动物实验不能在人身上验证

这个例子太多了, 很多药物都死在这里了。在细胞好好地,在小鼠也是1024,结果到了人身上,卵用。

第二,人群差异

这种对于做人群的研究,非常恼火。一个东西在A人群中存在,却在其他人群中不存在。无论是基因突变还是药物,都面临这个问题。

第三,对于绝大多数保健品,其实都是一个因果不成立问题。

比如,夏天人们爱吃西瓜,夏天人们容易淹死。你单纯看的话,吃西瓜会导致人被淹死。bullshit!

第四,统计数据作假。我就以ca cancer这篇文章来举例。

打开网易新闻 查看精彩图片

1,在某城市推广某饮料,对应农村不推广。然后发现,哇,城市的食道癌数量明显低于农村。

扯淡:就是不喝这个饮料,城市的食道癌比农村也低。

2,给女性用某种治疗仪,男性不用。(养生领域,女性是重灾区)发现女性得肺癌症少。

扯淡:女性得肺癌比例本来就低于男性。而且女性长寿这是世界现象。

3,数据故意处理夸大。比如下图是我随手做的一个图,左右其实是同一个数据,都是9.6,9.7,9.8,9.9。结果你调一下坐标轴,一下子就不一样了。

打开网易新闻 查看精彩图片

over。