近几年,在NCBI上看到越来越多生信分析类的文章被刊登了,所以这类文章越来越受国内外喜爱。为什么呢?

第一:一般来说,影响因子5分以内的杂志逐渐接纳生信分析类文章。

第二:生信分析类文章逐渐被很多高等院校接纳,甚至跟基础研究论文同一层次。

第三:生信分析类的文章思路可以天马行空,可以紧贴着目前研究最火热的组学,例如基因组学、转录组学、蛋白质组学、代谢组学等等。

第四:生信文章所采用的数据图有各种各样,颜色鲜艳,可视化高,方便分析,例如热图、曼哈顿图、火山图、韦恩图、网络图等等。

第五:由于每个课题组应不只有一种思路,只是因为资源和精力有限,故使得其余不同思路不能得到充分的实验验证。所以生信分析的构思可从大数据角度总体概括自己课题组的研究方向。

近5年(2014年至2019年),小编根据数据库“TGCA”为关键词检索了在pubmed中收录的文章。

当中,TGCA数据库中,有5744篇生信类文章被pubmed收录。而在2008年至2013年期刊,只有323篇生信文章被收录。

从数据中看出,近五年来,越来越多国内外科学家都青睐挖掘二手数据去撰写SCI。

小编整理了部分“不做实验 只挖掘数据”的SCI期刊:

杂志名称

发文数量

Mol Med Rep

33

Oncol Lett

20

Bioinformatics

16

Oncol Rep

13

Med Sci Monit

12

Exp Ther Med

11

BMC Bioinformatics

11

J Cell Biochem

11

Scientific Report

11

Cell

4

EPIGENOMICS

1

HUM REPROD

1

MOL ONCOL

3

CELL PHYSICAL BIOCHEM

11

INT J CANCER

9

CELL rep

10

genome med

5

(截止2018年12月)

小编最近检索了不同杂志刊登的生信SCI,大概可以分为3类:

1. 纯生信分析:多为肿瘤相关的生信分析(如局部器官的肿瘤)。

2. 传统实验+生信:某分子的预后意义研究,验证分子的功能和机制。

3. 从数据库中挖掘数据:从数据库中检索差异基因、功能解析等等。

数据挖掘小百科

数据挖掘是一种决策支持过程,它主要基于统计学、数据库、可视化技术等,高度自动化地分析企业的数据,作出归纳性的推理。知识发现过程由以下三个阶段组成:①数据准备;②数据挖掘;③结果表达和解释。

数据挖掘是通过分析每个数据,从大量数据中寻找其规律的技术,主要有:

1. 数据准备是从相关的数据源中选取所需的数据并整合成用于数据挖掘的数据集;

2. 规律寻找是用某种方法将数据集所含的规律找出来;

3. 规律表示是尽可能以用户可理解的方式(如可视化)将找出的规律表示出来。

数据挖掘的任务有关联分析、聚类分析、分类分析、异常分析、特异群组分析和演变分析等。

END