今天终于拿到了转录组的数据,充满了期待,可是看过数据傻眼了,为啥?

数据那么多,我怎么看?

需要的数据分散在那么多的表格,基因数那么多,怎么做数据合并?

我想要的关键基因怎么筛选?

筛选出来之后还要做数据汇总?

这么多问题到底应该如何破?

问题一:关键基因筛选(通过“关键词”查找)

解决方案:数据“筛选”功能

通过“数据”菜单栏下的“筛选”功能可以对每列实现自动筛选功能,点击在表格第一行右下角的下拉箭头,可以出现文本筛选,输入关键词,即可筛选出感兴趣的关键基因。需要对每列都进行筛选。

问题二:关键基因相关数据整合(整合不同表格中的数据)

解决方案 :Vlookup函数

VLOOKUP是一个查找函数,给定一个查找的目标,它就能从指定的查找区域中查找返回想要查找到的值。所有的测序项目中,数据分析时的基因名称或ID都是唯一的,正好完美地匹配了vlookup函数的要求,以保证数据匹配的唯一性。

它的基本语法为:

=VLOOKUP(查找目标,查找范围,返回值的列数,精确OR模糊查找)

第一个参数(查找目标)必须是数据中的唯一匹配项,如果不唯一,返回值会自动匹配为第一个找到的数据结果;

第二个参数(查找范围)可以在同一个文件,也可以跨文件查找,但必须是以包含第一个参数的利作为起始列,可以选择列,也可以选择固定区域;

第三个参数(返回值的列数)必须是整数,是待匹配数据在查找范围区域的第几列;

第四个参数(精确OR模糊查找),精确即完全一样,模糊即包含的意思,小编通常默认为0.

匹配上第一个数后,选中该单元格,待右下角出现“+”时,双击或下拉即可完成所有数据的匹配项。

问题三:关键基因数据汇总(数据汇总统计)

解决方案:1、数据透视表(简单)

2、函数:countif sumif (难度高)

3、函数:数据“筛选”功能(简单+模糊搜索)

1、数据透视表(简单)

Excel自带的智能数据统计功能,掌握这一技能足以让你在数据分析中事半功倍。该功能嵌入在“插入”菜单下的“数据透视表”,可以选择一个sheet下分析,也可以选择新建工作表进行分析,因测序数据一般涉及的数据较多,很难一个页面全部展现,因此推荐在新建的工作表中进行。

具体操作如下:

操作时仅需要将右上方的字段拖拽到下方的表格内即可,可以选择合适的展现形式,一般是对基因id的计数居多。如果是对数据做求和计算,可以通过点击“Σ值”里面的选项后面的箭头进行设置,如下:

该项统计只支持精确统计,必须完全匹配,若有空格或字符数字的差异均采用不同的项进行计数。

2、函数:countif sumif (难度高)

Countif是指对指定条件的单元格进行计数(单条件计数),语法如下:

=COUNTIF(range,criteria)

参数range 表示条件区域——对单元格进行计数的区域。

参数criteria 表示条件——条件的形式可以是数字、表达式或文本,甚至可以使用通配符。

Sumif是条件求和函数,语法如下:

=SUMIF(range,criteria,sum_range)

参数:Range为条件区域,用于条件判断的单元格区域。

参数:Criteria是求和条件,由数字、逻辑表达式等组成的判定条件。

参数:Sum_range 为实际求和区域,需要求和的单元格、区域或引用。

注:因篇幅有限,在此不再详细举例,若有需要可以给小编留言或约稿。

3、函数:数据“筛选”功能(简单+模糊搜索)

操作方法同第一个问题的解决方案,支持计数功能,统计数量在excel的底部,如图。

今天的excel技能介绍受到篇幅限制,若有问题可以跟“表姐”约哦~~表姐这么用心,喜欢的就赶紧转发啦~~