有了DeepSeek,现在分析芯片数据、常规转录和单细胞转录组数据,越来越容易!果友在分析GSE23475的时候,发现只能拿到芯片的表达数据和分组信息,但是无法获得探针信息,也就是说,无法通过常用的办法获得基因名称。我们做了下尝试。

打开网易新闻 查看精彩图片

这是韩国人2011年一篇文献里的胃癌数据,总共26个样本。由于探针平台GPL10982没有提供探针和基因对应关系的信息,导致基因信息无法获取。韦恩图、热图和表格展示胃癌肿瘤组织和对照组织中的差异基因。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

我们用UCSC网站上的参比注释文件,获得了基因信息,做了差异分析。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

有些差异基因是跟文献对应的,有的不匹配。主要是参比文献有些过时。这种情况下,反过来做似乎更好,那就是先做差异分析,然后将差异基因的ID信息与参比文件做比对。这样得到的差异基因应该更多!这种方法在GEO官网上即可实现——GEO2R。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

最后下载差异基因列表,进行ID转换,也是办法。不过,还是需要探针ID转换。参比文件在UCSC官网:http://hgdownload.soe.ucsc.edu/goldenPath/hg38/database/

打开网易新闻 查看精彩图片