想做单细胞测序、T2T基因组、群体GWAS等分析,怕看不懂数据,0基础自学又怕学不会,一直没行动?别愁啦!组学大讲堂VIP来破局!
0基础学习,免软件安装一键分析。1对1的VIP售后答疑,边学边练易上手,助你高效发文章。时值618活动,优惠更多,更具性价比!
iTOL(Interactive Tree Of Life)作为专业的进化树在线可视化工具,能够高效实现进化树的展示、注释与管理,且支持批量化操作流程。今天将重点为大家解析通过数据集方式进行进化树美化注释的具体操作路径。iTOL官方网址为:https://itol.embl.de/ ,接下来将从数据准备到可视化呈现的全流程展开说明。
iTOL工具的工作流程:
1. 完成树文件上传:可选择将文件上传至个人iTOL账户,或直接通过临时游客账户进行操作;
2. 执行基础格式调整:在用户界面中对进化树的显示样式进行简易修改;
3. 添加进阶注释内容:为进化树补充颜色、线条样式等可视化元素,或接入热图、条形图等多元数据集实现深度标注;
4. 完成成果导出:支持将美化后的进化树图像导出保存。若需在账户中永久存储优化结果,需订阅付费服务。
这里介绍如何使用 不同类型的数据集文件实现进化树的注释与美化。除了直接使用 iTOL 官网提供的注释模板文件外,还能通过 Web 数据集编辑器或 iTOL 注释编辑器自主创建数据集,以此完成对进化树的个性化标注与视觉优化。
注释模板文件介绍:
注释模板文件的获取途径有两种,既可以前往iTOL官方帮助文档中进行下载,也能够直接点击链接https://itol.embl.de/help/templates.zip来获取。
在下载得到的压缩包内,涵盖了官方所提供的全部注释模板文件,而且每个模板文件都附有相应的注释内容以及详细说明,每一个模板文件其实就对应着一种注释类型。 倘若大家想要查看所有注释模板的参考说明,那么在帮助文档的Dataset types【1】部分就能找到。同时,大家还可以浏览页面最右侧的图形化注释【2】,这样就能快速定位到自己心仪的模板文件。在此基础上,便可以有针对性地去下载所需的模板文件【3】,之后参照这些模板文件来精心准备属于自己的进化树注释文件。
注释模板的结构具体如下:
文件里凡是以#号开头的行均为注释行,无需进行修改。
除注释行外,第一行用于标明注释类型;
第二行的SEPARATOR需选择分隔符,其中TAB表示用Tab键分隔文件中的字段字符,SPACE是空格,COMMA为逗号;
接下来会有一些必需选项,像DATASET_LABEL和COLOR等,还有其他可选选项。由于大多数选项在上传数据集后可在控制面板中调整,因此在文件中可先将其用#号注释掉;
最后,在DATA关键字行下面的内容,是与每个树节点相关联的数据,这部分是我们编写时需要重点关注的地方。
示例数据美化实操:
进化树文件上传:
((((((((((AtMYB61:0.07988625,BolMYB8:0.05987569)1.0000:0.11946783,BolMYB13:0.11926664)0.6010:0.02446539,AtMYB50:0.11536564)0.3320:0.00829079,zmaMYB7:0.17992518)0.0890:0.00375450,AtMYB55:0.21539749)0.1930:0.01224049,(AtMYB86:0.07470594,BolMYB14:0.07770106)1.0000:0.14055796)0.2140:0.01156843,(zmaMYB2:0.16850593,zmaMYB6:0.00000000)0.7280:0.02731101)0.8770:0.03349085,(zmaMYB1:0.16452870,zmaMYB5:0.23527067)0.9990:0.09661320)0.5960:0.02588022,((((AtMYB103:0.05532632,BolMYB16:0.05528355)0.6150:0.00986085,BolMYB15:0.06616439)1.0000:0.12964698,OsMYB6:0.17911683)1.0000:0.15566452,(((AtMYB26:0.02847939,BolMYB2:0.03682571)1.0000:0.20282076,OsMYB1:0.24538965)0.5240:0.00954725,(OsMYB5:0.23944215,(AtMYB67:0.13062810,(BolMYB3:0.05688692,BolMYB9:0.03674868)1.0000:0.08381493)1.0000:0.12205113)0.9420:0.04837477)0.7710:0.02443667)0.8210:0.03328129)0.5410:0.01689425,(((AtMYB83:0.06005315,BolMYB10:0.06097349)0.8740:0.02269515,BolMYB7:0.09705912)1.0000:0.22935560,(OsMYB7:0.26954818,(AtMYB46:0.05292072,(BolMYB5:0.05352299,(BolMYB4:0.02802713,BolMYB17:0.02539804)0.6760:0.01048102)0.5920:0.00845394)1.0000:0.19871225)0.6590:0.02065747)0.9950:0.08660004,((((OsMYB3:0.15529045,zmaMYB4:0.12627539)0.9910:0.06007852,OsMYB4:0.22725828)0.8820:0.03010027,(OsMYB2:0.18109386,zmaMYB3:0.15301431)0.9870:0.07189282)1.0000:0.09929757,((AtMYB45:0.16844357,BolMYB12:0.17156432)1.0000:0.16072820,((AtMYB19:0.12668337,BolMYB6:0.11915159)0.8670:0.03445226,(BolMYB1:0.07829919,(AtMYB18:0.08572864,BolMYB11:0.11350939)0.4450:0.00559551)0.9990:0.09508192)0.9990:0.09857062)0.9780:0.05998442)0.9890:0.06825096);可在控制面板中对进化树执行基础设置操作,相关操作指南可查阅本文获取:
在完成对进化树的形状、标签字体、进化枝粗细以及Bootstrap值等方面的相应设置后,呈现效果如下图所示:
进行数据集美化注释:
1、针对标签以及进化枝的颜色和样式展开设置(可参考 colors_styles_template.txt 文件)。倘若想要对某一支进行注释,却又没有该支节点的 ID 时,可选取这一支最外侧的两个叶标签来指代,且使用 “|” 或者 “---” 作为分隔这两个标签的符号。
TREE_COLORS #数据类型
SEPARATOR TAB #文件分隔符
DATA #美化数据
#第一列为label ID,第二列代表整个clade分支为操作范围,第三列为颜色,第四列进化树线型,第五列为宽度
BolMYB7|BolMYB4 clade #cb73cb normal 5
zmaMYB3|AtMYB18 clade #e46a6a normal 5
OsMYB6|BolMYB3 clade #e8905c normal 5
zmaMYB5|AtMYB61 clade #e8d45c normal 5
#第一列为label ID,第二列为设置颜色范围,第三列为颜色,第四列为图例标签
BolMYB7|BolMYB4 range #cb73cb A
zmaMYB3|AtMYB18 range #e46a6a B
OsMYB6|BolMYB3 range #e8905c C
zmaMYB5|AtMYB61 range #e8d45c D2、针对不同来源的数据标记不同的maker(可参考dataset_binary_template.txt文件):需要注意的是,不同的maker应当分别准备在不同的文件当中,这里以At物种基因为例来进行说明。
DATASET_BINARY #数据类型
SEPARATOR COMMA #文件分隔符
DATASET_LABEL,AtMYB #图例标签
COLOR,#ff0000 #maker颜色,支持16进制颜色
FIELD_SHAPES,1 #maker形状,1正方形2圆形3星形4左三角5右三角6对勾√形
FIELD_LABELS,f1 #maker标签
HEIGHT_FACTOR,0.5 #maker大小
DATA #美化数据
#第一列为label,第二列1全显0只显示图形边框-1隐藏图形
AtMYB86,1
AtMYB55,1
AtMYB61,1
AtMYB50,1
AtMYB26,1
AtMYB67,1
AtMYB103,1
AtMYB83,1
AtMYB46,1
AtMYB45,1
AtMYB19,1
AtMYB18,13、依据进化枝来进行分组,并添加相应的分组条带(可参照dataset_color_strip_template.txt文件)。
DATASET_COLORSTRIP #数据类型
SEPARATOR COMMA #文件分隔符
DATASET_LABEL,circos #图例标签
DATA #美化数据
#第一列为label ID,第二列为条带颜色
BolMYB7|BolMYB4,#cb73cb
zmaMYB3|AtMYB18,#e46a6a
OsMYB6|BolMYB3,#e8905c
zmaMYB5|AtMYB61,#e8d45c4、为已有的分组添加上相应的标签(可参考dataset_text_template.txt文件)。
DATASET_TEXT
SEPARATOR COMMA
DATASET_LABEL,circos_lable
DATA
#第一列为标签在圆外周上位置,第二列为标签,第三列标签在圆半径坐标上的位置,第四列为颜色,第五列为字体形状,第六列为字体大小,第七列为旋转角度
OsMYB7,groupA,-1,#000000,bold,2,0
AtMYB45,groupB,-1,#000000,bold,2,0
BolMYB2,groupC,-1,#000000,bold,2,0
AtMYB86,groupD,-1,#000000,bold,2,0至此,我们已经成功获得了期望中的美化最终结果。 如果后续想要对某些参数进行调整的话,有两种操作方式可供选择:
其一,可点击图例中的数据label(1),接着便能在操作面板里针对相应的参数进行调节(2);
其二,还可以点击Raw data(3),通过这种方式对刚才上传的文件内容进行修改完善。
iTOL这一工具具备十分强大的功能,不过与之对应的是,其所涉及的数据类型文件数量众多。
倘若我们期望开展多种美化操作,甚至是将其与条形图、热图、结构域等元素相结合,那么准备相关文件往往会耗费大量的时间。 鉴于此,在这里要给大家介绍一款R包——itol.toolkit,它能够助力大家更为高效快捷地生成iTOL所需的配置文件。具体配置方法可以参考文章:
让知识分享更顺畅
点击下方图片直达精品合集,发现更多知识
组学大讲堂致力于基因组学、转录组学、蛋白质组学、代谢组学等组学知识及生信技能的传播,让知识分享更顺畅!
测序、数据分析、课程培训等事宜请联系邮箱:Tech@biomics.com.cn
听说点在看会发大文章
热门跟贴