基因ID转换
基因ID转换
泡泡写在前面的话:
基因ID在不同的生信软件和数据库中有不同的命名规则。因此,将基因ID进行转换是必备的生信技能。此文章主要介绍几个常用的基因ID转换网站及R包转换工具
BioMart工具
BioMart 是 Ensembl 网站提供的一个 web 工具。他的主要功能是进行基因功能的注释和跨数据库注释,还有就是基因ID的转换。
选择数据库和数据集
输入ID类型及基因集
限制一次500个ID转换
选择输出基因ID类型
注:查看数据基因ID信息
输出结果
BioDBnet
biological DataBase network,一个集成了大量生物数据库的应用程序,比如Gene, UniProt, Ensembl, GO等,由ABCC进行维护。它实际上包括多个应用程序,如dbWork,dbFind等。主要功能包括基因ID转换,基因功能注释,基因信息查找,还可以将基因ID转换成其他物种的同源基因ID等。
选择输入和输出ID类型
输入物种Taxon ID
输入数据集并提交结果
结果查看
BioDBnet其他工具
dbWalk
适用于需要转换为多种ID类型
dbFind
自动识别输入的基因ID类型,并转换为统一ID类型
DAVID
打开官网,选择基因ID转换工具
上传基因List
填写选项
结果查看
Uniprot
选择ID mapping
根据需求输入信息
选择Reviewed
结果查看和下载
使用R包进行转换
1
2
3
4
5
6
7library("clusterProfiler")
library("org.Bt.eg.db") # 根据物种选择不同的物种基因注释包
gene_name <- bitr(sig_rna$ENSEMBLTRANS, # 输入数据集
fromType = "ENSEMBLTRANS", # 输入ID类型
toType = c("SYMBOL"), # 输出ID类型
OrgDb = org.Bt.eg.db) # 物种ID数据包
1
keytypes(org.Bt.eg.db)
[1] “ACCNUM” “ALIAS” “ENSEMBL”
[4] “ENSEMBLPROT” “ENSEMBLTRANS” “ENTREZID”
[7] “ENZYME” “EVIDENCE” “EVIDENCEALL”
[10] “GENENAME” “GENETYPE” “GO”
[13] “GOALL” “IPI” “ONTOLOGY”
[16] “ONTOLOGYALL” “PATH” “PFAM”
[19] “PMID” “PROSITE” “REFSEQ”
[22] “SYMBOL” “UNIPROT”