Genbank库里的数据按来源于约55,000个物种,其中56%是人类的基因组序列(所有序列中的34%是人类的EST序列)。每条Genbank数据记录包含了对序列的简要描述,它的科学命名,物种分类名称,参考文献,序列特征表,以及序列本身。序列特征表里包含对序列生物学特征注释如:编码区、转录单元、重复区域、突变位点或修饰位点等。所有数据记录被划分在若干个文件里,如细菌类、病毒类、灵长类、啮齿类,以及EST数据、基因组测序数据、大规模基因组序列数据等16类,其中EST数据等又被各自分成若干个文件。
Entrez的网址是:http://www.ncbi.nlm.nih.gov/entrez/
BankIt的网址是:http://www.ncbi.nlm.nih.gov/BankIt
Sequin的相关网址是:http://www.ncbi.nlm.nih.gov/Sequin/
DDBJ的网址是:http://www.ddbj.nig.ac.jp/
<section style="margin: 10px; padding: 0px; max-width: 100%; color: rgb(51, 51, 51); font-family: -apple-system-font, BlinkMacSystemFont, " helvetica="" neue",="" "pingfang="" sc",="" "hiragino="" sans="" gb",="" "microsoft="" yahei="" ui",="" yahei",="" arial,="" sans-serif;="" min-height:="" 1em;="" font-size:="" 16px;="" letter-spacing:="" 2px;="" line-height:="" 2em;="" box-sizing:="" border-box="" !important;="" overflow-wrap:="" break-word="" !important;"="">
目前GDB中有:人类基因组区域(包括基因、克隆、amplimers PCR 标记、断点breakpoints、细胞遗传标记cytogenetic markers、易碎位点fragile sites、EST序列、综合区域syndromic regions、contigs和重复序列);人类基因组图谱(包括细胞遗传图谱、连接图谱、放射性杂交图谱、content contig图谱和综合图谱等);人类基因组内的变异(包括突变和多态性,加上等位基因频率数据)。GDB数据库以对象模型来保存数据,提供基于Web的数据对象检索服务,用户可以搜索各种类型的对象,并以图形方式观看基因组图谱。
GDB的网址是:http://www.gdb.org
GDB的国内镜像是:http://gdb.pku.edu.cn/gdb/