A. 蛋白质序列数据库包含哪些内容
蛋白质数据库
1. PIR和PSDPIR国际蛋白质序列数据库(PSD)是由蛋白质信息资源(PIR)、慕尼黑蛋白质序列信息中心(MIPS)和日本国际蛋白质序列数据库(JIPID)共同维护的国际上最大的公共蛋白质序列数据库。这是一个全面的、经过注释的、非冗余的蛋白质序列数据库,包含超过142,000条蛋白质序列(至99年9月),其中包括来自几十个完整基因组的蛋白质序列。所有序列数据都经过整理,超过99%的序列已按蛋白质家族分类,一半以上还按蛋白质超家族进行了分类。PSD的注释中还包括对许多序列、结构、基因组和文献数据库的交叉索引,以及数据库内部条目之间的索引,这些内部索引帮助用户在包括复合物、酶-底物相互作用、活化和调控级联和具有共同特征的条目之间方便的检索。每季度都发行一次完整的数据库,每周可以得到更新部分。
PSD数据库有几个辅助数据库,如基于超家族的非冗余库等。PIR提供三类序列搜索服务:基于文本的交互式检索;标准的序列相似性搜索,包括BLAST、FASTA等;结合序列相似性、注释信息和蛋白质家族信息的高级搜索,包括按注释分类的相似性搜索、结构域搜索GeneFIND等。
PIR和PSD的网址是:http://pir.georgetown.e/。
数据库下载地址是:ftp://nbrfa.georgetown.e/pir/。
2. SWISS-PROT
SWISS-PROT是经过注释的蛋白质序列数据库,由欧洲生物信息学研究所(EBI)维护。数据库由蛋白质序列条目构成,每个条目包含蛋白质序列、引用文献信息、分类学信息、注释等,注释中包括蛋白质的功能、转录后修饰、特殊位点和区域、二级结构、四级结构、与其它序列的相似性、序列残缺与疾病的关系、序列变异体和冲突等信息。SWISS-PROT中尽可能减少了冗余序列,并与其它30多个数据建立了交叉引用,其中包括核酸序列库、蛋白质序列库和蛋白质结构库等。
利用序列提取系统(SRS)可以方便地检索SWISS-PROT和其它EBI的数据库。
SWISS-PROT只接受直接测序获得的蛋白质序列,序列提交可以在其Web页面上完成。
SWISS-PROT的网址是:http://www.ebi.ac.uk/swissprot/。
3. PROSITE
PROSITE数据库收集了生物学有显著意义的蛋白质位点和序列模式,并能根据这些位点和模式快速和可靠地鉴别一个未知功能的蛋白质序列应该属于哪一个蛋白质家族。有的情况下,某个蛋白质与已知功能蛋白质的整体序列相似性很低,但由于功能的需要保留了与功能密切相关的序列模式,这样就可能通过PROSITE的搜索找到隐含的功能motif,因此是序列分析的有效工具。PROSITE中涉及的序列模式包括酶的催化位点、配体结合位点、与金属离子结合的残基、二硫键的半胱氨酸、与小分子或其它蛋白质结合的区域等;除了序列模式之外,PROSITE还包括由多序列比对构建的profile,能更敏感地发现序列与profile的相似性。PROSITE的主页上提供各种相关检索服务。
PROSITE的网址是:http://www.expasy.ch/prosite/。
4. PDB
蛋白质数据仓库(PDB)是国际上唯一的生物大分子结构数据档案库,由美国Brookhaven国家实验室建立。PDB收集的数据来源于X光晶体衍射和核磁共振(NMR)的数据,经过整理和确认后存档而成。目前PDB数据库的维护由结构生物信息学研究合作组织(RCSB)负责。RCSB的主服务器和世界各地的镜像服务器提供数据库的检索和下载服务,以及关于PDB数据文件格式和其它文档的说明,PDB数据还可以从发行的光盘获得。使用Rasmol等软件可以在计算机上按PDB文件显示生物大分子的三维结构。
RCSB的PDB数据库网址是:http://www.rcsb.org/pdb/。
5. SCOP
蛋白质结构分类(SCOP)数据库详细描述了已知的蛋白质结构之间的关系。分类基于若干层次:家族,描述相近的进化关系;超家族,描述远源的进化关系;折叠子(fold),描述空间几何结构的关系;折叠类,所有折叠子被归于全α、全β、α/β、α+β和多结构域等几个大类。SCOP还提供一个非冗余的ASTRAIL序列库,这个库通常被用来评估各种序列比对算法。此外,SCOP还提供一个PDB-ISL中介序列库,通过与这个库中序列的两两比对,可以找到与未知结构序列远缘的已知结构序列。
SCOP的网址是:http://scop.mrc-lmb.cam.ac.uk/scop/。
6. COG
蛋白质直系同源簇(COGs)数据库是对细菌、藻类和真核生物的21个完整基因组的编码蛋白,根据系统进化关系分类构建而成。COG库对于预测单个蛋白质的功能和整个新基因组中蛋白质的功能都很有用。利用COGNITOR程序,可以把某个蛋白质与所有COGs中的蛋白质进行比对,并把它归入适当的COG簇。COG库提供了对COG分类数据的检索和查询,基于Web的COGNITOR服务,系统进化模式的查询服务等。
COG库的网址是:http://www.ncbi.nlm.nih.gov/COG。
下载COG库和COGNITOR程序在:ftp://ncbi.nlm.nih.gov/pub/COG。
B. 常用的查询蛋白质结构以及序列的数据库主要有哪些
1. PIR和PSD
PIR国际蛋白质序列数据库(PSD)是由蛋白质信息资源(PIR)、慕尼黑蛋白质序列信息中心(MIPS)和日本国际蛋白质序列数据库(JIPID)共同维护的国际上最大的公共蛋白质序列数据库,可在这里下载。这是一个全面的、经过注释的、非冗余的蛋白质序列数据库,其中包括来自几十个完整基因组的蛋白质序列。所有序列数据都经过整理,超过99%的序列已按蛋白质家族分类,一半以上还按蛋白质超家族进行了分类。PSD的注释中还包括对许多序列、结构、基因组和文献数据库的交叉索引,以及数据库内部条目之间的索引,这些内部索引帮助用户在包括复合物、酶-底物相互作用、活化和调控级联和具有共同特征的条目之间方便的检索。每季度都发行一次完整的数据库,每周可以得到更新部分。
PSD数据库有几个辅助数据库,如基于超家族的非冗余库等。PIR提供三类序列搜索服务:基于文本的交互式检索;标准的序列相似性搜索,包括BLAST、FASTA等;结合序列相似性、注释信息和蛋白质家族信息的高级搜索,包括按注释分类的相似性搜索、结构域搜索GeneFIND等。
2. SWISS-PROT
SWISS-PROT是经过注释的蛋白质序列数据库,由欧洲生物信息学研究所(EBI)维护。数据库由蛋白质序列条目构成,每个条目包含蛋白质序列、引用文献信息、分类学信息、注释等,注释中包括蛋白质的功能、转录后修饰、特殊位点和区域、二级结构、四级结构、与其它序列的相似性、序列残缺与疾病的关系、序列变异体和冲突等信息。SWISS-PROT中尽可能减少了冗余序列,并与其它30多个数据建立了交叉引用,其中包括核酸序列库、蛋白质序列库和蛋白质结构库等。
利用序列提取系统(SRS)可以方便地检索SWISS-PROT和其它EBI的数据库。SWISS-PROT只接受直接测序获得的蛋白质序列,序列提交可以在其Web页面上完成。
3. PROSITE
PROSITE数据库收集了生物学有显著意义的蛋白质位点和序列模式,并能根据这些位点和模式快速和可靠地鉴别一个未知功能的蛋白质序列应该属于哪一个蛋白质家族。有的情况下,某个蛋白质与已知功能蛋白质的整体序列相似性很低,但由于功能的需要保留了与功能密切相关的序列模式,这样就可能通过PROSITE的搜索找到隐含的功能motif,因此是序列分析的有效工具。PROSITE中涉及的序列模式包括酶的催化位点、配体结合位点、与金属离子结合的残基、二硫键的半胱氨酸、与小分子或其它蛋白质结合的区域等;除了序列模式之外,PROSITE还包括由多序列比对构建的profile,能更敏感地发现序列与profile的相似性。PROSITE的主页上提供各种相关检索服务。
4. PDB
蛋白质数据仓库(PDB)是国际上唯一的生物大分子结构数据档案库,由美国Brookhaven国家实验室建立。PDB收集的数据来源于X光晶体衍射和核磁共振(NMR)的数据,经过整理和确认后存档而成。目前PDB数据库的维护由结构生物信息学研究合作组织(RCSB)负责。RCSB的主服务器和世界各地的镜像服务器提供数据库的检索和下载服务,以及关于PDB数据文件格式和其它文档的说明,PDB数据还可以从发行的光盘获得。使用Rasmol等软件可以在计算机上按PDB文件显示生物大分子的三维结构。
5. SCOP
蛋白质结构分类(SCOP)数据库详细描述了已知的蛋白质结构之间的关系。分类基于若干层次:家族,描述相近的进化关系;超家族,描述远源的进化关系;折叠子(fold),描述空间几何结构的关系;折叠类,所有折叠子被归于全α、全β、α/β、α+β和多结构域等几个大类。SCOP还提供一个非冗余的ASTRAIL序列库,这个库通常被用来评估各种序列比对算法。此外,SCOP还提供一个PDB-ISL中介序列库,通过与这个库中序列的两两比对,可以找到与未知结构序列远缘的已知结构序列。
6. COG
蛋白质直系同源簇(COGs)数据库是对细菌、藻类和真核生物的21个完整基因组的编码蛋白,根据系统进化关系分类构建而成。COG库对于预测单个蛋白质的功能和整个新基因组中蛋白质的功能都很有用。利用COGNITOR程序,可以把某个蛋白质与所有COGs中的蛋白质进行比对,并把它归入适当的COG簇。COG库提供了对COG分类数据的检索和查询,基于Web的COGNITOR服务,系统进化模式的查询服务等。
C. 如何在.Cab安装文件中安装Sql Mobile数据库
要是使用Visual Studio 2005/2008开发.NET Compact Framework应用程序。
并在程序中用到了SQL Server Compact数据库,Visual Studio在向设备(或仿真器)部署你的程序时,会自动将SQL Server Compact一同部署上去。如果你开发的是Native Code的应用程就需要自己手动部署SQL Compact安装包了。另外,在给最终用户的设备部署应用程序时,也是需要自己手动部署SQL Server Compact的。
SQL Server Compact
的安装包存放在以下位置,我们暂称为安装包根目录版本号路径
3.0/3.1
%Program Files%Microsoft Visual Studio 8SmartDevicesSDKSQL ServerMobilev3.0
3.5
%Program Files%Microsoft SQL Server Compact Editionv3.5Devices
根目录下有wce400和wce500两个子目录,分别存放着以Windows CE 4.0和Windows CE 5.0为内核的操作系统平台的安装包。Windows Mobile 2003和Windows CE 4.0版本的SQL 安装包在Server Compactwce400目录下
Windows Mobile 5.0/6.0/6.1和Windows CE 5.0/6.0的SQL Server Compact安装包在
wce500目录下。目录平台
wce400
Windows Mobile 2003, Windows CE 4.0
wce500
Windows Mobile 5.0/6.0/6.1, Windows CE 5.0/6.0
打开wce500目录,可以看到一些以处理器名称命名的子目录
目录名分别为
armv4i, mipsii,
mipsii_fp, mipsiv, mipsiv_fp, sh4
和x86
Windows Mobile
设备的CPU
一般都属于armv4i
Windows CE则要看具体的硬件。
打开armv4i目录,可以看到一些.cab文件。
下面表格就以
SQL Server Compact 3.1
为基础描述了每个安装包文件的功能和适用平台:
安装包平台功能
sqlce30.wce5.armv4i.CAB
Windows CE
Engine
sqlce30.ppc.wce5.armv4i.CAB
Windows Mobile Pocket PC
Engine
sqlce30.phone.wce5.armv4i.CAB
Windows Mobile Smartphone
Engine
sqlce30.repl.wce5.armv4i.CAB
Windows CE
Merge Replication
sqlce30.repl.ppc.wce5.armv4i.CAB
Windows Mobile Pocket PC
Merge Replication
sqlce30.repl.phone.wce5.armv4i.CAB
Windows Mobile Smartphone
Merge Replication
sqlce30.dev.ENU.wce5.armv4i.CAB
Windows CE
Query Analyzer
sqlce30.dev.ENU.ppc.wce5.armv4i.CAB
Windows Mobile Pocket PC
Query Analyzer
D. 嵌入式软件开发的作品目录
第1章嵌入式系统概述1.1嵌入式系统的定义1.2嵌入式系统的分类1.3嵌入式系统的特点1.4嵌入式系统的组成1.5嵌入式系统的应用领域1.6嵌入式系统的发展1.6.1嵌入式系统的发展史1.6.2嵌入式应用软件面临的挑战1.7本章小结习题第2章嵌入式硬件系统基础2.1嵌入式处理器的基本特征2.2嵌入式处理器的分类2.2.1嵌入式微处理器2.2.2嵌入式微控制器2.2.3嵌入式DSP处理器2.2.4嵌入式片上系统2.3典型嵌入式处理器2.3.18051系列单片机2.3.268K/ColdFire系列2.3.3PowerPC系列2.3.4ARM系列2.3.5X86系列2.3.6MIPS2.4嵌入式处理器的选择2.5嵌入式处理器的发展趋势2.6本章小结习题第3章嵌入式操作系统3.1嵌入式操作系统的发展3.1.1嵌入式操作系统的历史3.1.2嵌入式操作系统的发展趋势3.2嵌入式操作系统的分类3.3嵌入式实时系统3.3.1嵌入式实时系统介绍3.3.2实时系统的分类3.4嵌入式实时操作系统3.4.1VxWorks3.4.2pSOS3.4.3QNX3.4.4DeltaOS3.5嵌入式软实时操作系统3.5.1嵌入式Linux3.5.2WindowsCE3.5.3PalmOS3.6嵌入式操作系统的选择3.7本章小结习题第4章基于Linux的嵌入式软件开发4.1嵌入式Linux概述4.2Linux基础4.2.1VMware虚拟机中的Linux安装4.2.2进入与退出Linux系统4.2.3Linux常用命令4.3嵌入式LinuxC语言开发工具4.3.1C语言与嵌入式系统设计4.3.2嵌入式LinuxC语言编程环境4.3.3vi编辑器4.3.4GCC编译器4.3.5GNUmake4.3.6GDB调试器4.4μCLinux操作系统4.4.1μCLinux简介4.4.2μCLinux的基本架构4.4.3μCLinux的相关知识4.5建立μCLinux开发环境4.5.1交叉编译环境4.5.2基于Linux的宿主机建立交叉编译环境4.5.3基于Cygwin建立交叉编译环境4.5.4μCLinux内核编译4.5.5内核的加载运行4.6基于μCLinux的应用程序开发4.6.1基本开发步骤4.6.2应用程序开发实例4.6.3添加用户应用程序到μCLinux4.7本章小结习题第5章基于VxWorks的嵌入式软件开发5.1Tornado简介5.1.1Tornado的特点5.1.2TornadoIDE5.1.3VxWorks目标机环境5.1.4宿主机与目标机的接口5.2Tornado的安装和启动5.2.1Tornado的安装5.2.2Tornado的目录结构5.2.3Tornado主窗口界面介绍5.2.4入门实例--HelloWorld5.2.5使用调试和分析工具5.3Tornado环境下的工程开发5.3.1创建可下载的应用5.3.2创建用户定制的VxWorks映像5.3.3创建可引导的应用5.3.4宿主机与目标机的通信5.3.5配置、构造引导程序及引导盘的制作5.3.6主机Tornado调试环境配置5.3.7多任务调试方法5.4VxWorks操作系统5.4.1VxWorks简介5.4.2Vxworks操作系统的基本结构5.4.3VxWorks任务5.4.4共享代码和重入5.4.5任务间通信5.4.6中断服务程序5.4.7时钟管理5.5实例分析5.5.1VxWorks任务间通信5.5.2理发师问题5.5.3哲学家进餐问题5.6本章小结习题第6章嵌入式软件设计的几个问题6.1实时多任务软件设计6.1.1实时多任务软件的设计步骤6.1.2任务划分6.1.3实时多任务设计实例6.2板级支持包BSP6.2.1BSP简述6.2.2BSP的职责6.2.3BSP的组成6.2.4VxWorks映像类型及其启动顺序6.2.5BSP的开发6.3外部设备的驱动6.3.1外部设备6.3.2外部设备的分类6.3.3I/O设备的数据传送方式6.3.4硬件驱动程序6.3.5硬件驱动程序的主要功能6.3.6硬件驱动程序的组成部分6.4本章小结习题第7章嵌入式系统设计开发7.1嵌入式系统设计开发概述7.1.1嵌入式系统开发的特点7.1.2嵌入式系统设计的目标7.1.3嵌入式系统的设计开发方法7.2嵌入式硬件系统选型及设计7.2.1处理器的选择7.2.2嵌入式系统硬件电路设计7.2.3印刷电路板设计7.3嵌入式软件系统选择7.3.1软件平台的选择7.3.2编程语言的选择7.3.3集成开发环境的选择7.4软、硬件协同开发7.5嵌入式系统的调试7.6嵌入式系统测试7.7系统集成7.8本章小结习题第8章实训实训1Linux安装实训2Linux常用命令实训3嵌入式Linux下开发工具使用实训4μCLinux交叉开发环境实训5添加μCLinux应用程序实训6Tornado集成开发环境实训7使用Tornado中的调试和分析工具实训8基于VMware建立VxWorks交叉开发环境实训9VxWorks组件的裁减和配置实训10信号量实训11消息队列实训12Wind内核功能实训13多任务程序调试方法实训14理发师问题参考文献
E. 计算机组成原理与汇编语言的目录
第一篇计算机组成原理
第1章绪论
1.1如何使用本书
1.2计算机系统的概念层次
1.2.1计算机硬件系统
1.2.2计算机软件系统
1.2.3计算机的虚拟化问题
1.3计算机系统的体系结构分析
1.4计算机的性能指标分析
习题
第2章数据信息表示
2.1数值数据的信息表示
2.1.1数制与进位计数法
2.1.2数制转换
2.1.3机器数表示方法
2.1.4定点数表示
2.1.5浮点数表示
2.2非数值数据的信息表示
2.2.1字符的表示
2.2.2字符串的存放
2.2.3汉字的表示
2.2.4校验码
习题
第3章数值运算及运算器
3.1基本算术运算的实现
3.1.1加法器
3.1.2进位的产生与传递
3.1.3并行加法器进位链
3.2定点运算
3.2.1加减运算
3.2.2移位运算
3.2.3乘法运算
3.2.4除法运算
3.3浮点运算
3.3.1浮点加减运算
3.3.2浮点乘法运算
3.3.3浮点除法运算
3.4运算器举例
3.4.1ALU举例
3.4.2浮点运算器举例
习题
第4章指令系统
4.1指令系统的基本概念
4.1.1指令系统及计算机语言
4.1.2计算机中指令的存储及执行
4.2指令格式
4.2.1指令格式及指令字长度
4.2.2操作码结构的设计
4.2.3地址码结构的设计
4.2.4指令助记符与机器指令代码
4.2.5指令格式举例
4.3寻址方式
4.3.1指令寻址方式
4.3.2操作数寻址方式
4.3.38086寻址方式示例
4.3.4MIPS寻址方式简介
4.4指令的分类及指令系统
4.4.1指令类型
4.4.28086指令系统类型
4.4.38086指令系统详解
4.4.4MIPS指令系统简介
4.4.5CISC与RISC指令系统
习题
第5章中央处理器
5.1CPU的总体结构及设计
5.1.1CPU的功能及基本组成
5.1.2模型机CPU的总体结构
5.2指令周期与指令流程
5.2.1指令周期的基本概念
5.2.2时序系统
5.2.3模型机指令系统、指令流程与微操作控制信号
5.3微程序控制部件的组成与设计
5.3.1微程序控制部件的组成
5.3.2微指令的设计
5.3.3微程序设计
5.4组合逻辑控制部件的组成与设计
5.4.1组合逻辑控制部件的组成
5.4.2微操作控制信号发生器的设计
5.5CPU的发展简介
习题
第6章存储系统
6.1存储器概述
6.1.1存储器分类
6.1.2存储器的主要技术指标
6.1.3存储系统的分层结构
6.2随机存取存储器和只读存储器
6.2.1SRAM存储器
6.2.2DRAM存储器
6.2.3主存容量的扩展
6.2.4主存与CPU的连接
6.2.5半导体只读存储器
6.2.6新型存储器芯片
6.3高速存储器
6.3.1双端口存储器
6.3.2多体并行交叉存储器
6.3.3相联存储器
6.4Cache存储器
6.4.1高速缓存工作原理
6.4.2主存与Cache的地址映像
6.4.3替换策略
6.4.4Cache的写操作策略
6.5虚拟存储器
6.5.1虚拟存储器基本概念
6.5.2段式虚拟存储器
6.5.3页式虚拟存储器
6.5.4段页式虚拟存储器
6.5.5快表和慢表
6.6辅助存储器
6.6.1磁表面存储器原理
6.6.2磁带存储器
6.6.3磁盘存储器
6.6.4光盘存储器
6.6.5移动存储设备
6.6.6磁盘阵列RAID
习题
第7章输入/输出系统及外围设备
7.1输人/输出系统概述
7.1.1输入/输出系统的基本功能
7.1.2输入/输出系统的组成
7.1.3输入/输出设备的编址与输人/输出指令
7.1.4主机与输入/输出设备间信息传输的控制方式
7.2程序直接控制方式
7.2.1直接输入/输出方式
7.2.2程序查询输入/输出方式
7.3程序中断方式
7.3.1中断的基本概念
7.3.2中断源和中断类型
7.3.3中断处理过程
7.3.4程序中断方式的基本接口
……
第二篇汇编语言程序设计
第8章汇编语言
第9章分支程序设计
第10章循环程序设计
第11章子程序设计
第12章系统功能调用
第13章汇编语言程序的开发与调试
附录8086指令系统简表
参考文献
……
F. 蛋白序列、结构数据库常用的有哪些
蛋白质数据库介绍
蛋白质数据库
1. PIR和PSDPIR国际蛋白质序列数据库(PSD)是由蛋白质信息资源(PIR)、慕尼黑蛋白质序列信息中心(MIPS)和日本国际蛋白质序列数据库(JIPID)共同维护的国际上最大的公共蛋白质序列数据库。这是一个全面的、经过注释的、非冗余的蛋白质序列数据库,包含超过142,000条蛋白质序列(至99年9月),其中包括来自几十个完整基因组的蛋白质序列。所有序列数据都经过整理,超过99%的序列已按蛋白质家族分类,一半以上还按蛋白质超家族进行了分类。PSD的注释中还包括对许多序列、结构、基因组和文献数据库的交叉索引,以及数据库内部条目之间的索引,这些内部索引帮助用户在包括复合物、酶-底物相互作用、活化和调控级联和具有共同特征的条目之间方便的检索。每季度都发行一次完整的数据库,每周可以得到更新部分。
PSD数据库有几个辅助数据库,如基于超家族的非冗余库等。PIR提供三类序列搜索服务:基于文本的交互式检索;标准的序列相似性搜索,包括BLAST、FASTA等;结合序列相似性、注释信息和蛋白质家族信息的高级搜索,包括按注释分类的相似性搜索、结构域搜索GeneFIND等。
PIR和PSD的网址是:http://pir.georgetown.e/。
数据库下载地址是:ftp://nbrfa.georgetown.e/pir/。
2. SWISS-PROT
SWISS-PROT是经过注释的蛋白质序列数据库,由欧洲生物信息学研究所(EBI)维护。数据库由蛋白质序列条目构成,每个条目包含蛋白质序列、引用文献信息、分类学信息、注释等,注释中包括蛋白质的功能、转录后修饰、特殊位点和区域、二级结构、四级结构、与其它序列的相似性、序列残缺与疾病的关系、序列变异体和冲突等信息。SWISS-PROT中尽可能减少了冗余序列,并与其它30多个数据建立了交叉引用,其中包括核酸序列库、蛋白质序列库和蛋白质结构库等。
利用序列提取系统(SRS)可以方便地检索SWISS-PROT和其它EBI的数据库。
SWISS-PROT只接受直接测序获得的蛋白质序列,序列提交可以在其Web页面上完成。
SWISS-PROT的网址是:http://www.ebi.ac.uk/swissprot/。
3. PROSITE
PROSITE数据库收集了生物学有显著意义的蛋白质位点和序列模式,并能根据这些位点和模式快速和可靠地鉴别一个未知功能的蛋白质序列应该属于哪一个蛋白质家族。有的情况下,某个蛋白质与已知功能蛋白质的整体序列相似性很低,但由于功能的需要保留了与功能密切相关的序列模式,这样就可能通过PROSITE的搜索找到隐含的功能motif,因此是序列分析的有效工具。PROSITE中涉及的序列模式包括酶的催化位点、配体结合位点、与金属离子结合的残基、二硫键的半胱氨酸、与小分子或其它蛋白质结合的区域等;除了序列模式之外,PROSITE还包括由多序列比对构建的profile,能更敏感地发现序列与profile的相似性。PROSITE的主页上提供各种相关检索服务。
PROSITE的网址是:http://www.expasy.ch/prosite/。
4. PDB
蛋白质数据仓库(PDB)是国际上唯一的生物大分子结构数据档案库,由美国Brookhaven国家实验室建立。PDB收集的数据来源于X光晶体衍射和核磁共振(NMR)的数据,经过整理和确认后存档而成。目前PDB数据库的维护由结构生物信息学研究合作组织(RCSB)负责。RCSB的主服务器和世界各地的镜像服务器提供数据库的检索和下载服务,以及关于PDB数据文件格式和其它文档的说明,PDB数据还可以从发行的光盘获得。使用Rasmol等软件可以在计算机上按PDB文件显示生物大分子的三维结构。
RCSB的PDB数据库网址是:http://www.rcsb.org/pdb/。
5. SCOP
蛋白质结构分类(SCOP)数据库详细描述了已知的蛋白质结构之间的关系。分类基于若干层次:家族,描述相近的进化关系;超家族,描述远源的进化关系;折叠子(fold),描述空间几何结构的关系;折叠类,所有折叠子被归于全α、全β、α/β、α+β和多结构域等几个大类。SCOP还提供一个非冗余的ASTRAIL序列库,这个库通常被用来评估各种序列比对算法。此外,SCOP还提供一个PDB-ISL中介序列库,通过与这个库中序列的两两比对,可以找到与未知结构序列远缘的已知结构序列。
SCOP的网址是:http://scop.mrc-lmb.cam.ac.uk/scop/。
6. COG
蛋白质直系同源簇(COGs)数据库是对细菌、藻类和真核生物的21个完整基因组的编码蛋白,根据系统进化关系分类构建而成。COG库对于预测单个蛋白质的功能和整个新基因组中蛋白质的功能都很有用。利用COGNITOR程序,可以把某个蛋白质与所有COGs中的蛋白质进行比对,并把它归入适当的COG簇。COG库提供了对COG分类数据的检索和查询,基于Web的COGNITOR服务,系统进化模式的查询服务等。
COG库的网址是:http://www.ncbi.nlm.nih.gov/COG。
下载COG库和COGNITOR程序在:ftp://ncbi.nlm.nih.gov/pub/COG。