A. 蛋白質序列資料庫包含哪些內容
蛋白質資料庫
1. PIR和PSDPIR國際蛋白質序列資料庫(PSD)是由蛋白質信息資源(PIR)、慕尼黑蛋白質序列信息中心(MIPS)和日本國際蛋白質序列資料庫(JIPID)共同維護的國際上最大的公共蛋白質序列資料庫。這是一個全面的、經過注釋的、非冗餘的蛋白質序列資料庫,包含超過142,000條蛋白質序列(至99年9月),其中包括來自幾十個完整基因組的蛋白質序列。所有序列數據都經過整理,超過99%的序列已按蛋白質家族分類,一半以上還按蛋白質超家族進行了分類。PSD的注釋中還包括對許多序列、結構、基因組和文獻資料庫的交叉索引,以及資料庫內部條目之間的索引,這些內部索引幫助用戶在包括復合物、酶-底物相互作用、活化和調控級聯和具有共同特徵的條目之間方便的檢索。每季度都發行一次完整的資料庫,每周可以得到更新部分。
PSD資料庫有幾個輔助資料庫,如基於超家族的非冗餘庫等。PIR提供三類序列搜索服務:基於文本的互動式檢索;標準的序列相似性搜索,包括BLAST、FASTA等;結合序列相似性、注釋信息和蛋白質家族信息的高級搜索,包括按注釋分類的相似性搜索、結構域搜索GeneFIND等。
PIR和PSD的網址是:http://pir.georgetown.e/。
資料庫下載地址是:ftp://nbrfa.georgetown.e/pir/。
2. SWISS-PROT
SWISS-PROT是經過注釋的蛋白質序列資料庫,由歐洲生物信息學研究所(EBI)維護。資料庫由蛋白質序列條目構成,每個條目包含蛋白質序列、引用文獻信息、分類學信息、注釋等,注釋中包括蛋白質的功能、轉錄後修飾、特殊位點和區域、二級結構、四級結構、與其它序列的相似性、序列殘缺與疾病的關系、序列變異體和沖突等信息。SWISS-PROT中盡可能減少了冗餘序列,並與其它30多個數據建立了交叉引用,其中包括核酸序列庫、蛋白質序列庫和蛋白質結構庫等。
利用序列提取系統(SRS)可以方便地檢索SWISS-PROT和其它EBI的資料庫。
SWISS-PROT只接受直接測序獲得的蛋白質序列,序列提交可以在其Web頁面上完成。
SWISS-PROT的網址是:http://www.ebi.ac.uk/swissprot/。
3. PROSITE
PROSITE資料庫收集了生物學有顯著意義的蛋白質位點和序列模式,並能根據這些位點和模式快速和可靠地鑒別一個未知功能的蛋白質序列應該屬於哪一個蛋白質家族。有的情況下,某個蛋白質與已知功能蛋白質的整體序列相似性很低,但由於功能的需要保留了與功能密切相關的序列模式,這樣就可能通過PROSITE的搜索找到隱含的功能motif,因此是序列分析的有效工具。PROSITE中涉及的序列模式包括酶的催化位點、配體結合位點、與金屬離子結合的殘基、二硫鍵的半胱氨酸、與小分子或其它蛋白質結合的區域等;除了序列模式之外,PROSITE還包括由多序列比對構建的profile,能更敏感地發現序列與profile的相似性。PROSITE的主頁上提供各種相關檢索服務。
PROSITE的網址是:http://www.expasy.ch/prosite/。
4. PDB
蛋白質數據倉庫(PDB)是國際上唯一的生物大分子結構數據檔案庫,由美國Brookhaven國家實驗室建立。PDB收集的數據來源於X光晶體衍射和核磁共振(NMR)的數據,經過整理和確認後存檔而成。目前PDB資料庫的維護由結構生物信息學研究合作組織(RCSB)負責。RCSB的主伺服器和世界各地的鏡像伺服器提供資料庫的檢索和下載服務,以及關於PDB數據文件格式和其它文檔的說明,PDB數據還可以從發行的光碟獲得。使用Rasmol等軟體可以在計算機上按PDB文件顯示生物大分子的三維結構。
RCSB的PDB資料庫網址是:http://www.rcsb.org/pdb/。
5. SCOP
蛋白質結構分類(SCOP)資料庫詳細描述了已知的蛋白質結構之間的關系。分類基於若干層次:家族,描述相近的進化關系;超家族,描述遠源的進化關系;折疊子(fold),描述空間幾何結構的關系;折疊類,所有折疊子被歸於全α、全β、α/β、α+β和多結構域等幾個大類。SCOP還提供一個非冗餘的ASTRAIL序列庫,這個庫通常被用來評估各種序列比對演算法。此外,SCOP還提供一個PDB-ISL中介序列庫,通過與這個庫中序列的兩兩比對,可以找到與未知結構序列遠緣的已知結構序列。
SCOP的網址是:http://scop.mrc-lmb.cam.ac.uk/scop/。
6. COG
蛋白質直系同源簇(COGs)資料庫是對細菌、藻類和真核生物的21個完整基因組的編碼蛋白,根據系統進化關系分類構建而成。COG庫對於預測單個蛋白質的功能和整個新基因組中蛋白質的功能都很有用。利用COGNITOR程序,可以把某個蛋白質與所有COGs中的蛋白質進行比對,並把它歸入適當的COG簇。COG庫提供了對COG分類數據的檢索和查詢,基於Web的COGNITOR服務,系統進化模式的查詢服務等。
COG庫的網址是:http://www.ncbi.nlm.nih.gov/COG。
下載COG庫和COGNITOR程序在:ftp://ncbi.nlm.nih.gov/pub/COG。
B. 常用的查詢蛋白質結構以及序列的資料庫主要有哪些
1. PIR和PSD
PIR國際蛋白質序列資料庫(PSD)是由蛋白質信息資源(PIR)、慕尼黑蛋白質序列信息中心(MIPS)和日本國際蛋白質序列資料庫(JIPID)共同維護的國際上最大的公共蛋白質序列資料庫,可在這里下載。這是一個全面的、經過注釋的、非冗餘的蛋白質序列資料庫,其中包括來自幾十個完整基因組的蛋白質序列。所有序列數據都經過整理,超過99%的序列已按蛋白質家族分類,一半以上還按蛋白質超家族進行了分類。PSD的注釋中還包括對許多序列、結構、基因組和文獻資料庫的交叉索引,以及資料庫內部條目之間的索引,這些內部索引幫助用戶在包括復合物、酶-底物相互作用、活化和調控級聯和具有共同特徵的條目之間方便的檢索。每季度都發行一次完整的資料庫,每周可以得到更新部分。
PSD資料庫有幾個輔助資料庫,如基於超家族的非冗餘庫等。PIR提供三類序列搜索服務:基於文本的互動式檢索;標準的序列相似性搜索,包括BLAST、FASTA等;結合序列相似性、注釋信息和蛋白質家族信息的高級搜索,包括按注釋分類的相似性搜索、結構域搜索GeneFIND等。
2. SWISS-PROT
SWISS-PROT是經過注釋的蛋白質序列資料庫,由歐洲生物信息學研究所(EBI)維護。資料庫由蛋白質序列條目構成,每個條目包含蛋白質序列、引用文獻信息、分類學信息、注釋等,注釋中包括蛋白質的功能、轉錄後修飾、特殊位點和區域、二級結構、四級結構、與其它序列的相似性、序列殘缺與疾病的關系、序列變異體和沖突等信息。SWISS-PROT中盡可能減少了冗餘序列,並與其它30多個數據建立了交叉引用,其中包括核酸序列庫、蛋白質序列庫和蛋白質結構庫等。
利用序列提取系統(SRS)可以方便地檢索SWISS-PROT和其它EBI的資料庫。SWISS-PROT只接受直接測序獲得的蛋白質序列,序列提交可以在其Web頁面上完成。
3. PROSITE
PROSITE資料庫收集了生物學有顯著意義的蛋白質位點和序列模式,並能根據這些位點和模式快速和可靠地鑒別一個未知功能的蛋白質序列應該屬於哪一個蛋白質家族。有的情況下,某個蛋白質與已知功能蛋白質的整體序列相似性很低,但由於功能的需要保留了與功能密切相關的序列模式,這樣就可能通過PROSITE的搜索找到隱含的功能motif,因此是序列分析的有效工具。PROSITE中涉及的序列模式包括酶的催化位點、配體結合位點、與金屬離子結合的殘基、二硫鍵的半胱氨酸、與小分子或其它蛋白質結合的區域等;除了序列模式之外,PROSITE還包括由多序列比對構建的profile,能更敏感地發現序列與profile的相似性。PROSITE的主頁上提供各種相關檢索服務。
4. PDB
蛋白質數據倉庫(PDB)是國際上唯一的生物大分子結構數據檔案庫,由美國Brookhaven國家實驗室建立。PDB收集的數據來源於X光晶體衍射和核磁共振(NMR)的數據,經過整理和確認後存檔而成。目前PDB資料庫的維護由結構生物信息學研究合作組織(RCSB)負責。RCSB的主伺服器和世界各地的鏡像伺服器提供資料庫的檢索和下載服務,以及關於PDB數據文件格式和其它文檔的說明,PDB數據還可以從發行的光碟獲得。使用Rasmol等軟體可以在計算機上按PDB文件顯示生物大分子的三維結構。
5. SCOP
蛋白質結構分類(SCOP)資料庫詳細描述了已知的蛋白質結構之間的關系。分類基於若干層次:家族,描述相近的進化關系;超家族,描述遠源的進化關系;折疊子(fold),描述空間幾何結構的關系;折疊類,所有折疊子被歸於全α、全β、α/β、α+β和多結構域等幾個大類。SCOP還提供一個非冗餘的ASTRAIL序列庫,這個庫通常被用來評估各種序列比對演算法。此外,SCOP還提供一個PDB-ISL中介序列庫,通過與這個庫中序列的兩兩比對,可以找到與未知結構序列遠緣的已知結構序列。
6. COG
蛋白質直系同源簇(COGs)資料庫是對細菌、藻類和真核生物的21個完整基因組的編碼蛋白,根據系統進化關系分類構建而成。COG庫對於預測單個蛋白質的功能和整個新基因組中蛋白質的功能都很有用。利用COGNITOR程序,可以把某個蛋白質與所有COGs中的蛋白質進行比對,並把它歸入適當的COG簇。COG庫提供了對COG分類數據的檢索和查詢,基於Web的COGNITOR服務,系統進化模式的查詢服務等。
C. 如何在.Cab安裝文件中安裝Sql Mobile資料庫
要是使用Visual Studio 2005/2008開發.NET Compact Framework應用程序。
並在程序中用到了SQL Server Compact資料庫,Visual Studio在向設備(或模擬器)部署你的程序時,會自動將SQL Server Compact一同部署上去。如果你開發的是Native Code的應用程就需要自己手動部署SQL Compact安裝包了。另外,在給最終用戶的設備部署應用程序時,也是需要自己手動部署SQL Server Compact的。
SQL Server Compact
的安裝包存放在以下位置,我們暫稱為安裝包根目錄版本號路徑
3.0/3.1
%Program Files%Microsoft Visual Studio 8SmartDevicesSDKSQL ServerMobilev3.0
3.5
%Program Files%Microsoft SQL Server Compact Editionv3.5Devices
根目錄下有wce400和wce500兩個子目錄,分別存放著以Windows CE 4.0和Windows CE 5.0為內核的操作系統平台的安裝包。Windows Mobile 2003和Windows CE 4.0版本的SQL 安裝包在Server Compactwce400目錄下
Windows Mobile 5.0/6.0/6.1和Windows CE 5.0/6.0的SQL Server Compact安裝包在
wce500目錄下。目錄平台
wce400
Windows Mobile 2003, Windows CE 4.0
wce500
Windows Mobile 5.0/6.0/6.1, Windows CE 5.0/6.0
打開wce500目錄,可以看到一些以處理器名稱命名的子目錄
目錄名分別為
armv4i, mipsii,
mipsii_fp, mipsiv, mipsiv_fp, sh4
和x86
Windows Mobile
設備的CPU
一般都屬於armv4i
Windows CE則要看具體的硬體。
打開armv4i目錄,可以看到一些.cab文件。
下面表格就以
SQL Server Compact 3.1
為基礎描述了每個安裝包文件的功能和適用平台:
安裝包平台功能
sqlce30.wce5.armv4i.CAB
Windows CE
Engine
sqlce30.ppc.wce5.armv4i.CAB
Windows Mobile Pocket PC
Engine
sqlce30.phone.wce5.armv4i.CAB
Windows Mobile Smartphone
Engine
sqlce30.repl.wce5.armv4i.CAB
Windows CE
Merge Replication
sqlce30.repl.ppc.wce5.armv4i.CAB
Windows Mobile Pocket PC
Merge Replication
sqlce30.repl.phone.wce5.armv4i.CAB
Windows Mobile Smartphone
Merge Replication
sqlce30.dev.ENU.wce5.armv4i.CAB
Windows CE
Query Analyzer
sqlce30.dev.ENU.ppc.wce5.armv4i.CAB
Windows Mobile Pocket PC
Query Analyzer
D. 嵌入式軟體開發的作品目錄
第1章嵌入式系統概述1.1嵌入式系統的定義1.2嵌入式系統的分類1.3嵌入式系統的特點1.4嵌入式系統的組成1.5嵌入式系統的應用領域1.6嵌入式系統的發展1.6.1嵌入式系統的發展史1.6.2嵌入式應用軟體面臨的挑戰1.7本章小結習題第2章嵌入式硬體系統基礎2.1嵌入式處理器的基本特徵2.2嵌入式處理器的分類2.2.1嵌入式微處理器2.2.2嵌入式微控制器2.2.3嵌入式DSP處理器2.2.4嵌入式片上系統2.3典型嵌入式處理器2.3.18051系列單片機2.3.268K/ColdFire系列2.3.3PowerPC系列2.3.4ARM系列2.3.5X86系列2.3.6MIPS2.4嵌入式處理器的選擇2.5嵌入式處理器的發展趨勢2.6本章小結習題第3章嵌入式操作系統3.1嵌入式操作系統的發展3.1.1嵌入式操作系統的歷史3.1.2嵌入式操作系統的發展趨勢3.2嵌入式操作系統的分類3.3嵌入式實時系統3.3.1嵌入式實時系統介紹3.3.2實時系統的分類3.4嵌入式實時操作系統3.4.1VxWorks3.4.2pSOS3.4.3QNX3.4.4DeltaOS3.5嵌入式軟實時操作系統3.5.1嵌入式Linux3.5.2WindowsCE3.5.3PalmOS3.6嵌入式操作系統的選擇3.7本章小結習題第4章基於Linux的嵌入式軟體開發4.1嵌入式Linux概述4.2Linux基礎4.2.1VMware虛擬機中的Linux安裝4.2.2進入與退出Linux系統4.2.3Linux常用命令4.3嵌入式LinuxC語言開發工具4.3.1C語言與嵌入式系統設計4.3.2嵌入式LinuxC語言編程環境4.3.3vi編輯器4.3.4GCC編譯器4.3.5GNUmake4.3.6GDB調試器4.4μCLinux操作系統4.4.1μCLinux簡介4.4.2μCLinux的基本架構4.4.3μCLinux的相關知識4.5建立μCLinux開發環境4.5.1交叉編譯環境4.5.2基於Linux的宿主機建立交叉編譯環境4.5.3基於Cygwin建立交叉編譯環境4.5.4μCLinux內核編譯4.5.5內核的載入運行4.6基於μCLinux的應用程序開發4.6.1基本開發步驟4.6.2應用程序開發實例4.6.3添加用戶應用程序到μCLinux4.7本章小結習題第5章基於VxWorks的嵌入式軟體開發5.1Tornado簡介5.1.1Tornado的特點5.1.2TornadoIDE5.1.3VxWorks目標機環境5.1.4宿主機與目標機的介面5.2Tornado的安裝和啟動5.2.1Tornado的安裝5.2.2Tornado的目錄結構5.2.3Tornado主窗口界面介紹5.2.4入門實例--HelloWorld5.2.5使用調試和分析工具5.3Tornado環境下的工程開發5.3.1創建可下載的應用5.3.2創建用戶定製的VxWorks映像5.3.3創建可引導的應用5.3.4宿主機與目標機的通信5.3.5配置、構造引導程序及引導盤的製作5.3.6主機Tornado調試環境配置5.3.7多任務調試方法5.4VxWorks操作系統5.4.1VxWorks簡介5.4.2Vxworks操作系統的基本結構5.4.3VxWorks任務5.4.4共享代碼和重入5.4.5任務間通信5.4.6中斷服務程序5.4.7時鍾管理5.5實例分析5.5.1VxWorks任務間通信5.5.2理發師問題5.5.3哲學家進餐問題5.6本章小結習題第6章嵌入式軟體設計的幾個問題6.1實時多任務軟體設計6.1.1實時多任務軟體的設計步驟6.1.2任務劃分6.1.3實時多任務設計實例6.2板級支持包BSP6.2.1BSP簡述6.2.2BSP的職責6.2.3BSP的組成6.2.4VxWorks映像類型及其啟動順序6.2.5BSP的開發6.3外部設備的驅動6.3.1外部設備6.3.2外部設備的分類6.3.3I/O設備的數據傳送方式6.3.4硬體驅動程序6.3.5硬體驅動程序的主要功能6.3.6硬體驅動程序的組成部分6.4本章小結習題第7章嵌入式系統設計開發7.1嵌入式系統設計開發概述7.1.1嵌入式系統開發的特點7.1.2嵌入式系統設計的目標7.1.3嵌入式系統的設計開發方法7.2嵌入式硬體系統選型及設計7.2.1處理器的選擇7.2.2嵌入式系統硬體電路設計7.2.3印刷電路板設計7.3嵌入式軟體系統選擇7.3.1軟體平台的選擇7.3.2編程語言的選擇7.3.3集成開發環境的選擇7.4軟、硬體協同開發7.5嵌入式系統的調試7.6嵌入式系統測試7.7系統集成7.8本章小結習題第8章實訓實訓1Linux安裝實訓2Linux常用命令實訓3嵌入式Linux下開發工具使用實訓4μCLinux交叉開發環境實訓5添加μCLinux應用程序實訓6Tornado集成開發環境實訓7使用Tornado中的調試和分析工具實訓8基於VMware建立VxWorks交叉開發環境實訓9VxWorks組件的裁減和配置實訓10信號量實訓11消息隊列實訓12Wind內核功能實訓13多任務程序調試方法實訓14理發師問題參考文獻
E. 計算機組成原理與匯編語言的目錄
第一篇計算機組成原理
第1章緒論
1.1如何使用本書
1.2計算機系統的概念層次
1.2.1計算機硬體系統
1.2.2計算機軟體系統
1.2.3計算機的虛擬化問題
1.3計算機系統的體系結構分析
1.4計算機的性能指標分析
習題
第2章數據信息表示
2.1數值數據的信息表示
2.1.1數制與進位計數法
2.1.2數制轉換
2.1.3機器數表示方法
2.1.4定點數表示
2.1.5浮點數表示
2.2非數值數據的信息表示
2.2.1字元的表示
2.2.2字元串的存放
2.2.3漢字的表示
2.2.4校驗碼
習題
第3章數值運算及運算器
3.1基本算術運算的實現
3.1.1加法器
3.1.2進位的產生與傳遞
3.1.3並行加法器進位鏈
3.2定點運算
3.2.1加減運算
3.2.2移位運算
3.2.3乘法運算
3.2.4除法運算
3.3浮點運算
3.3.1浮點加減運算
3.3.2浮點乘法運算
3.3.3浮點除法運算
3.4運算器舉例
3.4.1ALU舉例
3.4.2浮點運算器舉例
習題
第4章指令系統
4.1指令系統的基本概念
4.1.1指令系統及計算機語言
4.1.2計算機中指令的存儲及執行
4.2指令格式
4.2.1指令格式及指令字長度
4.2.2操作碼結構的設計
4.2.3地址碼結構的設計
4.2.4指令助記符與機器指令代碼
4.2.5指令格式舉例
4.3定址方式
4.3.1指令定址方式
4.3.2操作數定址方式
4.3.38086定址方式示例
4.3.4MIPS定址方式簡介
4.4指令的分類及指令系統
4.4.1指令類型
4.4.28086指令系統類型
4.4.38086指令系統詳解
4.4.4MIPS指令系統簡介
4.4.5CISC與RISC指令系統
習題
第5章中央處理器
5.1CPU的總體結構及設計
5.1.1CPU的功能及基本組成
5.1.2模型機CPU的總體結構
5.2指令周期與指令流程
5.2.1指令周期的基本概念
5.2.2時序系統
5.2.3模型機指令系統、指令流程與微操作控制信號
5.3微程序控制部件的組成與設計
5.3.1微程序控制部件的組成
5.3.2微指令的設計
5.3.3微程序設計
5.4組合邏輯控制部件的組成與設計
5.4.1組合邏輯控制部件的組成
5.4.2微操作控制信號發生器的設計
5.5CPU的發展簡介
習題
第6章存儲系統
6.1存儲器概述
6.1.1存儲器分類
6.1.2存儲器的主要技術指標
6.1.3存儲系統的分層結構
6.2隨機存取存儲器和只讀存儲器
6.2.1SRAM存儲器
6.2.2DRAM存儲器
6.2.3主存容量的擴展
6.2.4主存與CPU的連接
6.2.5半導體只讀存儲器
6.2.6新型存儲器晶元
6.3高速存儲器
6.3.1雙埠存儲器
6.3.2多體並行交叉存儲器
6.3.3相聯存儲器
6.4Cache存儲器
6.4.1高速緩存工作原理
6.4.2主存與Cache的地址映像
6.4.3替換策略
6.4.4Cache的寫操作策略
6.5虛擬存儲器
6.5.1虛擬存儲器基本概念
6.5.2段式虛擬存儲器
6.5.3頁式虛擬存儲器
6.5.4段頁式虛擬存儲器
6.5.5快表和慢表
6.6輔助存儲器
6.6.1磁表面存儲器原理
6.6.2磁帶存儲器
6.6.3磁碟存儲器
6.6.4光碟存儲器
6.6.5移動存儲設備
6.6.6磁碟陣列RAID
習題
第7章輸入/輸出系統及外圍設備
7.1輸人/輸出系統概述
7.1.1輸入/輸出系統的基本功能
7.1.2輸入/輸出系統的組成
7.1.3輸入/輸出設備的編址與輸人/輸出指令
7.1.4主機與輸入/輸出設備間信息傳輸的控制方式
7.2程序直接控制方式
7.2.1直接輸入/輸出方式
7.2.2程序查詢輸入/輸出方式
7.3程序中斷方式
7.3.1中斷的基本概念
7.3.2中斷源和中斷類型
7.3.3中斷處理過程
7.3.4程序中斷方式的基本介面
……
第二篇匯編語言程序設計
第8章匯編語言
第9章分支程序設計
第10章循環程序設計
第11章子程序設計
第12章系統功能調用
第13章匯編語言程序的開發與調試
附錄8086指令系統簡表
參考文獻
……
F. 蛋白序列、結構資料庫常用的有哪些
蛋白質資料庫介紹
蛋白質資料庫
1. PIR和PSDPIR國際蛋白質序列資料庫(PSD)是由蛋白質信息資源(PIR)、慕尼黑蛋白質序列信息中心(MIPS)和日本國際蛋白質序列資料庫(JIPID)共同維護的國際上最大的公共蛋白質序列資料庫。這是一個全面的、經過注釋的、非冗餘的蛋白質序列資料庫,包含超過142,000條蛋白質序列(至99年9月),其中包括來自幾十個完整基因組的蛋白質序列。所有序列數據都經過整理,超過99%的序列已按蛋白質家族分類,一半以上還按蛋白質超家族進行了分類。PSD的注釋中還包括對許多序列、結構、基因組和文獻資料庫的交叉索引,以及資料庫內部條目之間的索引,這些內部索引幫助用戶在包括復合物、酶-底物相互作用、活化和調控級聯和具有共同特徵的條目之間方便的檢索。每季度都發行一次完整的資料庫,每周可以得到更新部分。
PSD資料庫有幾個輔助資料庫,如基於超家族的非冗餘庫等。PIR提供三類序列搜索服務:基於文本的互動式檢索;標準的序列相似性搜索,包括BLAST、FASTA等;結合序列相似性、注釋信息和蛋白質家族信息的高級搜索,包括按注釋分類的相似性搜索、結構域搜索GeneFIND等。
PIR和PSD的網址是:http://pir.georgetown.e/。
資料庫下載地址是:ftp://nbrfa.georgetown.e/pir/。
2. SWISS-PROT
SWISS-PROT是經過注釋的蛋白質序列資料庫,由歐洲生物信息學研究所(EBI)維護。資料庫由蛋白質序列條目構成,每個條目包含蛋白質序列、引用文獻信息、分類學信息、注釋等,注釋中包括蛋白質的功能、轉錄後修飾、特殊位點和區域、二級結構、四級結構、與其它序列的相似性、序列殘缺與疾病的關系、序列變異體和沖突等信息。SWISS-PROT中盡可能減少了冗餘序列,並與其它30多個數據建立了交叉引用,其中包括核酸序列庫、蛋白質序列庫和蛋白質結構庫等。
利用序列提取系統(SRS)可以方便地檢索SWISS-PROT和其它EBI的資料庫。
SWISS-PROT只接受直接測序獲得的蛋白質序列,序列提交可以在其Web頁面上完成。
SWISS-PROT的網址是:http://www.ebi.ac.uk/swissprot/。
3. PROSITE
PROSITE資料庫收集了生物學有顯著意義的蛋白質位點和序列模式,並能根據這些位點和模式快速和可靠地鑒別一個未知功能的蛋白質序列應該屬於哪一個蛋白質家族。有的情況下,某個蛋白質與已知功能蛋白質的整體序列相似性很低,但由於功能的需要保留了與功能密切相關的序列模式,這樣就可能通過PROSITE的搜索找到隱含的功能motif,因此是序列分析的有效工具。PROSITE中涉及的序列模式包括酶的催化位點、配體結合位點、與金屬離子結合的殘基、二硫鍵的半胱氨酸、與小分子或其它蛋白質結合的區域等;除了序列模式之外,PROSITE還包括由多序列比對構建的profile,能更敏感地發現序列與profile的相似性。PROSITE的主頁上提供各種相關檢索服務。
PROSITE的網址是:http://www.expasy.ch/prosite/。
4. PDB
蛋白質數據倉庫(PDB)是國際上唯一的生物大分子結構數據檔案庫,由美國Brookhaven國家實驗室建立。PDB收集的數據來源於X光晶體衍射和核磁共振(NMR)的數據,經過整理和確認後存檔而成。目前PDB資料庫的維護由結構生物信息學研究合作組織(RCSB)負責。RCSB的主伺服器和世界各地的鏡像伺服器提供資料庫的檢索和下載服務,以及關於PDB數據文件格式和其它文檔的說明,PDB數據還可以從發行的光碟獲得。使用Rasmol等軟體可以在計算機上按PDB文件顯示生物大分子的三維結構。
RCSB的PDB資料庫網址是:http://www.rcsb.org/pdb/。
5. SCOP
蛋白質結構分類(SCOP)資料庫詳細描述了已知的蛋白質結構之間的關系。分類基於若干層次:家族,描述相近的進化關系;超家族,描述遠源的進化關系;折疊子(fold),描述空間幾何結構的關系;折疊類,所有折疊子被歸於全α、全β、α/β、α+β和多結構域等幾個大類。SCOP還提供一個非冗餘的ASTRAIL序列庫,這個庫通常被用來評估各種序列比對演算法。此外,SCOP還提供一個PDB-ISL中介序列庫,通過與這個庫中序列的兩兩比對,可以找到與未知結構序列遠緣的已知結構序列。
SCOP的網址是:http://scop.mrc-lmb.cam.ac.uk/scop/。
6. COG
蛋白質直系同源簇(COGs)資料庫是對細菌、藻類和真核生物的21個完整基因組的編碼蛋白,根據系統進化關系分類構建而成。COG庫對於預測單個蛋白質的功能和整個新基因組中蛋白質的功能都很有用。利用COGNITOR程序,可以把某個蛋白質與所有COGs中的蛋白質進行比對,並把它歸入適當的COG簇。COG庫提供了對COG分類數據的檢索和查詢,基於Web的COGNITOR服務,系統進化模式的查詢服務等。
COG庫的網址是:http://www.ncbi.nlm.nih.gov/COG。
下載COG庫和COGNITOR程序在:ftp://ncbi.nlm.nih.gov/pub/COG。