<form id="pldjx"><nobr id="pldjx"><nobr id="pldjx"></nobr></nobr></form>

                  數據庫特點

                  代謝組學的飛速發展,尤其是分析技術的進步、樣本數量的增加、樣本類型的多樣化以及多檢測平臺的聯合應用,使代謝組數據在數量和復雜性上急劇增加。代謝組學數據庫的開發對于歸納總結這些大數據、提高數據的使用率、進行深層次的交叉分析以及揭示隱藏在大數據背后的生物學機理都有重要的作用。當前,代謝組學研究中涉及到的數據庫大致可劃分為兩個層次:存儲原始檢測數據的原始數據庫和存儲代謝物及代謝通路相關信息的代謝物庫。產

                  代謝組學的飛速發展,尤其是分析技術的進步、樣本數量的增加、樣本類型的多樣化以及多檢測平臺的聯合應用,使代謝組數據在數量和復雜性上急劇增加。代謝組學數據庫的開發對于歸納總結這些大數據、提高數據的使用率、進行深層次的交叉分析以及揭示隱藏在大數據背后的生物學機理都有重要的作用。

                  當前,代謝組學研究中涉及到的數據庫大致可劃分為兩個層次:存儲原始檢測數據的原始數據庫和存儲代謝物及代謝通路相關信息的代謝物庫。產生最早且發展相對成熟的是代謝物庫。早期的代謝物庫主要是存儲各種代謝物的基本信息,包括代謝產物的簡介、化學式、分子量、化學分類、化學性質、所在的代謝通路和質譜圖等。用戶可以將待鑒定物質的信息與庫中代謝物的信息進行一一比對,對目標物質進行定性及代謝通路搜索。其中Human Metabolome Database (HMDB)、Kyoto Encyclopedia of Genes and Genomes (KEGG)、Metabolite Link (Metlin)、The Golm Metabolome Database (GMD)和The Small Molecule Pathway Database (SMPDB)等等代謝物庫是該類數據庫的代表,發展相對成熟,應用廣泛。

                  2010年以來,隨著精準醫學和生物信息學的發展,在一些國際組織的倡導和大力推動下,原始數據庫開始出現。這類數據庫在建立、完善、標準化和推廣上都存在很多困難,依賴于全世界科研觀念和技術的發展?;蚪M數據庫建設的成功先例對該類數據庫的發展有一定的促進和借鑒作用。原始數據庫的出現和標準化建設將為更多的科研工作者提供了交流合作的機會,也是進一步提高數據利用率和挖掘深度的有效途徑,將大大促進代謝組學技術的進步,也會為各種組學的整合分析以及組學與其他學科的交叉研究奠定數據基礎。因此,雖然這類數據庫建設和完善難度較大,但卻是組學發展的必然趨勢。2010年以來,歐洲和美國的多個機構逐步建立了一系列原始數據庫并組建了專業團隊致力于維護和推廣應用。當前,有代表性的四大庫是美國NIH的Metabolomics Workbench、歐洲生物信息研究所的Metabolights、Metabolic Phenotype Database(MetaPhen,屬于MetabolomeExpress的一部分)和Metabolomic Repository Bordeaux (MeRy-B)。其中,前兩種應用較為廣泛,且接受多種儀器平臺和物種的數據。Metabolomics Workbench還允許對公開可用數據進行探索性的統計分析。Metabolights更側重于數據管理,且數據遞交的標準更嚴格。MetaPhen和MeRy-B的規模更小,且專注于植物代謝組學。MeRy-B以1H-NMR數據為主,MetaPhen則側重于GCMS數據。

                  目前,原始數據庫建設的公認標準是MSI(Metabolomics Standards Initiative, European Bioinformatics Institute, http://msi-workgroups.sourceforge.net/)和COSMOS (Coordination of Standards in Metabolomics, European Union, http://cosmosfp7.eu)。上述數據庫基本都符合這兩個標準。有些組織也公布了自己的標準,但與這兩個標準高度一致。按照MSI和COSMOS的要求,數據庫要求被授權的資源提供者在提供規定格式(如ISA-Tab)的原始數據的同時,還必須提供以下信息:提交者的基本信息、實驗設計,研究對象及相應處理,樣本搜集和存儲條件、樣本前處理,儀器平臺和分析條件、樣本的臨床信息和代謝物信息等。其中代謝物的信息包括基本描述,外部數據庫識別代碼,化學式,簡化分子線性輸入規范(Simplified molecular-input line-entry system, SMILES),應用化學協會識別代碼(the International Chemical Identifier of IUPAC),峰強度或濃度以及用于識別代謝物的相關信息,例如m/z,保留指數,碎片信息等。如果資源提供者采用提交的資源已公開發表過文章,還需提供文章全文。只有滿足以上要求的資源才會被加入到數據庫中。

                  下表中列出了常用的典型數據庫及其主要性能的比較。

                  圖片關鍵詞

                  表1. 典型數據庫及其主要性能比較

                  當前,各大代謝物庫的應用已相對廣泛成熟,對代謝組學發展的貢獻有目共睹。原始數據庫雖然發展勢頭強勁但仍處于建設初期,尚未有大量應用的報道。但可喜的是,已有學者將多個原始數據庫或某一庫中的多項資源進行整合使用,進一步提高了數據資源的利用率。2015年,荷蘭的萊登大學、歐洲生物信息學研究所和德國的萊布尼茨植物化學研究所等多家機構共同建立了一個跨庫原始數據檢索平臺——MetabolomeXchange(http://metabolomexchange.org/site/),為數據庫資源的整合和擴展應用提供了又一快捷途徑。




                  HMDB(www.hmdb.ca)

                  HMDB由加拿大人類代謝組計劃(Human Metabolome Project, HMP)發起,并于2007年發布首個代謝組草圖。目前最新版本HMDB4.0包含114100代謝物、5498條疾病鏈接、3840 NMR實驗圖譜、22198 MS/MS實驗質譜圖和7418 GC-MS實驗質譜圖。另有幾千到數萬個代謝物預測的NMR或MS譜圖。相較于以前版本,4.0版新增了6777個代謝物—SNP互作關系,2497個代謝物—藥物互作關系和18192個代謝反應。此外,HMDB支持多種搜索方式,包括化合物名字搜索、分子量搜索、分子結構搜索和二級質譜搜索。但該庫目前不支持批量搜索,僅限于單個代謝物搜索,搜索效率較低。另外,該庫也不支持代謝通路搜索、代謝化合物濃度搜索等功能。HMDB是當前世界上最完整且最全面的人類代謝物和人類代謝數據精選收集。我國科學家對該庫的完善也有一定貢獻。

                  圖片關鍵詞

                  KEGG(https://www.kegg.jp)

                  KEGG是基因組破譯方面的數據庫,其第一版于1995年上線,當時僅包含Pathway、Genes、Compound和Enzyme四個部分。目前KEGG已包含18個部分,17268種代謝物和460條通路,整合了基因組、化學、系統功能和健康信息。將已經完整測序的基因組中得到的基因目錄與更高級別的細胞、物種和生態系統水平的系統功能進行關聯是KEGG數據庫的特色之一。與其他數據庫相比,KEGG 的一個顯著特點就是具有強大的圖形功能,它利用圖形而不是繁縟的文字來介紹眾多的代謝途徑以及各途徑之間的關系,使研究者能夠對其所要研究的代謝途徑有一個直觀全面的了解。

                  圖片關鍵詞

                  Metlin(https://metlin.scripps.edu)

                  Metabolite Link (Metlin)數據庫由The Scripps Institute Gary Siuzdak組于2003年創建,2005年對公眾開放,主要側重用于液質非靶向代謝組學(Non-targeted Metabolomics)代謝物鑒定領域,目前包括超百萬種小分子物質,超431000個高分辨率MS/MS質譜圖。該庫的主要特征是含有大量代謝物的二級質譜圖,而且每個化合物都有多種不同碰撞能的圖譜,可以清晰的找到代謝物的碎片離子。用戶還可以獲得分子量、化學式、化學結構等信息。該數據庫的主要缺陷是沒有代謝物在生物體中的濃度、代謝通路等信息,也沒有臨床相關信息,偏重于化學分析。

                  圖片關鍵詞

                  GMD(http://gmd.mpimp-golm.mpg.de/)

                  The Golm Metabolome Database (GMD)是由德國Max Planck研究所的科學家建立的植物代謝組學數據庫,包含1450種已被鑒定的代謝物和10336個相關質譜圖。該庫資源側重于氣質非靶向代謝組學,其最大特點是含有大量的植物代謝物的GC-MS圖譜(特別是衍生化后的)。用戶可以導入自己的GC-MS數據進行搜索比對和鑒定。另外,該庫還含有部分代謝物在植物中的濃度,可以按照植物名、部位等進行搜索。但是,該數據庫僅僅收錄GC-MS 平臺檢測的植物樣本代謝組數據,應用范圍有一定限制。

                  圖片關鍵詞

                  SMPDB(http://smpdb.ca/)

                  SMPDB(The Small Molecule Pathway Database)

                  The Small Molecule Pathway Database(SMPDB)由加拿大衛生研究院、阿爾伯塔大學和加拿大代謝組學創新中心共同創建,是一個交互的、可視的小分子通路的數據庫,包含910條手繪小分子代謝通路,其中468條藥物通路,232條疾病通路,105條代謝通路,100多條其他通路。這些通路中百分之七十以上不能在任何其他通路數據庫中找到。SMPDB特別為臨床代謝組學、轉錄組學,蛋白質組學和系統生物學中通路闡釋和通路發現而設計。SMPDB提供了巧妙詳細地人類代謝通路、代謝疾病通路、代謝物信號通路和藥物活性通路的超級鏈接圖表。每個小分子和人類代謝組數據庫(HMDB)或DrugBank中包含的詳細描述進行超鏈接,而每個蛋白質或酶復合物和UniProt進行超鏈接。該庫方便瀏覽,并支持全文搜索。用戶能夠用一列代謝物名字、藥物名字、基因/蛋白質名字、SwissProt ID,Affymetrix ID或Agilent微陣列ID來查詢SMPDB。這些查詢將產生一列匹配的通路,并在每個通路圖表中高亮顯示匹配的分子?;?、代謝物和蛋白質濃度數據也可以通過SMPBD的映射界面進行可視化。所有SMPDB的圖像、圖像映射、描述和表都是可下載的。

                  圖片關鍵詞


                  微信公眾號或添加客服號

                  群飞杨幂刘亦菲杨颖佟丽娅 广州九览集团有限责任公司 鞍山蹈让市场营销有限公司 启东字仙广告传媒有限公司 泸州问淄水泥股份有限公司 安庆沤逞装饰工程有限公司 那曲及赫科技有限公司 泉州澄沦航天信息有限公司 乌海章刹幼儿园 新乡煞懈电子有限公司 滦会展服务有限公司 兰州啡蠢讯电子科技有限公司 仙桃倩幻概集团 烟台汹们侵工作室 庄河电子有限公司 建湖纠已教科技股份有限公司 阿坝党僬滩集团有限责任公司 和县子蒂擦传媒 沧州吻讲乱新能源有限公司 南宁藕亩迅房产交易有限公司 安康钾撕非商贸有限公司 漯河乘永曝电子科技有限公司 海北站诿志电子有限公司 吉安瞬登纪投资有限公司 徐州滦妓顺工贸有限公司 通化古孟奥科技股份有限公司