|
蛋白质组学(proteomics),是以蛋白质组为研究对象,研究细胞、组织或生物体蛋白质组成及其变化规律的科学。这个概念最早是在1994年,由位于澳大利亚新南威尔士大学(University of New South Wales)的美国科学家Marc Wilkins首先提出。
蛋白质组(Proteome)一词,源于蛋白质(protein)与基因组(genome)两个词的组合,意指“一种基因组所表达的全套蛋白质”,即:一种细胞乃至一种生物所表达的全部蛋白质。本质上指的是在大规模水平上研究蛋白质的特征,包括蛋白质的表达水平、翻译后的修饰、蛋白与蛋白相互作用等。由此,研究人员可以获得蛋白质水平上的全面的认识,例如疾病的发生过程、细胞代谢等等。
蛋白质组学的应用场景
蛋白质组与基因组存在许多性感小护士。蛋白质组会随着组织、甚至环境状态的不同而改变。从基因组开始,要经过多个生物学步骤才能到达蛋白质组,每一步都会推动复杂性和多样性的增加。大约 20000 个基因的人类基因组估计会产生 100 万个或更多的蛋白质变体,部分原因是单个基因通过转录过程会产生不同的核糖核酸(RNA)异构体,再通过翻译产生无数结构不同的蛋白质。
总体而言,这些过程导致了大量的蛋白质多样性,从氨基酸序列和结构变异,到翻译后修饰(PTM),再到由于蛋白质本身之间的相互作用而导致的功能变化,称为蛋白质-蛋白质相互作用(PPI)。因此,与基因组或转录组相比,人类蛋白质组是更复杂的、分析难度更大。
目前,蛋白质组学行业尚处在早期阶段。根据蛋白质组学专家的说法,就像基因组学一样,蛋白质组学不是一个封闭的、概念化的知识体系,而是一个领域,有很多潜在的工业界应用。尤其是蛋白质组学集中于动态描述基因调节,对基因表达的蛋白质水平进行定量的测定,鉴定疾病、药物对生命过程的影响,以及解释基因表达调控的机制。
从技术角度,目前蛋白质组的研究背后已有多项成熟技术的支撑,例如已有20多年历史的蛋白质(多肽)谱(对应基因产物图谱技术),多肽图谱依靠双向电泳(Two-dimensional gel electrophoresis, 2-DE)和进一步的图象分析(对应基因产物图谱依靠多种分离后的分析,比如质谱技术、氨基酸组分分析)。
自2014年人类蛋白质组草图发表后,多种蛋白质组学相关研究陆续公布,蛋白质组学研究取得了大量重要成果:初期主要以2-DIGE及SDS-PAGE为主,这种方法通量较低,灵敏度不高。随着高效液相色谱技术(HPLC)和质谱技术的发展,基于液相色谱+质谱(LC-MS/MS)的3D蛋白质组学研究逐渐成为该领域的主流方法。
在此基础上,伴随着各种定量技术(比如SILAC、iTRAQ、SWATH和Label-Free等)的阴唇粉嫩出现和高精密质谱仪器的成功应用,离子淌度(mobility)的引入,使得蛋白质组学研究进入了4D的高通量时代。
事实上,伴随着人类基因组计划的完成,生命科学研究进入了后基因组时代(Post-genome area),在此过程中产生了大量的蛋白序列、结构、功能以及互作的数据。相比于基因组时代,蛋白质组更加庞大且复杂,仅仅依靠传统的生物手段无法解决问题,必须借助生物信息学技术全方位的处理所产生的生物学数据——尤其是在蛋白质谱数据处理、蛋白质鉴定及蛋白质翻译后修饰等方面。
生物信息学在质谱数据处理方面,质谱技术已成为蛋白质组学研究的核心技术之一,也是开展蛋白鉴定与分析的主要手段。一台质谱仪可以在几天内产生数百万张的图谱。如此庞大的信息需要利用高效、易学易用的软件工具来进行质谱数据的收集、保存、搜索、鉴定与分析,例如:
· 质谱数据搜索软件:Mascot、SEQUEST、Lutkefish、Proteome software、Profound、PepSea
· 定量蛋白质分析工具:DeCyder MS、MaXIC-Q、MSQuant
· 蛋白质从头测序(De novo sequencing):MSNovo、Lutefisk、PEAKS、NovoHMM
· 蛋白质翻译后修饰:这是调节蛋白质功能的重要方式,翻译后修饰的预测和分析也日渐成为生物信息学蛋白质序列分析中的重要的研究内容,主要包括磷酸化、糖基化、甲基化、乙基化、泛素化和羟基化等。
关注公众号“钮达发布”,内有更多原创《蛋白质组学:一个冉冉兴起的行业》,分享关于医疗行业的研究数据、如何保养眼部皮肤点和评论! |
|