立即注册找回密码

QQ登录

只需一步,快速开始

微信登录

微信扫一扫,快速登录

手机动态码快速登录

手机号快速注册登录

搜索

图文播报

查看: 276|回复: 5

[分享] 什么是蛋白质组学?蛋白质组学的研究内容有哪些?

[复制链接]
发表于 2025-5-11 16:22 | 显示全部楼层 |阅读模式
回复

使用道具 举报

发表于 2025-5-11 16:22 | 显示全部楼层
一 ABPP 技术介绍

基于活性的蛋白质谱(activity-based protein profiling,ABPP)是一种化学蛋白质组学方法,它结合基于活性的探针(activity-based probe,ABP)和蛋白质组学技术来鉴定活性小分子的蛋白质靶标,以帮助阐明活性小分子发挥作用的机理。
基于 ABPP 技术的靶蛋白垂钓技术可以分为以下三个步骤:
1. 活性分子探针设计合成及活性检测
2. 利用改造后的活性小分子垂钓靶蛋白并进行鉴定
3. 活性小分子与靶蛋白间的相互作用验证。
在早期的研究中,活性分子常被共价固定在生物相容的惰性载体上,但这种共价固定往往会损伤活性分子的生物活性。为了克服上述的缺点,科学家开发了基于活性的探针(ABPs),对活性小分子进行标记,报告标签在被引入活性小分子时不会影响小分子的活性。
ABPs 由三个部分组成:活性反应基团、链接基团和报告标签。活性反应基团是在活性分子与靶点蛋白结合后,通过反应将整个分子以共价键的形式结合到蛋白上,目前常用的活性反应基团为光反应基团(如双吖丙啶);链接基团是在活性分子和报告标签之间创造足够的空间来保持活性分子的活性;报告标签则是用来检测或纯化与活性分子结合的靶蛋白(如生物素)。



图1 ABPS 结构示意图

ABPP 技术早期,报告标签通常直接与活性小分子相连,导致整个探针的分子量过大,不利于 ABPs 通过细胞膜进入细胞。随着点击化学的发现,生物正交反应的发展给 ABPP 技术带来了长足的发展。给活性分子引入更小的炔烃修饰,等活性分子进入细胞后,再通过点击化学反应对蛋白配体复合物中的配体进行生物素化修饰,从而可以进行进一步的靶蛋白富集鉴定。
二 ABPP 主要实验步骤

1. 探针制备:活性分子探针的设计合成,以及探针活性鉴定
2. 将探针与总蛋白孵育(或与细胞孵育后提取总蛋白)
3. 上述孵育完成后,先后进行 UV 照射(使活性分子与靶蛋白共价相连)、点击化学反应(给活性分子引入报告基团,如生物素)
4. 通过报告基团对靶蛋白进行富集鉴定



图2 ABPP 实验基本流程图

三 案例介绍

案例一:基于 ABPP 技术的绿原酸(Chlorogenic acid)靶蛋白鉴定[1]

研究者将光报告分子-双吖丙啶连接到 CGA 上。实验时,将 PAL/CGA 探针与线粒体蛋白混合进行孵育,同时平行组加入未标记的 CGA(作为对照),孵育完成后,使用 UV 进行照射,使光亲和分子与靶蛋白之间形成牢固的共价键,随后通过点击化学反应给探针连上生物素标记,最后通过链霉亲和素富集靶蛋白并通过质谱鉴定。经质谱鉴定,线粒体乙酰辅酶A乙酰转移酶1(ACAT1)可能是 CGA 的直接作用靶点。该研究借用 ABPP 技术筛选到了绿原酸(CGA)潜在蛋白靶点 ACAT1,并通过 SPR(表面等离子共振)、ITC(等温滴定量热)、TSA(热迁移)以及 DARTS(drug affinity responsive target stability)等实验进一步证明了 CGA 与 ACAT1 蛋白的相互作用。



图3 本研究思维导图





图4 本研究活性探针结构及 SPR(表面等离子共振)、ITC(等温滴定量热)、TSA(热迁移实验)和 DARTS(drug affinity responsive target stability)证明 CGA 和 ACAT1 蛋白的相互作用

Photoaffinity purification

CGA was used as a control to compare with PAL/CGA, a photoaffinity labeling probe. CGA was incubated with mitochondrial proteins at 50 mmol/L, while PAL/CGA was added at 10 mmol/L, both at 4 ℃ for 2 h. Subsequently, the samples were exposed to UV light (365 nm) at 4℃ for 30 min, followed by the addition of azide biotin at 20 mmol/L. A catalyst, composed of CuSO4 (20 mmol/L) and TECP (25 mmol/L), was used to reduce Cu(II) to Cu(I), and THPTA (60 mmol/L) was added to stabilize Cu(I). After 18 h of rotation at room temperature, proteins were precipitated with cold acetone, washed thrice, and dissolved in 1% SDS in PBS. PAL/CGA-bound proteins, isolated using streptavidin beads (Invitrogen), were eluted, subjected to SDS-PAGE, and visualized with Coomassie blue staining. Bands differing in abundance between the CGA-preincubated and control samples were analyzed by LC‒MS/MS using a Q Exactive Mass Spectrometer (Beijing Protein Innovation, China). Protein identification was performed using Mascot Daemon (version 2.3.0).
案例二:基于 ABPP 技术解析由 FBP 及其靶蛋白 ALDH2 介导的存在于线粒体途径的糖代谢信号感知机制[2]

研究者将光报告分子-双吖丙啶连接到 FBP 上。实验时,将 FBP 探针与细胞进行孵育,孵育完成后,使用 UV 进行照射,使光亲和分子与靶蛋白之间形成牢固的共价键,随后对细胞进行裂解,用点击化学反应给探针连上生物素标记,最后通过链霉亲和素富集靶蛋白并通过质谱鉴定。经质谱鉴定,线粒体代谢酶-乙醛脱氢酶2(ALDH2)可能是 FBP 的直接作用靶点。通过分子对接(molecular docking)、MST(微量热泳动)、小分子免疫荧光、小分子pull-down 等实验进一步验证了 FBP 和 ALDH2 之间的相互作用。并通过活细胞实验进一步阐明了 FBP 介导的糖代谢信号感知机制。



图5 本研究思维导图







图6 本研究 ABPP 基本实验流程图及分子对接(molecular docking)、MST(微量热泳动)、小分子免疫荧光、小分子pull-down 验证 FBP 和 ALDH2 存在相互作用

Quantitative chemoproteomic profiling of FBP-interacting proteins in living cells

For the profiling of FBP-interacting proteins in living cells, HepG2 cells were seeded into a 15-cm dish (20 × 106 cells per plate) overnight with DMEM (Gibco, C11995500CP) containing 10% fetal bovine serum (Excell), 1% Penicillin/Streptomycin (Gibco, 15140122). The growth medium was aspirated, and the cells were washed with PBS gently for three times. The cells were treated with 1 mM PA-FBP for 90 min with or without UV light irradiation (365 nm, 5 min), and 1mM PA-FBP with excess FBP (TargetMol, USA, T8074) for 90 min with UV light irradiation (365 nm, 5 min). The cells were washed with PBS. Cells were then dislodged by scraping in PBS, pelleted by centrifugation at 500 g for 5 min at 4 ℃. The cell pellets were stored at -80 ℃. The cells were lysed by sonication in ice with ice-cold 0.1% TritonX-100/PBS buffer and cell lysates were collected by centrifugation (20,000 g, 30 min) at 4 ℃ to remove the debris. The protein concentration was determined by using the PierceTM BCA Protein Assay kit (Thermo Fisher Scientific). 1 mL cell lysates (2 mg/mL) were reacted with 1 mM CuSO4, 100 µM TBTA ligand, 100 µM Biotin-PEG4- amino-t-Bu-DADPS-C6-azide (1260247-50-4), and 1 mM TCEP for 1 h at room temperature. The resulting click-labeled lysates were precipitated by 4000 µL methanol, 1000 µL chloroform and 3000 µL Milli-Q water and then washed twice with 1 mL cold methanol. The proteins were resuspended in 1 mL PBS containing 1.2% SDS. 100 µL streptavidin beads (Thermo Fisher Scientific) were washed for three times and resuspended in 5 mL PBS, which was added to the protein solution. The resulting solution was incubated for 4 h at 29 ℃, followed by washing with 5 mL PBS for three times, and 5 mL distilled water for three times. The resulting beads were resuspended in 500 µL PBS containing 6 M urea and 10 mM DTT and incubated at 37 oC for 30 min, followed by addition of 20 mM IAA for 30 min at 37 oC in the dark. The beads were then collected by centrifugation and resuspended in 200 µL PBS containing 2 M urea, 1 mM CaCl2 and 0.5 µg Lys-C and 2.5 µg trypsin (Enzyme & Spectrum). Trypsin digestion was performed at 37 oC with rotation 16 h and the beads were washed with 200 µL distilled water for three times. For dimethyl labeling, per 100 µL peptides were reacted with 4 µL of 4% “light” formaldehyde (CH2O) (Sigma) and 4 µL of 0.6 M Sodium cyanotrihydridoborate (Sigma), “Medium” formaldehyde (CD2O) (Sigma) and 4 µL of 0.6 M Sodium cyanotrihydridoborate, “heavy” formaldehyde (13CD2O) (Sigma) and 4 µL of 0.6 M Sodium cyanoborodeuteride (Sigma), respectively. The resulting solution was incubated at room temperature for 2 h. The reaction was quenched by adding 16 µL 1% ammonia and 8 µL 5% formic acid. Samples from the “light”, “medium” and “heavy” groups were 1:1:1 mixed and the mixture was collected and desalted with C18 tips (Thermo Fisher Scientific). Eventually, samples were submitted and analyzed by LC-MS/MS using Orbitrap Fusion™ Lumos™ (Thermo scientific, USA). The mass spectrometry proteomics data have been deposited to the ProteomeXchange Consortium via the PRIDE partner repository with the dataset identifier PXD048495 (https://www.ebi.ac.uk/pride/).
四 参考文献

[1] Wang QH, Du TT, Zhang ZH, Zhang QY, Zhang J, Li WB, Jiang J-D, Chen XG, Hu H-Y. Target fishing and mechanistic insights of the natural anticancer drug candidate chlorogenic acid, Acta Pharm Sin B 2024; https://doi.org/10.1016/j.apsb.2024.07.005.
[2] Li, Tian & Wang, Anhui & Zhang, Yanling & Chen, Wei & Guo, Yanshen & Yuan, Xia & Liu, Yuan & Geng, Yiqun. (2024). Chemoproteomic Profiling of Signaling Metabolite Fructose-1,6-Bisphosphate Interacting Proteins in Living Cells. Journal of the American Chemical Society. 146. 10.1021/jacs.4c01335.
回复 支持 反对

使用道具 举报

发表于 2025-5-11 16:22 | 显示全部楼层
基于质谱的化学蛋白质组学
<hr/>第一章 鸟枪法蛋白质组学(Shotgunproteomics)
1.1 简介

1.1.1 术语

基于质谱的蛋白质分析主要有两种策略:自上而下(top-down)的方法和自下而上(bottom-up)的方法。这里的top和bottom指的是分析样品的复杂度,即更复杂的“蛋白质”和不太复杂的“肽段”。在自上而下的蛋白质分析中,完整的蛋白质通过质谱进行分析。质量信息和碎片离子由完整的蛋白质离子产生,然后直接用于蛋白质鉴定和表征。相比之下,自下而上的方法首先通过化学或酶解的方式将蛋白质消化成肽段,然后用串联质谱分析肽段,并将肽段分子量和碎片信息与原始蛋白质或蛋白质混合物(组)进行匹配。当采用自下而上的方法分析蛋白质混合物时,由于与鸟枪法基因组测序相似,因此称为鸟枪法蛋白质组学。
1.1.2 鸟枪法的特点

在现代仪器上进行的经典鸟枪法蛋白质组学实验中,人们能从哺乳动物细胞中识别出1000到10000种蛋白质。相比之下经典自上而下的分析方法识别数百种蛋白更加耗时耗力,完整蛋白质在分子量、电荷状态、疏水性、分子结构等方面高度复杂,很难找到最佳条件来批量的理想的分离、碎裂和检测样品中的所有蛋白质。
1.1.3 鸟枪法的优势

与完整的蛋白质相比,肽段的分子量和电荷状态范围较窄,是一种更加统一的分析物。由于大多数消化得到的肽段都会变性,因此肽段的形状也更加统一。因此,与自上而下的方法相比,从肽段开始具有相当大的优势,包括更强大的液相分离、更均匀的电喷雾电离、串联质谱(MS/MS)中更完全的碎裂,以及更容易解释简化的碎裂模式。由于这些优势,鸟枪法蛋白质组在过去二十年中成为了蛋白质分析的主流策略。
1.2 鸟枪法蛋白质组概述

经典的鸟枪法蛋白质组学实验包含三个主要步骤:1)样品制备,2)质谱数据采集,3)数据处理。样品制备步骤将生物样品转化为肽段混合物;数据采集步骤从肽段混合物中获得MS/MS数据;数据处理步骤进行统计和计量分析,以阐明肽段和蛋白质的身份信息和数量关系。



图1.1

在样品制备步骤中,首先从生物样品(例如细胞裂解液或血清)中分离蛋白质和非蛋白质含量,获得蛋白质混合物进行化学变性(还原和烷基化)以破坏所有的Cys-Cys二硫键,从而使蛋白质线性化。然后将蛋白酶(例如胰蛋白酶Trypsin)添加到变性的蛋白质混合物中,将蛋白质消化成肽段。得到的肽段通常通过C18柱上清洗以除去非肽段成分(盐、buffers、变性剂等)。
样品酶解和除盐后,使用LC-MS系统对肽段进行分离,以增加从肽段混合物中获得的MS/MS的数量。由于消化的蛋白质混合物可以产生非常复杂的肽混合物,为了更好地分离肽混合物,各种类型的分离柱已被单独或组合使用,包括反相(RP),强阳离子交换(SCX),尺寸排阻(SEC),亲水相互作用液相色谱(HILIC)和亲和纯化。一般来说使用反相色谱柱作为肽段进入电喷雾电离前的最终分离方法,因为这种方法可去除盐和其他小分子干扰物。分离后的肽经过离子源被电离后进入质谱仪进行分析,在此步骤中,肽混合物首先通过液相色谱在时间上分离,然后通过电场在空间上分离。这种分离级联提供了足够的分辨率,可以在数小时内分离数十万种肽类。
在最后的数据处理步骤中,对每种检测到的肽类物质获得的数据(包括MS(整体质量)和串联MS/MS(碎片质量)数据)进行分析,通过搜索序列数据库的算法将光谱与原始蛋白质序列进行匹配。如果需要,还可以通过“标记”或“非标记”方法进一步分析数据以进行定量分析。
1.3 样品制备

1.3.1 蛋白提取

1.3.1.1 概述
为了分析复杂生物样本中的蛋白质,通常需要将蛋白质与干扰小分子和核苷酸分离。这通常通过非特异性蛋白质提取(例如蛋白质沉淀或离心)来完成。一些常用的蛋白质沉淀试剂/溶剂/系统包括三氯乙酸(TCA)/水、氯仿/甲醇/水,丙酮,苯酚/醋酸铵/甲醇等。这些方法可以有效地将蛋白质与其他分子(如盐、脂质、去污剂(裂解过程中引入)、DNA/RNA、水性缓冲液)分离。因此,蛋白质被纯化和浓缩以供进一步处理。蔗糖梯度等离心法对于此目的也非常有用,但由于其通量和效率较低,因此通常与蛋白沉淀法结合使用,以从特定细胞器中分离蛋白质。
1.3.1.2 2D-凝胶方法(胶内酶解)
二维聚丙烯酰胺凝胶电泳(2D-PAGE)是一种稳健的正交方法,广泛用于同时分离和分级从生物样本中回收的复杂蛋白质混合物以进行蛋白质组学分析。该方法可以根据单个凝胶中的分子量和等电点分离数千种蛋白质。它曾经是最广泛使用的蛋白质分离方法之一,并已用于与蛋白质和蛋白质复合物相关的研究。一旦通过2D-PAGE实现分离,就可以可视化蛋白质点或条带,然后提取。考马斯亮蓝或银染色通常用于蛋白质可视化。考马斯亮蓝通常比银染色更受欢迎,因为它是一种可逆染色,并且与MS分析兼容。
1.3.1.3 膜蛋白分离
膜蛋白是细胞核和细胞膜的组成部分,它们永久的锚定在膜的外表面或嵌入脂质双分子层中,并积极参与许多重要的细胞功能,包括离子和分子的运输、通过主动细胞信号传导进行的细胞通讯以及细胞相互作用。据估计,大多数基因组中20%-30%的基因与膜蛋白有关,因此是导致许多致命疾病(如癌症、神经退行性疾病、糖尿病等)病理的原因。因此这些蛋白质已成为现代药物的主要靶点。然而由于这些蛋白质的疏水性强、丰度低,因此分离它们是一项非常具有挑战性的任务。开发识别和表征膜蛋白的新技术是蛋白质组学的一个重要问题。
传统上,膜蛋白是通过蔗糖梯度离心和类似的方法分离的,这些方法可以直接从细胞和组织中分离亚细胞膜蛋白。对于组织样本,Smolders等报道了在小组织样本上使用生物素化标记来克服提取效率差、富集效果弱、样品污染等问题的方法。对于细胞样品,通过使用精心优化的条件和特定的中性洗涤剂(CA-630),Pankow等人表明可以在细胞裂解过程中将膜蛋白保留在其天然状态,在这种条件下,膜蛋白及其相互作用物可以共免疫沉淀,随后通过LC-MS进行表征。
1.3.1.4 亚细胞分离
亚细胞蛋白质分离同样具有挑战,通常采用生化方法和离心方法从全细胞提取物中分离特定的细胞器或区域,例如细胞核和线粒体。亚细胞器分离主要考虑的要素是分离的特异性和效率。具有脂质双层膜的细胞器(如细胞核和线粒体)可以通过离心或流式细胞术有效分离,同时保持完整性。分离后,可以对分离的完整细胞器(例如分别来自小鼠心脏和骨骼肌的线粒体)进行进一步分析,以研究磷酸化和羧化等翻译后修饰(PTM)等。由于分离困难,内质网、高尔基体和溶酶体等其他细胞器的研究较少。此外这些细胞器的蛋白质含量也被认为更具短暂性和动态性。
1.3.1.5 蛋白质富集
在许多情况下,需要从细胞裂解物中特异性地富集蛋白质子集,例如低丰度蛋白质或具有PTM的蛋白质,以实现更好的定量和鉴定。这主要是由于蛋白质表达的动态范围非常高,而质谱仪提供的动态范围有限,两者不匹配。因此,在样品制备过程中,通常会使用亲和纯化等蛋白质富集技术(通过抗体或其他亲和方法)来检测复杂样品中的低丰度蛋白质。
1.3.1.6 磷酸化蛋白质
磷酸化蛋白质通常丰度较低,但它们在细胞信号传导中起着至关重要的作用。通过亲和纯化富集,使用固定化金属亲和色谱(IMAC)或金属氧化物亲和色谱(MOAC),可以有效地将磷蛋白鉴定率提高几个数量级。该方法基于磷酸基团对Zn2+、Fe3+、Ti4+等阳离子的高亲和力。该方法已成功用于磷酸化蛋白质和磷酸化肽的离线和在线分离。金属氧化物如二氧化钛(TiO2)可用作非常强大的螯合剂,从而提供特定的磷酸化肽富集。为了克服非特异性螯合,在IMAC富集之前对酸性残基进行酯化可以显著提高富集的特异性。
免疫沉淀是另一种用于富集磷酸化蛋白质的技术。通过使用高度特异性的抗磷酸酪氨酸抗体,可以高度特异性地富集含有磷酸酪氨酸的磷蛋白。然而,抗体的高特异性也与对某种类型的磷酸化或某些肽序列的富集偏向有关。因此,可以一起使用两种或多种抗体来针对不同的磷酸化位点。
1.3.1.7 糖蛋白
另一种非常常见的PTM是蛋白质的丝氨酸、苏氨酸和天冬酰胺残基的单糖或寡糖糖基化。与磷酸化类似,糖蛋白在质谱分析之前进行富集可以显著提高鉴定数量。一些最常见的糖蛋白富集技术包括HILIC、离子交换色谱、基于凝集素的亲和纯化、基于抗体的亲和纯化以及共价相互作用的形成,例如酰肼和硼酸化学。在所有现有技术中,与其他几种技术相比,基于ZIC‐HILIC(两性离子亲水相互作用液相色谱)的糖肽富集已被证明在N-糖肽分离中具有高效性和特异性。然而,由于复杂聚糖的多样性,不同类型的技术往往具有很好的互补性,多种技术的组合可以显著提高糖蛋白的鉴定和定量结果。
1.3.1.8 AP-MS和互作组
在过去十年中,非变性条件下的亲和纯化与质谱联用(AP-MS)已成为鉴定目标蛋白和相互作用蛋白的流行技术。当通过亲和纯化在非变性条件下捕获蛋白质时,其相互作用蛋白通常会被一起捕获。通过使用适当的对照仔细评估背景蛋白和非特异性相互作用物,通常可以区分特定的相互作用物。同一蛋白质复合物的多个成员的迭代AP-MS实验也可用于交叉验证真正的相互作用。近年发表的两张大型蛋白质相互作用组图谱均采用大规模AP-MS方法。两项相互作用组研究合计涵盖了来自人类细胞(HeLa和HEK293T)的6000多种诱饵蛋白和12000多种相互作用蛋白。这些信息提供了有关蛋白质-蛋白质相互作用、蛋白质动力学和细胞行为(包括多酶复合物的功能、细胞和组织之间的串扰以及酶的功能)的宝贵知识。
培养细胞系中简单分离蛋白质样本的Protocol
1)收细胞,用PBS缓冲液清洗细胞几次以去除细胞外液,然后离心细胞沉淀。
2)将尿素裂解缓冲液(30mMTris、8M尿素、2M硫脲、4%CHAPS,每10ml溶液添加蛋白酶抑制剂,添加benzonase消化DNA)加入细胞沉淀中,体积比约为3:1至5:1(缓冲液与沉淀)。上下吹打以将沉淀重新悬浮在缓冲液中。
3)在冰上超声处理30秒,冷却60秒,重复三次。
4)以最大旋转速度离心沉淀碎片,取上清液,并使用Bradford测定或UV确定上清液中的蛋白质浓度。
5)向100μl上清液中加入400μl甲醇,充分涡旋,然后加入100μl氯仿。再次充分涡旋并加入300μl水。此时样品应看起来浑浊。充分涡旋并以14000g离心两分钟。
6)吸出顶部水层。蛋白质存在于各层之间,可能看起来像薄薄的晶片。
7)加入400μl甲醇,充分旋涡,以14000g离心三分钟,然后尽可能多地吸出甲醇,但不要扰动蛋白质沉淀(在底部)。
8)用真空泵抽吸剩余的有机溶剂。避免干燥时间过长,否则沉淀可能更难重新溶解。
1.3.2 蛋白质修饰

1.3.2.1 概述
样品制备阶段进行蛋白质修饰的主要目的之一是使蛋白质线性化,从而有利于下游蛋白质消化和随后的蛋白质推断。这主要涉及用DTT或TCEP还原Cys-Cys二硫键,然后用氯乙酰胺或碘乙酰胺进行烷基化以防止重新形成二硫键。在某些特殊情况下,Cys-Cys二硫键也可以保留以进行结构解析。肽N端和赖氨酸的E胺的修饰通常用于添加“标签”以进行“标记定量”(将在后面的1.5.2节中讨论),例如二甲基标记、用于相对和绝对定量的同量异位素标签(iTRAQ)和串联质谱标签(TMT)标记。蛋白质修饰的另一个重要原因是在消化之前保留蛋白质-蛋白质相互作用信息。这通常涉及相邻蛋白质的化学修饰。经典技术是化学交联,利用化学反应将非共价、瞬时蛋白质相互作用转化为共价、永久化学键。最近的发展是邻近标记方法,使用融合的混杂生物素连接酶或过氧化物酶标记邻近的蛋白质。
1.3.2.2 二硫键还原和烷基化
通常,蛋白质分离后,二硫键首先被DTT或TCEP还原。断裂Cys-Cys键使蛋白质线性化,因此阻止了消化后形成含有二硫键的支链肽。然而,在某些特殊情况下,需要确定二硫键的位置以阐明蛋白质结构或蛋白质相互作用,这些二硫键可以保留或部分还原以进行下游分析。用氯乙酰胺或碘乙酰胺对游离Cys进行烷基化可防止二硫键重新形成。值得注意的是,碘乙酰胺具有更高的反应性,可以快速烷基化其他氨基酸以及N端。因此,氯乙酰胺通常被用作防止脱靶烷基化的替代品。
1.3.2.3 化学交联
在酶解消化前进行蛋白质修饰的另一个重要应用是保存有关蛋白质相互作用和最近“邻居”的信息。例如通过将非共价的瞬时蛋白质相互作用转化为永久的共价键而进行交联。在交联实验中,蛋白质复合物通常以最简单的形式进行化学交联,以方便进一步酶解消化。这一过程通过将纯化的蛋白质复合物与交联试剂一起孵育,用共价相互作用取代暴露于氨基酸残基的表面的非共价相互作用。然后,在合适的蛋白酶的帮助下消化蛋白质样品,并通过LC-MS/MS进一步分离和分析。此外,结合新型化学交联剂和先进的数据分析平台,可以从交联蛋白质组学分析中获得蛋白质复合物和蛋白质-RNA复合物的结构信息。这种对复杂蛋白质混合物中的交联肽进行大规模分析的能力是该领域的重大发展之一。
1.3.2.4 邻近标记
邻近分析通过将共价标签引入诱饵的邻近蛋白质,提供了一种研究可能或不可能相互作用的蛋白质附近蛋白质的方法。通常,混杂的生物素连接酶与诱饵蛋白融合,然后与诱饵一起在细胞中表达。添加生物素后,生物素连接酶将用生物素标记相邻的蛋白质。然后裂解细胞并通过链霉亲和素珠富集生物素化的蛋白质。通过仔细比较生物素化的蛋白质与对照,可以识别诱饵蛋白附近的蛋白质。这种方法可以在活细胞中使用,并允许直接研究生理相关的相互作用。成功实现该方法的两个先决条件是与融合蛋白的适当匹配和特异性标记蛋白质的分离。
三种不同类型的酶已被广泛用于邻近标记;BirA生物素连接酶可将生物素引入BirA附近的蛋白质(BioID),辣根过氧化物酶(HRP)可将羟基引入相邻蛋白质(APEX),以及工程抗坏血酸过氧化物酶可实现更快的标记。已经开发了这些酶的各种版本,可提供更快、更清洁的标记。值得注意的是,该方法的变体也可以用于固定组织和固定细胞样本,只需使用特异性抗体和HRP偶联的二抗即可。
1.3.3 蛋白酶解

自下而上的蛋白质组学的关键步骤是蛋白质酶解消化,将差异巨大的蛋白质转化为大小、形状和电荷更均匀的肽。消化通常允许在不同水平上进行,并且使用不同的蛋白酶组合。常用的消化蛋白酶是胰蛋白酶、糜蛋白酶、弹性蛋白酶和内切蛋白酶,如Lys-C、Lys-N和Arg-C。最常用的酶是胰蛋白酶。胰蛋白酶是一种高度特异性的丝氨酸蛋白酶,在最佳pH值为8和37°C时活跃。它在赖氨酸(K)和精氨酸(R)的C端侧切割,除非脯氨酸(P)位于Arg或Lys的羧基侧。当切割位点两侧存在酸性残基时,水解的特异性和速度都会降低。胰蛋白酶的特异性确保大多数胰蛋白酶消化的肽具有至少两个带正电荷的残基(两端为R–R、R–K、K–R或K–K),这有助于通过LC-MS/MS进行下游肽鉴定。
可以定期实施其他几种策略来提高消化质量并改善蛋白质鉴定。添加MS兼容的表面活性剂有助于更好地溶解和展开蛋白质。可以添加各种市售表面活性剂,如ProteaseMAX、Invitrosol、Rapigest等,以减少蛋白质消化时间并消化难以消化的蛋白质。通常,当使用单一酶进行消化时,从鸟枪法蛋白质组学实验中鉴定出的蛋白质的序列覆盖率远低于50%,也就是说,该蛋白质的大部分氨基酸序列尚未被质谱仪检测到。原因是消化后的蛋白质中的许多肽太长、太短或难以电离,因此很难检测。为了提高序列覆盖率,可以组合使用多种酶,包括高度特异性和非特异性酶。因此,相同的序列被不同地消化并产生各种消化肽,这提高了质谱分析检测的机会。
还原烷基化和酶解Protocol:
1)将蛋白质沉淀溶解在 8 M 尿素溶液中(对于 2.4 g 尿素,添加 1 ml 500 mM Tris pH 8.5、2.2 ml 水)。对于每 50–100μg 蛋白质,添加 60μl 上述溶液。
2)对于 60μl 蛋白质溶液,添加 0.3μl 1M TCEP 使最终浓度为 5mM。在室温下轻度摇动孵育 20 分钟。
3)对于 60μl 蛋白质溶液,添加 6.6μl 500 mM 2-氯乙酰胺并在室温下孵育 15 分钟,避光保存。
4)对于 60μl 蛋白质溶液,用 180μl 100 mM Tris pH 8.5 缓冲液将样品稀释至总量 240μl。加入 2.4μl 100 mM CaCl2 至最终浓度为 1 mM。加入MS级胰蛋白酶溶液(0.5μg/μl),重量比为 1:20 至 1:100(胰蛋白酶:蛋白质)。
5)在黑暗中于 37°C 孵育四小时至过夜。
6)加入 13.5μl 90% 甲酸至最终浓度为 5%。
7)以最大速度离心 15 分钟,将上清液转移到新管中,在 −80°C 下冷冻,或直接送去进行 LC-MS/MS 分析。
1.4 肽分离和数据采集

1.4.1 肽分离

与完整蛋白质相比,使用自下而上的蛋白质组学最显著的优势之一是更容易通过液相色谱分离肽。酶消化后,消化的肽在形状、大小和电荷上比蛋白质更加均匀。使用色谱技术,如离子交换 (IXC)、RP 或 IXC 和 RP 的组合,如多维蛋白质鉴定技术 (MudPIT),可以通过表面电荷和疏水性有效分离肽。
1.4.1.1 反相(ReversedPhase,RP)
如今,最常用的肽分离技术是纳升电喷雾和反相纳升液相色谱。该方法涉及将肽片段直接加载到纳升毛细管柱上,根据不同的疏水性将它们分离并进一步处理。一旦分离完成,肽段就会直接从毛细管尖端电喷雾到质谱仪中。高效液相色谱 (HPLC) 或超高效液相色谱 (UPLC) 与先进的质谱仪相结合,可以实现高效分离,在一小时内识别出 1000 多种蛋白质。如果色谱柱更长、分离时间更长,在某些情况下,单个反相 LC-MS/MS 系统也可以识别出 5000 多种蛋白质。
1.4.1.2 HILIC
HILIC 根据肽与离子树脂的亲水相互作用来分离肽,在肽分馏和 PTM 分析中得到广泛应用。静电排斥-亲水相互作用色谱 (ERLIC) 是 HILIC 的一种特殊形式,使用弱阴离子交换 (WAX) 树脂。与反相液相色谱 (RPLC) 不同,肽在两种分离模式下保留。在有机到水梯度的早期,亲水相互作用占主导地位,就像在 HILIC 中一样,而在 RPLC 中则相反。然而,随着洗脱缓冲液中水含量的增加,碱性肽会静电排斥 WAX 树脂,而酸性肽会被保留,直到它们与 WAX 树脂的亲水相互作用在梯度后期被破坏。这些与 ERLIC 叠加的分离机制比 RPLC 更好地将肽分布在梯度上,并且通过对较大肽进行更高置信度的光谱匹配,基于肽和蛋白质的鉴定,其表现优于 RPLC。
1.4.1.3 MudPIT
酶切后,肽种类繁多,蛋白质种类之间数量差异巨大,导致肽混合物高度复杂。正交分离方法(如 SCX 和 RP)的组合有助于更好地分离不同的肽种类,从而实现更好的蛋白质组覆盖率。在典型的 MudPIT 分离中,首先将肽混合物上样到短 C18 + SCX 毛细管柱上(2.5 cm 的 C18,然后是 2.5 cm 的 SCX 树脂,如图 1.2 所示)。然后将 C18 + SCX 柱与带有针头端用于电喷雾的分析 C18 毛细管柱连接。在典型的 12 步 MudPIT 实验中,第一步使用缓冲液 B 的梯度将所有肽从短 2.5 cm C18 柱洗脱到 SCX 树脂上。在所有后续步骤中,首先使用缓冲液 C 将一部分具有不同表面电荷的肽从 SCX 树脂洗脱到分析柱上。然后用缓冲液 B 梯度的 C18 分析柱分析洗脱的肽。



图1.2

1.4.1.4 毛细管电泳
毛细管电泳也重新成为鸟枪法蛋白质组学中一种补充、更灵敏且可行的选择,这主要归功于电喷雾接口的改进。为了提高全面性,在 nLC-ESI 之前对肽进行分馏最初是使用 SCX 树脂在线进行的,以最大限度地减少离线分馏和自动进样器固有的转移造成的样品损失。
1.4.2 肽段离子化

分离后,肽通过各种电离方法电离到气相并进入质谱仪。鸟枪法蛋白质组学允许实施两种主要的电离方法,用于离子带电并将肽片段转移到气相中,即纳电喷雾 (nESI) 和 MALDI。纳电喷雾技术因其易于使用和卓越的灵敏度而广泛应用于寡糖、糖苷和糖蛋白的分析质谱。在自下而上的蛋白质组学中,nESI 仅需最少的样品就能提供出色的灵敏度。与纳电喷雾相比,MALDI 既可以提供无损汽化,也可以电离许多大分子和小分子。虽然纳电喷雾是鸟枪法蛋白质组学中最常用的方法,但 MALDI 越来越多地用于基于质谱的成像,因为它可以提供空间信息和质量信息。
1.4.3 质量分析器

在过去的二十年中,质谱仪取得了重大进展,前端自动化方法得到发展,人类基因组计划得以完成;肽鉴定、表征等肽进一步分析的应用也大大增加。在这方面,已经开发出多种采用混合技术的自动化仪器,包括同时进行分离、定量和数据分析。在这方面,一些被证明适合分析复杂肽混合物的常见质谱分析仪包括线性离子阱 (LIT)、Orbitrap、傅里叶变换离子回旋共振 (FT-ICR)、四极杆和飞行时间 (TOF)。所有这些质谱分析仪都允许使用不同的机制,在不同界面处轻松分离和准确测量肽质量;通过保持速度和灵敏度之间的比例平衡。在本文提到的这些分析仪中,在蛋白质组学领域得到广泛应用的最先进的质谱仪是 LIT。
此外,值得注意的是,离子阱质谱法在现代仪器世界中发挥着主导作用,因为它能够以相同的灵敏度和特异性识别和量化高分子量和低分子量的纯肽。因此,线性离子阱质谱仪基本上可以发挥所有作用,即离子选择、离子捕获、离子碎裂以及低分辨率质谱分析。在最初无偏采样的基础上,借助数据相关采集来识别样品中的肽。LIT 的升级版涉及四个细长的平面电极,它们平行安装以最大限度地提高径向和轴向离子捕获的潜力。一旦样品被电离,肽离子就会被捕获在 LIT 内。施加在阱内的射频电压增加,从而启动离子从离子阱喷射到四极杆外的探测器。通过初始前体离子扫描,可以识别丰富的肽前体离子 m/z 值,然后选择已识别的肽前体离子,然后通过扫描出所有其他离子来分离。捕获的离子被平移激发,导致与氦浴气发生碰撞,从而通过将平移能量转化为振动能量来振动激发离子。随着振动能量的增加,共价键开始碎裂,当发生这种情况时,产生的碎片离子不再被激发。因此,碎片离子被扫描出离子阱。通过使用数据独立采集和连续的小(10-25 m/z)离子隔离窗口,实施一些扫描策略以创建肽离子的无偏采样。此外,通过发明 2D LIT 以及随后创建分段 2D LIT 将离子捕获和碎裂与质量分析分开,离子阱中的采样速度从 3D 离子阱得到了改进。分段阱允许使用不同的气压。
2D LIT 也是一种有用的技术,可用于创建混合质谱仪,将离子捕获和 MS/MS 功能结合到质谱仪中,而这些步骤在质谱仪中很难或不可能执行。例如,2D LIT 与 FT-ICR 质谱仪连接,为 LIT 的功能添加了高分辨率和高精度质谱仪。LIT 还添加到 Orbitrap 质谱仪中,以创建强大的混合质谱仪。Orbitrap 质谱仪检测肽离子产生的离子电流的频率,肽离子沿中心电极振荡,频率与 (m/z)−1/2 成比例。基于频率的信号可以重复测量而不会丢失肽离子,因此可以提高准确性。然后使用傅里叶变换将频率信号转换为高精度的 m/z 值。 Orbitrap 质谱分析仪的引入显著改善了 PTM 分析和同位素标记定量。FT-ICR 仪器是专门根据离子质荷比 (m/z) 原理工作的分析仪,与 Orbitrap 相比,它仍具有更高的质量精度。然而,与 Orbitrap 仪器相比,FT-ICR 仪器的价格和尺寸通常较低,这限制了 FT-ICR 在许多应用中的使用。
1.4.4 肽段裂解方法

随着质谱技术的改进,鸟枪法蛋白质组学取得了进展,提供了更好的数据准确性和量化,以实现更广泛的蛋白质组覆盖率。通过肽段气相碎裂方法的进步,可以进一步提高蛋白质组覆盖率。虽然开发仍在继续,但目前,各种现代方法都可用于离子碎裂,提供有关给定分子结构和组成的不同信息。最常用的方法仍然是碰撞诱导解离 (CID) 和碰撞活化解离 (CAD)。
1.4.4.1 CID/HCD
CID 是一种质谱技术,由于其效率高、碎片可预测且易于使用,已被公认为最值得信赖的气体分子离子碎片化选择。通过 CID 生成的离子可用于多种用途。这种类型的激发主要与 LIT 和束流型碰撞活化有关,优于三重四极杆等质谱仪。在离子阱仪器中,前体离子的运动通过共振激发增加,从而产生离子与中性分子的更有力的碰撞。共振激发与 3D 和 2D 离子阱仪器有关。一般来说,常见的离子是 b 型和 y 型,在 N 端和 C 端留下正电荷和负电荷(图 1.3)。由于共振激发基于离子在阱中的运动,而该运动又基于离子的 m/z 值,因此一旦发生碎裂事件,产生的碎片离子就会脱离激发频率,不再受到激发。
当离子通过包含高气压(几毫托)的四极杆时,离子会与气体发生碰撞,直到达到足够的振动能量以发生碎裂,这时束流型仪器(如三重四极杆或四极杆 TOF)中的离子就会被激活。与离子捕获仪器不同,当产生碎片离子时,它们在通过四极杆碰撞室时会继续发生高能碰撞。Orbitrap 混合器开发了传统束流仪器中使用的碰撞室的变体。在此装置中,前体离子被加速进入碰撞室,然后返回到注入点,有效地在碰撞室中上下移动。与离子阱中的碎裂相比,碰撞中的碎裂的优势在于碰撞没有较低的 m/z 截止值,因此可以检测到亚胺离子,并且可以观察到来自 TMT 类实验的报告离子。



图1.3

1.4.4.2 ETD/ECD
基于碰撞的碎裂方法由振动能量输入离子驱动。这种能量在离子的整个键中随机化,然后最弱的键碎裂,这是一个遍历过程。电子捕获方法(例如 ECD 和 ETD)可能导致离子在电子捕获或转移的位置快速碎裂,因此被认为是非遍历的。该方法中使用的电子是热电子或从带负电的荧蒽转移的电子,主要产生 c 型和 z 型离子(图 1.3)。ETD/ECD 通常可以提供一种“更软”的碎裂方法,因为不稳定的 PTM(例如磷酸化和糖基化)得以保留。不稳定的 y-CO2 和 SO3 修饰的定位可以通过 ECD 碎裂来识别。研究表明,CID 可有效识别磷酸肽,而 ECD 更适合磷酸化位点定位。结合使用时,可为已鉴定的磷酸肽提供互补信息和更高的可信度。由于保留了不稳定的修饰部分,ETD 也被认为比 CID 方法更有利于检测磷酸化和糖基化位点。
1.4.4.3 IRMPD/UVPD
高能光也用于碎裂离子。自下而上的蛋白质组学主要有两种光解离方法,即红外多光子解离 (IRMPD) 和紫外光解离 (UVPD)。IRMPD 通常与 FT-ICR 质谱法相结合,并已用于多种分子。红外激光产生低能辐射,主要激发离子中的 O-H 和 N-H 拉伸频率。作为一种碎裂离子的方法,其目标是将足够的能量泵入离子,然后将其分布在整个离子中,从而导致离子更广泛的碎裂。然而,由于离子阱仪器中肽阳离子的活化效率较低,IRMPD 不是自下而上的蛋白质组学的常用碎裂方法。紫外激光产生的光子能量高得多,可用于有效碎裂肽并产生所有六种类型(a-、b-、c-、x-、y-、z-)的碎裂离子(图 1.3)。由于其独特的碎裂能力,UVPD 可以显著提高肽鉴定和序列覆盖率的可信度,尤其是对于酸性肽,它们会优先以负模式而不是常用的正模式电离。
1.4.5 采集模式

在质谱实验中,扫描和碎裂肽离子的数据采集主要有两种策略:数据依赖分析 (DDA) 模式和数据非依赖分析 (DIA) 模式。在 DIA 模式下,质谱仪根据特定前体窗口(例如 4-25 Da)的顺序分离和碎裂来采集数据。此 m/z 窗口内的所有肽物种都会碎裂在一起并在同一 MS/MS 扫描中采集。由于质谱仪在 DIA 模式下不会选择任何离子,因此数据是以稳定的速度和系统的方式采集的。由于缺乏离子选择,在 DIA 模式下采集的 MS/MS 通常包含多个肽离子,这使得在 DIA 中进行肽鉴定成为一项具有挑战性的任务。相比之下,在 DDA 模式下,质谱仪扫描母离子并选择最丰富的离子进行碎裂,窗口约为 2-3 Da。在 DDA 模式下采集的每个 MS/MS 通常只包含一个肽,这简化了肽鉴定。此外,动态排除用于防止质谱仪在设定的时间段(3060 秒)内重复收集特定肽离子 m/z 值的 MS/MS。该技术允许质谱仪扫描独特的肽物种并可以提高检测范围。两种扫描模式之间的主要区别在于,一种是随机收集 MS/MS(DDA),另一种是系统收集(DIA),但两种方法的性能都会随着扫描速度的提高而提高。
1.5生信分析

蛋白质组学的存在是因为能够使用计算机算法来分析和解释质谱数据。蛋白质分离、消化和 LC-MS/MS 数据采集后,获取的数据(MS 和 MS/MS 光谱)需要进一步处理以识别和量化肽,然后是蛋白质。数据分析过程可以极大地影响整个实验的生物学结论,因此需要高精度和准确度。另一方面,现代 LC-MS/MS 系统每小时能够生成 20 000-30 000 张光谱和千兆字节的数据。如此庞大的数据量,加上对精度和准确度的要求,对数据分析提出了巨大的计算挑战。在过去的 25 年里,已经开发出了许多算法和工具来促进自下而上的蛋白质组学数据分析,主要集中在蛋白质组学的三个方面,即肽鉴定、定量和蛋白质相互作用。
1.5.1 肽段鉴定

肽鉴定是自下而上蛋白质组学的基础,因为肽段是质谱仪直接测量的分析物。在 SEQUEST 发明之前,这是一个繁琐且耗时的蛋白质生物化学过程,需要手动解释 MS/MS,SEQUEST 是一种计算机程序,可以自动将 MS/MS 与来自参考序列数据库的肽序列进行匹配。自动肽鉴定使研究人员能够识别数千种肽,从而大大提高了蛋白质组学研究的效率和规模。自 1994 年推出以来,自下而上的蛋白质组学领域蓬勃发展,自下而上的蛋白质组学已成为探测和研究蛋白质组的首选方法。目前,肽鉴定有三种主要的计算方法,即数据库搜索、光谱库搜索和从头测序(De novo)(图 1.4)。



图1.4

1.5.1.1 数据库搜索
第一种肽识别算法是 SEQUEST,一种用于自动肽识别的数据库搜索算法。该软件基于两个重要计算进行计算,确认实验肽序列是否与碎片光谱完美匹配:XCorr 和 DeltaCN。
第一个可以称为理论和实验数据相关性的统计计算;而后者则表示两种可能性之间的差异:最佳光谱匹配和第二佳肽光谱匹配 (PSM)。虽然它是二十多年前首次推出的,但它至今仍是肽识别算法的基准标准。
更一般地说,数据库搜索算法首先将每个 MS/MS 光谱与分子量的所有可能候选肽的所有理论光谱进行比较,以生成 PSM。候选肽是使用预定义的酶特异性和前体质量从预定义的蛋白质参考数据库中计算生成的。将计算和排序实验和理论光谱之间的最佳匹配(PSM),然后使用特定的错误发现率 (FDR) 水平进行过滤,以提供最终的肽识别结果。
蛋白质参考数据库必须包含样本中预期的所有蛋白质序列,类似于用于基因组测序实验的参考基因组。在大多数情况下,反向或随机蛋白质序列也会作为真阴性(诱饵序列)附加到参考数据库中。在肽鉴定后,这些真阴性被用作“内部标准”来估计和调整肽鉴定过程的 FDR。在过去的二十年里,已经开发了各种用于自下而上的蛋白质组学的数据库搜索程序,其中最受欢迎的包括 SEQUEST、MASCOT、Andromeda、MS-GF+、X!Tandem、OMSSA、Comet、Crux、ProLuCID、PeaksDB、pFind、MSFragger 等等。所有这些程序都使用不同的评分方案和算法,但它们都需要蛋白质参考数据库。如果参考数据库中不存在特定的蛋白质或肽,则上述任何程序都无法识别它。幸运的是,下一代基因组测序技术的发展现在为我们提供了前所未有的能力,可以以可接受的成本对几乎任何基因组进行测序。然后可以使用这些基因组来预测和构建蛋白质参考数据库。最受欢迎的蛋白质参考数据库来源是 Uniprot。
1.5.1.2 光谱库搜索
谱库搜索的思路很简单:将实验光谱与现有的标准光谱库进行比较,以找到所有匹配项。这一概念是自 20 世纪 60 年代以来质谱分析中使用的一种长期方法。质谱库基于电子电离光谱,当 MS/MS 技术开发出来时,尚不清楚生成的光谱是否具有足够的可重复性来创建谱库。Yates 等人证明了将肽的 MS/MS 与谱库匹配的能力。用于谱库搜索的软件算法包括 SpectraST、NIST MS Search、M-SPLIT、X!Hunter、BiblioSearch、Pepitome、Bonanza、Tremolo 和 pMatch。由于大多数谱库搜索算法都使用点积计算,不仅利用 m/z 值,还利用碎片离子的强度,因此人们认为谱库比其他肽鉴定方法更灵敏、更可重复。
然而,这一过程中最大的挑战是创建一个合适的光谱库,其中包含大多数预期肽的高质量光谱,以供比较。人类蛋白质组估计含有超过 20 000 种蛋白质。当使用胰蛋白酶作为蛋白酶时,不考虑任何错误切割或任何 PTM,所有可能的胰蛋白酶肽的数量估计约为 500 000-1 000 000。合成肽标准并获取大多数这些肽的质谱是一项艰巨的任务,但并非不可能完成。但如果考虑两个或更多个 PTM,数量将立即超过我们目前的合成能力。此外,如前所述,电离类型、质谱仪类型和碎裂模式极大地影响了所获取光谱的内容。 ETD 碎裂模式获得的标准光谱库包含少量 b 和 y 离子,因此根本无法用于匹配 CID 碎裂获得的实验数据。为了解决这个问题,通常使用 DDA 和数据库搜索识别的高置信度肽来构建光谱库,以便将来在感兴趣的实验系统中进行肽识别。近年来,这种方法在 DIA 数据分析中变得很流行,因为传统的数据库搜索算法不是为分析多重 MS/MS 而设计的。
1.5.1.3 Denovo序列
数据库搜索和光谱库搜索都受到已知序列或已知光谱库的限制。这些方法将肽“测序”的搜索空间限制在已知的序列或光谱“宇宙”内,从而提高了灵敏度、特异性和准确性。对于未知的蛋白质或肽样品(例如土壤提取物),通常很难通过任何一种方法进行肽鉴定,因为序列空间很大且未被可用的基因组序列覆盖。相比之下,从头测序必须搜索几乎无限的序列空间,没有先验序列信息可用作指导。许多先进的统计模型和机器学习方法已被引入用于开发从头测序算法。关键是从 MS/MS 碎片模式中学习肽序列。这是一项艰巨的任务,因为即使肽碎片的物理规则是已知的,也不能保证每个光谱都有一个奇异的解决方案,因为由于缺少碎片离子,光谱中可能存在歧义。在过去的二十年中,已经开发了许多从头测序工具,例如 PepNovo、PEAKS、NovoHMM、MSNovo、pNovo、UniNovo 和 Novor。这些方法大大提高了数据分析的速度和灵敏度,以及对从头测序获得的肽序列的置信度。最近,卷积神经网络 (CNN) 等深度学习算法的加入已显示出处理嘈杂 MS/MS 光谱的巨大改进。然而,应该注意的是,尽管方法不断进步,但从头测序在准确性和特异性方面仍然无法与数据库搜索和光谱库分析获得的输出直接进行比较。
1.5.1.4 Peptide-Centric分析
DIA 越来越受欢迎。在 DIA 中,多个肽被碎裂在一起,形成多重 MS/MS 谱。多重 MS/MS 无法通过常规识别程序轻松处理,因为它包含未知数量的肽种类,也就是说,一个谱图可能包含 1、2、3 个或更多肽。为了解决这个问题,肽中心分析从提出不同的问题开始。肽中心分析不是问特定谱图中的“肽是什么”,而是专注于测试一系列谱图中“特定肽是否存在”。通过针对所有 MS/MS 测试每个肽,可以得出每个肽的概率函数,从而可用于计算匹配的概率并定量每个肽。尽管肽中心分析非常有吸引力,但它仍然是一种相对较新的方法,需要更多时间来证明其实用性。
1.5.2 肽/蛋白定量

质谱法是用于大规模蛋白质组定量的首选方法。由于大多数方法使用肽作为定量的替代品,因此在尝试将肽水平的丰度变化推断到蛋白质水平时必须小心。丰度变化直接反映了细胞对环境或治疗的反应。定量蛋白质组学实验能够同时提供数千种蛋白质的定量信息,为涉及某些细胞过程或疾病的关键蛋白质和 PTM 提供有用的见解。最初基于 MS 的定量方法依赖于化学标记,即通过肽末端或氨基酸侧链将同位素编码试剂添加到反应基团上。多年来,已经开发出许多技术来提供定量信息。一般来说,这些定量方法可以分为两大类:标记定量方法和非标记定量方法。
1.5.2.1 标记定量
在标记定量中,不同的样品被含同位素的分子修饰,然后组合起来进行进一步的制备和 LC-MS/MS 分析。标记方法通常有两种,即代谢标记和化学标记。代谢标记使用同位素标记的氨基酸在细胞或动物生长过程中将重同位素原子掺入新合成的蛋白质中。接受不同处理的细胞或动物被喂养并用具有不同重量同位素组成的氨基酸进行标记。代谢标记的一个优点是标记被引入活跃生长的细胞中,从而被掺入完整的蛋白质中。然后可以在细胞裂解后混合蛋白质。在化学标记中,同位素标记的化学探针分别用于在细胞裂解或蛋白质消化后标记蛋白质或肽。化学标记通常在肽的末端或活性侧链(如硫醇和氨基)上进行。使用任一方法标记后,将多个样品合并并通过 LC-MS/MS 进行分析。在数据分析过程中,可以通过掺入的同位素原子的组成来追踪特定肽的来源。当检测到同一种肽的两个或多个同位素重量时,可直接进行比较,根据样品之间的离子信号估算两种肽的相对丰度。这两种方法都将重样品和轻样品混合在一起进行分析,以减少样品制备和 LC-MS/MS 过程中的误差。一种巧妙的化学标记方法使用具有同位素重量的标签,这些标签在质谱仪中碎裂时会显示不同 m/z 值的报告离子。这些多路复用标记方法(例如 TMT 和 iTRAQ)可以分别多路复用最多 10 个和 8 个实验。这些方法的优点是可以通过一次 LC-MS/MS 实验分析多个样品,而不是 10 个或 8 个,从而大大减少了质谱时间和相关成本。同位素标记方法的缺点是前体离子污染的问题。 MS/MS 采集的隔离窗口中可能存在多个肽离子,由于这些离子是碎片离子,因此报告离子都会对光谱低 m/z 端的值产生影响,即使其他碎片离子不同。标记方法的一个问题是代谢标记和化学标记方法的标记完整性。标记不完整会使数据分析变得非常复杂,并危及定量准确性。
SILAC 和 SILAM 细胞培养中的氨基酸稳定同位素标记 (SILAC)和哺乳动物中的稳定同位素标记 (SILAM)都是代谢标记方法,其在细胞或动物生长过程中引入同位素标记的氨基酸。在典型的 SILAC 实验中,会培养两组细胞(例如对照组和处理组);一组细胞用含有正常氨基酸(Arg-0 或 Lys-0)的简单生长培养基喂养,另一组细胞用含有重稳定同位素标记的精氨酸和赖氨酸(Arg-6、Lys-6)而不是轻 Arg 和 Lys 的富集培养基喂养(图 1.5)。在生长状态下,细胞会逐渐将稳定同位素整合到整个蛋白质组中。对于 HEK293 细胞,经过 5 到 8 次细胞分裂即可实现接近完全的标记。对于快速分裂的生物体(例如酵母、细菌或培养细胞),代谢标记通常更容易。对于较大的生物体(例如小鼠),用重稳定同位素标记蛋白质更具挑战性,因此开发了 SILAM 来解决此问题。在 SILAM 中,小鼠以 15N 标记的螺旋藻作为唯一的蛋白质来源,并与其他非蛋白质物质混合以提供均衡饮食。标记任何特定组织所需的时间取决于局部蛋白质周转率。
在 SILAC 和 SILAM 中,都需要高比例的同位素掺入蛋白质才能成功定量,不完全的代谢标记可能会产生重叠的重同位素和轻同位素包膜,从而危及定量的准确性。用重同位素标记细胞或组织可能会导致蛋白质组的改变,这称为同位素效应。为了解决这个问题,重同位素标记样品也可以用作内标,以衔接不同处理条件下不同样品的定量。例如,如果需要比较样品 A 和 B,则可以使用重同位素标记的样品 C 作为内标。首先将样品 A 与样品 C 混合,并通过 LC-MS/MS 分析,然后计算每种蛋白质的蛋白质丰度比 [A:C]。同样,将样品 B 与样品 C 混合,以同样的方式分析以计算蛋白质比率 [B:C]。然后可以计算出 A 和 B 之间的比率,即 [A:C]/[B:C]。样品 A 和 B 不能直接混合在一起进行分析,因为它们都很“轻”(没有重同位素标记),因此所有肽都无法区分。
大多数代谢标记方法成本高昂且耗时,因为需要长期供应重同位素标记的氨基酸或食物来支持细胞或动物的生长和繁殖。然而,如果正确实施,代谢标记确实可以提供高度准确的蛋白质定量结果。



图1.5

ICAT 同位素编码亲和标记 (ICAT) 是为基于质谱的定量而开发的早期化学标记方法之一。它利用半胱氨酸残基的硫醇侧链与同位素编码标签之间的反应。(图 1.5)原则上,ICAT 包含三个不同的元素标记,即生物素亲和标记、硫醇特异性反应基团和具有特定轻或重同位素的连接体。在典型的 ICAT 实验中,在蛋白质烷基化步骤中,用 ICAT 试剂标记半胱氨酸残基,标记有八个 1H 或八个 2H 原子(或 12C 和 13C)。然后将分离的蛋白质混合物进行亲和素亲和层析,以进一步纯化 ICAT 标记蛋白。用胰蛋白酶消化标记蛋白,并将标记肽从亲和素柱中洗脱出来,然后通过 LC-MS/MS 分析以获得详细的光谱。由于 ICAT 仅标记半胱氨酸残基(在脊椎动物中观察到的氨基酸频率为 3.3%),该方法可能会漏掉那些不含半胱氨酸残基的蛋白质。此外,一些蛋白质可能只含有一个半胱氨酸残基,这使得计算定量统计数据变得困难。
二甲基标记 二甲基标记是一种化学标记方法,利用还原胺化将 N 端和赖氨酸侧链上的氨基用二甲基标签烷基化。由于大多数肽至少含有一个 N 端,因此二甲基标记可用于覆盖大部分蛋白质组。蛋白质分离和消化后,加入甲醛 (CH2O) 和氰基硼氢化物 (NaBH3CN) 进行还原胺化。同位素标记甲醛(CH2O、CD2O、13CD2O)和氰基硼氢化物(NaBH3CN、NaBD3CN)的不同组合可用于进行双重(例如 CH2O + NaBH3CN 和 CD2O + NaBH3CN)至四重(例如 CH2O + NaBH3CN、CH2O + NaBD3CN、CD2O + NaBH3CN 和 CD2O + NaBD3CN)实验(图 1.5)。如果仪器的质量分辨率足够高,还可以实施同位素策略(例如 CH2O + NaBD3CN 和 13CH2O + NaBH3CN)。一级胺与甲醛的还原胺化通常是一种快速、干净且产率高的反应。因此,使用此方法可以有效标记大多数肽,从而对蛋白质组进行良好的覆盖。二甲基标记的简单性和有效性使其成为一种非常有吸引力的化学标记方法,可以在同一实验中比较两到四个样品。
TMT/iTRAQ TMT 和 iTRAQ 都是用于化学标记的同量异位素质量标签。因此,这两种方法都具有几个功能元素,例如独特的质量报告子、可以进一步启动裂解和平衡质量的连接子以及氨基反应基团。(图 1.5)市售的 TMT 试剂有 2、6、10 和 11 重形式,而 iTRAQ 试剂有 4 和 8 重形式。当标记多个样品并结合进行 LC-MS/MS 分析时,不同样品中的相同肽种类具有相同的总质量(同量异位素质量标记),从而允许在 LC 过程中肽共流出,并在 MS/MS 过程中同时分离片段。在肽碎裂过程中,连接子碎裂以释放质量报告子,其中根据相对强度估算原始肽的相对丰度。当发现报告质谱区存在污染或共洗脱肽段存在干扰离子时,可以进行 MS3 (MS/MS/MS) 以提高定量准确性,通常称为多缺口定量。同量异位素标记具有广泛的应用,因为它的多路复用能力提供了一种高效的方法对大量样品进行定量。
1.5.2.2 非标定量
尽管可以通过稳定同位素标记实现肽片段的准确定量,但这些方法通常存在处理步骤增加、标记试剂成本增加、标记效率低下以及低丰度蛋白质分析困难等问题。或者,非标记蛋白质定量已用于进行快速、高效且经济高效的蛋白质定量。在无标记分析中,每个样本均独立分析,不进行任何标记,然后对样本进行比较以进行定量。通常,非标记定量方法可分为两类:(i) 光谱计数和 (ii) 离子强度或曲线下面积 (AUC)。光谱计数使用与特定蛋白质相关的总 PSM 计数作为相对丰度的度量。离子强度或 AUC 定量使用属于特定蛋白质的肽峰信号强度的总和。
光谱计数 光谱计数是一种非标记定量方法,使用特定蛋白质产生的 MS/MS 数量来估计蛋白质丰度。光谱计数基于 PSM 频率与样品中蛋白质量的相关性,即假设蛋白质量越多,产生的 PSM 越多。该方法受益于液相色谱对复杂肽混合物的良好分馏。如果使用短液相色谱梯度分离复杂肽混合物,则光谱计数将被压缩并且不太准确。该方法可应用于低到中等质量分辨率(0.1-1 Da)LC-MS/MS 数据,并且观察到它可以为具有高度冗余 PSM 的蛋白质提供良好的结果。最简单的比较是比较每种蛋白质的 PSM 数量。但是,只有当所有比较的蛋白质都相似时,这种比较才是定量的,例如蛋白质同工型。为了提高光谱计数的定量准确性,多年来已经开发了几种评分模型,包括光谱指数 (SI)、蛋白质丰度指数 (PAI)、指数修正蛋白质丰度指数 (emPAI)、归一化光谱丰度因子 (NSAF) 和分布式归一化光谱丰度因子 (dNSAF)。不同的评分模型考虑了蛋白质定量的不同参数。例如,SI 校正离子强度,而 NSAF 和 dNSAF 都将蛋白质的长度视为评分的参数。迄今为止,最广泛使用的分数是 emPAI 和 NSAF 分数,因为它们简单且结果优越。
蛋白质 x 的 emPAI 分数计算如下:



其中 n 是检测到的蛋白质总数。emPAI 评分最初是基于以下观察提出的:PAI(即观察到的肽除以每个蛋白质可观察到的肽数)与 LC-MS/MS 实验中蛋白质浓度的对数呈线性相关。
蛋白质 x 的 NSAF 评分计算如下:



其中 n 是检测到的蛋白质总数。NSAF 评分最重要的特征之一是它根据蛋白质长度进行了调整。因此,能够产生比较小蛋白质更多碎片的较大蛋白质被标准化,因此获得可比的分数。NSAF 分数可以轻松计算并应用于几乎所有自下而上的蛋白质组学实验,因此广泛用于基于光谱计数的无标记定量。事实证明,它在某些测试中比大多数其他分数提供更好的线性。
离子强度/AUC 虽然简单而有效,但基于光谱计数的非标记定量并不总是能提供令人满意的结果。这是由于多种因素造成的,包括 DDA 中前体离子的动态排除,这有时会在检测过程中产生偏差。离子强度或曲线下面积 (AUC) 定量使用 MS 光谱对色谱峰在时间、m/z 和离子强度中的体积进行积分,以估计肽丰度。肽的浓度通常与色谱峰下的面积相关,范围为 10 fmol 至 100 pmol。
整体蛋白质定量基于在仪器的检测限内测量每种蛋白质的肽离子丰度。尽管是一种直接检测系统,但测量通常受到各种因素的影响,例如结果的准确性和可重复性。离子强度定量的一些主要挑战包括色谱漂移和来自同一蛋白质的不同肽之间的不一致。
动态扭曲(Dynamic warping)是一种非常流行的技术,用于对齐样品之间的峰值,从而大大减少保留时间漂移。当观察到相同蛋白质或肽的观察到的离子之间存在很大差异时,可以使用最丰富的前 N ​​个离子进行定量,排除所有低丰度和低置信度的离子。不同的数据分析平台在计算曲线下面积或体积的实现方面略有不同。一些算法的专有实现,即未发布的算法,例如 Progenesis QI,被证明优于其他实现,例如 MaxQuant、Proteome Discoverer 和 Scaffold Q+。
1.5.3 蛋白推断

鸟枪法蛋白质组学是一种常用于鉴定给定样本中不同肽混合物的技术。最终结果是根据正确和错误的 PSM 进行分析的。然而,对于大多数蛋白质组学实验来说,最终目标是确定生物样本中存在哪些蛋白质。肽鉴定仅作为推断蛋白质存在的中间步骤。将肽组装回蛋白质的过程是蛋白质推断。
为了以高置信度推断蛋白质,第一步是评估已鉴定肽段的质量。如前所述(第 1.5.1.1 节),诱饵蛋白数据库可用于评估 FDR 并区分高置信度 PSM 和低置信度 PSM。诱饵蛋白数据库通常是通过对正常蛋白质数据库进行顺序反转而创建的,然后附加到原始数据库中。通过 SEQUEST 或其他算法鉴定蛋白质后,可以使用 DTASelect2 和 PeptideProphet 等程序将鉴定结果过滤到所需的 FDR 水平。对于典型的全裂解物蛋白质组学分析,通常使用 1–5% 的蛋白质水平 FDR。
过滤后,所有高置信度 PSM 进一步组装成蛋白质。目前,有十多个程序支持从肽鉴定中进行蛋白质组装。其中最常见的包括 DTASelect2、ProteinProphet、Barista、DBParser、PANORAMICS、PeptideClassifier 和 MSNet。这些程序采用各种数学模型,包括optimistic模型、参数模型、非参数模型、简约模型和基于图的模型,主要解决两个问题:共享肽问题和单例问题。当一个已识别的肽序列在多个蛋白质之间共享时,很难确定它应该组装成一个或多个蛋白质。在典型的蛋白质组学实验中,可以在没有任何独特 PSM 的情况下发现多种蛋白质。仔细评估来自共享肽的所有证据以正确推断这些蛋白质的存在至关重要。单例问题定义为仅由一个 PSM 识别的蛋白质。理论上,如果没有其他证据,很难从单个 PSM 推断出蛋白质。然而,其他蛋白质的共存和已知的蛋白质-蛋白质相互作用网络有时可用于提高这种一击奇迹的信心。与DNA测序和基因组组装类似,蛋白质序列也可以通过消化蛋白质样本的“overlap→layout→consensus”进行组装。可以组合使用多种酶(包括特异性和非特异性酶)来生成具有高覆盖率和大重叠的肽序列,从而组装完整的蛋白质序列。这对于测序具有大序列重叠的高度同质蛋白质混合物(例如抗体)是一种特别有用的技术。
总体而言,对于大多数高丰度或高富集蛋白质,现有的解决方案(例如DTASelect2和ProteinProphet)可以有效地从肽鉴定结果中推断蛋白质。另一方面,很大一部分蛋白质,尤其是低丰度蛋白质,仍然难以自信地鉴定。未来可以进一步探索从现有基因组和蛋白质相互作用数据中借用的复杂统计模型和间接证据,以改进这些结果。
回复 支持 反对

使用道具 举报

发表于 2025-5-11 16:22 | 显示全部楼层

01. 蛋白质组学研究策略

蛋白质组学中,蛋白质的定性检测有两种思路(图1):Bottom-up和Top-down。Top-down是指从一个完整的蛋白出发,在质谱中进行碎片化处理,通过对碎片分子的检测,推导出蛋白的序列。在使用中真正占绝大多数是Bottom-up方法,也就是我们常说的shotgun方法,它充分利用了蛋白质自身的特点:可以被特定的酶在特定的位点切断。基本思路是,先用蛋白酶把蛋白序列进行酶切,再针对酶切后的肽段进行鉴定,所以进入质谱的检测对象是肽段,再根据肽段序列推导出蛋白序列,下述的方法均属于bottom-up策略。




图1 蛋白质组学的两种基本研究策略

通常,蛋白质组学的技术路线包含以下几步:




图2 bottom-up策略的基本流程

●样本预处理。蛋白质组学的研究对象往往是各类生物样本,如细胞系(293T,Hela等)、组织(肝、肾脏等)、微生物菌体或者各类体液(尿液、血清/血浆等)。拿到生物样本后,首先需要对样本进行前处理,其目的是为了尽可能多的提取出样品中的蛋白质。在这一步,不同的样本类型、不同的实验目的所使用的方法也有所不同,具体情况将在后续详细介绍;
●蛋白酶解。用序列特异性的酶(如Trypsin、Glu-C,Lys-C等),对蛋白进行酶切,将蛋白混合物酶解成肽段混合物;
●肽段离线预分级。使用HPLC(高效液相色谱)对肽段混合物进行预分级,将一个样品的肽段混合物分成多个馏分(fraction)。肽段预分离是根据肽段的亲疏水性逐步分离的过程,是为了肽段混合物进入质谱前降低样品复杂度,从而鉴定出更多的肽段/蛋白。在一般的蛋白质组实验中,人们通常将样品先分级成10-30个馏分,再分别上质谱。当然,有些样品,由于其蛋白复杂度不高,也可以不用分离。
●肽段在线分离(nano-HPLC):酶切后的肽段进入nano-HPLC(纳升级高压液相色谱),这也就是我们常说的LC-MS中的LC,肽段会因为在色谱柱填料上的保留时间的不同,得到预分离,使样品中的肽段在一定时间范围内先后进入质谱并得到检测;
●质谱解析。分离后的肽段,首先经过质谱的软电离离子源(主要有ESI和MALDI两大类),将中性肽段电离并形成带正电荷的肽段离子,然后送入质谱的质量分析器,质量分析器会将不同质荷比的肽段离子分离并记录,得到一级谱图。另外,目前主流的质谱仪都是所谓的串联质谱仪,即肽段母离子进入质量检测器后,质谱仪每次扫描会自动选择信号强度较高前20-40个母离子继续碎裂,将肽段母离子碎裂成更小的片段,然后对碎片离子的质荷比和强度进行记录,从而得到二级谱图。以上是一种叫做数据依赖型采集模式的基本工作过程。关于质谱仪的工作原理会在本系列中的其他文章中详细介绍;
●数据解析。生物样本(即上述提取好的多肽混合物)经过质谱仪检测,会记录对应的肽段母离子(即肽段离子)和二级子离子(即肽段的碎片离子)的质荷比、信号强度和保留时间。使用蛋白质组搜索软件对质谱图进行自动化的分析,可得到肽段序列和蛋白序列信息。自此,就完成了蛋白质的定性。对于定量蛋白质组学,主要借助质谱仪记录的母离子或碎片离子的信号强度来推断肽段/蛋白质的表达水平以及变化趋势。对于质谱数据解析,目前的基本策略是使用由基因组测序数据推断来的编码基因所转录、翻译而来的蛋白,和质谱数据进行比对的策略实现蛋白质组鉴定。关于质谱的数据解析原理将在本系列中单独详细介绍。
02. 蛋白质组学的主要研究内容

在本文前面章节有提到,蛋白质组学的主要目的研究蛋白质组的种类、表达量变化、翻译后修饰、蛋白-蛋白相互作用以及其参与的生物功能(图3),下面分别介绍:




图3 蛋白质组学主要研究内容

2.1 蛋白质组鉴定

顾名思义,蛋白质的鉴定即对给定生物样本的蛋白质成分进行大规模鉴定。理论上,蛋白质组学技术一次可以鉴定数千种甚至上万种蛋白。当然,这也取决于样品前处理方法以及质谱仪的灵敏度和分辨率。

对于蛋白质组定性分析,方法策略比较简单,利用本文上一节提到的几个步骤即可完成。当然,根据需求不同,定性分析也分多钟情况。比如,如果想研究血浆/血清等体液类物质,往往需要考虑去除高丰度蛋白,以避免高丰度蛋白的存在对低丰度蛋白的质谱检测受到影响;如果想研究某种翻译后修饰蛋白,由于翻译后修饰蛋白的表达量往往极低,那么在样品前处理时,需要对发生特定修饰的蛋白(一般先对提取的总蛋白酶解成肽段,然后再对肽段富集)事先富集出来,然后再上质谱检测.

2.2 蛋白质组定量分析

从生物体生命的直接执行者——蛋白质的角度研究生物的各种生命现象及各种疾病、病理已经成为生物学发展的趋势。而这些研究往往离不开对细胞、组织或器官中蛋白质的种类和表达水平的研究,以及对处在不同时期、不同条件下蛋白质表达水平变化的研究。这些研究离不开对蛋白质的鉴定和定量。因此,蛋白质组学定量技术在进入21世纪后得到了迅速发展,各种定量技术应用而生。如最早提出的基于谱图计数法的label-free定量、基于提取的色谱离子流图峰面积的label-free定量、iTRAQ/TMT标记定量技术、SILAC定量技术,以及最近提出的数据非依赖型采集模式的SWATH/DIA定量。

首先需要明确蛋白质组学中定量的含义。在蛋白质组学中,一般意义上的“定量”均指相对定量,即对某种蛋白在不同样品中的表达量变化的测定。比如,通过比较胃癌的癌旁组织和癌症组织的蛋白质组数据,可以获得癌症组织和癌旁组织相比,蛋白质的表达量变化信息,此研究的目的就是为了找到与胃癌发生相关的蛋白质。综上,在蛋白质组学中提到的定量,一般情况是指相对定量。

在基于质谱的定量蛋白质组学策略中,主要原理是:样品中的肽段含量与质谱检测到该肽段的信号强度成正比,因此,可以用肽段的信号强度来表征肽段含量,进而推断蛋白的表达量并计算每种蛋白在不同样品中的含量比值(即表达差异倍数)。

2.3 翻译后修饰蛋白质组学

蛋白质翻译后修饰(posttranslational modification, PTMs)是细胞实现快速、可逆调控蛋白质功能的关键途径。哺乳动物中超过50%的蛋白质需经PTMs才能实现其特定的生理功能。目前Uniprot蛋白质数据库已收录超过450种PTMs蛋白质的类型,其中最主要的PTMs包括磷酸化、赖氨酸乙酰化、泛素化、糖基化等。PTMs蛋白质组学的研究流程与经典蛋白质组学相似,但由于PTMs的蛋白质相对丰度较低,在细胞内处于动态变化中, 并且修饰基团与氨基酸残基间的共价键较易断裂,所以PTMs蛋白质组学的研究需要更加有效的分析技术。其技术方法一般包括样品前处理肽段分级含修饰基团肽段的富集质谱分析生物信息学分析等步骤。

翻译后修饰蛋白质组学的研究内容主要包含在两点,一是鉴定蛋白序列中发生了翻译后修饰的氨基酸位点,二是对发生了PTMs的位点做相对定量分析。通过前者,可以精确鉴定出某一蛋白上发生了特定翻译后修饰的氨基酸位置,后者可以通过比较不同样本的翻译后修饰表达水平,评价其生理学、病理学功能。

2.4 相互作用蛋白质组学

生物体的生理功能主要由细胞中的蛋白质控制和调节。其中,多数蛋白质是通过与配体结合或是作为蛋白质复合物的一部分参与细胞的代谢过程。因此,研究蛋白质相互作用是理解生命活动的基础。

传统的蛋白质相互作用研究方法需要研究者根据已有研究基础和较深入的研究背景,通过一定的摸索或积累,对可能存在的相互作用进行准确预测,然后对预测的相互作用进行验证。其通量小,研究效率低,获得的信息量有限。

相互作用蛋白质组学是一种基于质谱技术对蛋白质-蛋白质、蛋白质-核酸、蛋白质-药物/小分子化合物相互作用进行大规模定性或定量研究的蛋白质组学方法。采用免疫沉淀(IP)或pull-down等亲和分离手段,将能够与特定分子结合的蛋白质复合物进行分离,然后利用蛋白质组学大规模定性或定量的优势进行蛋白质复合物解析,是研究蛋白质与生物分子或药物之间相互作用的强大工具。

相比于传统的蛋白质相互作用研究方法,基于质谱技术的相互作用蛋白质组学的大规模研究具有以下优势
1.大规模的开放性研究,可更为高效的发掘和鉴定相互作用蛋白;
2.信息输出规模大,能够在网络层面上全面地描绘和反映蛋白质互作关系;

开放性的研究和大规模信息,可能带来更为创新的发现。

本期内容就介绍到这里。下一期将介绍几种主流技术的原理和优缺点,敬请期待~~
回复 支持 反对

使用道具 举报

发表于 2025-5-11 16:23 | 显示全部楼层
肝脏执行各种生物功能以维持体内平衡,例如糖原储存、营养代谢、药物解毒、胆汁分泌和蛋白质合成。当肝损伤发生时,肝细胞会经历巨大的损伤应激,这会导致各种情况,包括出血性坏死、肝细胞凋亡、水肿变性、肝脂肪变性和肝脏炎症。然而肝脏损伤的治疗非常困难,药物副作用和供体肝脏短缺限制了肝脏病人的康复。肝脏是一个可以有效输送small RNA的器官,因此,small RNA治疗可能为肝损伤开辟一条新途径。
tsRNA(tRNA衍生的小RNA)不是降解tRNA的随机副产物,而是精确控制的非编码小RNA,tsRNA通常可分为tRF-1、tRF-3s、tRF-5s,和tRNA半体(tiRNA)。过往研究表明,tsRNA参与应激反应,并与损伤有广泛的关联,在调节应激反应和损伤中发挥着重要作用,但有关于其治疗的研究十分缺乏,因此tsRNA尚未被开发为缓解疾病的小型治疗性RNA。
近期,诺禾致源合作院校中国科学院动物研究所的周琪院士课题组在Nature子刊STTT( Signal Transduction and Targeted Therapy,IF=39.3)上发表了题为“tRF-Gln-CTG-026 ameliorates liver injury by alleviating global protein synthesis”的论文研究成果,研究为了阐明tsRNA在肝损伤治疗中的作用,建立了一个产生tsRNA的有效模型,并证明NS-KO改变tRNA转录后修饰并导致I类tsRNA(tRF-1)的产生。并通过筛查和实验证明,tRF-Gln-CTG-026(tG026)在NS KO衍生的tRF-1中,通过抑制GPS显著改善肝损伤。该研究结果表明tG026是一种缓解肝损伤相关疾病的前瞻性治疗策略。诺禾致源为研究团队提供了蛋白质组技术服务



肝损伤的tG026机制模型

在小鼠中诱导肝损伤,以验证tsRNA是否参与肝损伤和修复
实验发现,肝损伤小鼠的tsRNA数量增加,表明tsRNA的产生与肝损伤有关。为了进一步研究tsRNAs与肝损伤的关系,建立了tsRNAs产生模型。在建立模型之前,作者首先定义了体外细胞实验中高损伤应激和低损伤应激的标准,并在在HL-7702和AML12细胞中进行了H2O2剂量梯度实验,最终将HL-7702的500μM H2O2应激和AML12的100μM H2O2应激定义为高H2O2应激、致死应激或生存应激。实验结果显示,与ME-KD(Mettl1敲除)和DNKD(Dnmt2敲除)相比,NSun2敲除(NS-KD)显示导致增殖增加,此外,在高(致死)应激下,NSun2敲低增加了细胞存活率。为了进一步探讨NS-KD在细胞损伤中的作用,作者使用生长曲线实验在低H2O2胁迫下连续5天测量细胞增殖,结果表明,NS-KD在H2O2处理下增加了细胞增殖。相反,当应用了不同的高强度应激诱导剂(CCl4、对乙酰氨基酚和油酸混合物)并测量了细胞存活率后表明,NS-KD提高了细胞在应激损伤下的存活率,说明了NS-KD只能在压力下工作。在基础条件下,NS-KD不影响细胞增殖。
以上结果表明,肝损伤与tsRNA的产生有关,NS-KD在体外促进细胞增殖和存活,但不会改变细胞在应激下的迁移。



图1 NS-KD减轻细胞损伤

NS-KO改善体内肝损伤
如上所述,NSun2的缺失是研究tsRNAs15的合适模型,并且可以改善细胞在应激下的增殖和存活。因此作者通过CRISPR/Cas9介导的NSun2基因外显子2的56bp缺失产生了NS-KO小鼠,在功能上,作者首先验证了NSun2缺失突变体是否对肝损伤的应激反应。在没有应激损伤的情况下,NS-KO不会导致肝脏形态和病理生理学异常,表明NS-KO和由此产生的tsRNA在没有应激的情况下都不起作用;在通过腹膜内注射(i.p.)CCl4模拟短期或长期肝损伤后,证明NS-KO对应激损伤有反应并减轻肝损伤。单次注射CCl4后第3天,在肝脏中观察到坏死和炎症,在第27天观察到纤维化。NS-KO小鼠的坏死程度低于野生型(WT)小鼠。接下来检测了单次或多次注射CCl4后的血液生化指标,在单次注射CCl4后第3天达到最大值,表明肝细胞损伤相当严重,随后在重复注射CCl4的第27天降至相对正常水平。NS-KO小鼠的所有三项指标均低于WT小鼠,这意味着NS-KO鼠的肝脏损伤较小。为了研究NSun2的缺失如何改善肝损伤,与WT小鼠相比,我们发现NS-KO小鼠在肝损伤第3天的增殖肝细胞数量显著增加。使用TUNEL法检测发现肝细胞凋亡的数量在肝损伤的第3天达到峰值,然后逐渐下降。NS-KO小鼠中检测到的凋亡肝细胞少于WT小鼠,这意味着NSun2的缺失抵抗了细胞凋亡。促增殖、促存活和抗炎相关基因的表达在应激下增加,而抗增殖、抗存活和促炎症相关基因的表达受到抑制。
在短期和长期肝损伤中,观察发现NS-KO小鼠的肝损伤比WT小鼠轻,这表明NSun2的缺失减轻了体内肝损伤。



图2 NS-KO可改善体内肝坏死、再生和存活

NS KO衍生的小RNA改善应激条件下的增殖和存活
为了验证NS-KO是否通过NS-KO衍生的小RNA预防肝损伤,作者首先敲除HL-7702细胞系中的NSun2,用没有酶活性的突变NSun2(K190M或C271A)转染细胞到HL7702细胞系中,并使细胞受到细胞毒性刺激。测定显示,只有WT NSun2抑制由NSun2敲低引起的细胞增殖促进,而不是NSun2突变体(K190M或C271A)。类似地,只有野生型NSun2逆转了NS-KD诱导的细胞活力的增加;NSun2突变体没有。这些结果表明,NSun2的缺失主要通过tRNA甲基转移酶活性的缺失来促进细胞在应激下的增殖和存活。当NSun2失去其甲基转移酶活性时,tRNA修饰不可避免地减少。为了证实这一假设,作者在不同的时间点测量了肝组织中的多种tRNA修饰(41种类型的修饰),具有最显著变化的修饰是tRNA m5 U和先前描述的m5 C.13。在NS-KO样品中,这两种修饰都显著减少,这些修饰的变化表明,在NS-KO细胞中,tRNA表达减少。
为了研究NS KO衍生的小RNA是否足以改善细胞在应激下的增殖和存活,作者从WT和NS-KO小鼠中分离出14–50 nt和50–100 nt的肝脏RNA片段(作为阴性对照),并检测到在低H2O2胁迫下14–50 nt RNA和50–100 nt RNA之间的增殖差异。EdU掺入分析显示,用NS-KO小鼠的14–50 nt RNA片段转染增加了细胞增殖,而不是WT小鼠的这些片段。CCK-8测定也显示,NS-KO小鼠的14-50 nt RNA片段增加了损伤后的细胞存活率,而不是WT小鼠的14-50nt RNA片段和两种小鼠的50-100 nt RNA片段。因此可以得到结论,NS KO衍生的14-50 nt RNA片段在改善细胞增殖和损伤后存活方面发挥着重要作用。



图3 NS KO衍生的tsRNA减轻肝损伤

tRF-1是NS-KO的基础产物
为了全面分析tsRNA的代谢特征,并分析不同应激损伤后WT和NSKO小鼠的tsRNA差异,通过tRNA衍生的小RNA测序(tsRNA-seq),作者在tRFdb数据库中鉴定了841个未记录的tsRNA和104个已知的tsRNA,然后,通过比较来源于WT和NS-KO小鼠的样品,并鉴定了366个上调和267个下调的tsRNA,表明NS-KO引起的tsRNA上调多于下调。NS-KO小鼠中的tsRNA在整个损伤过程中保持在相对较高的水平,而野生型中的tsRNAs在D3时达到峰值。因此,假设在重复注射CCl4的过程中,第3天是肝细胞增殖和tsRNA产生最活跃的时间,NS-KO小鼠可能具有类似于WT D3小鼠的“促修复tsRNA模式”。这些结果表明,NSun2的缺失增加了NS-KO小鼠的tsRNA,并提前保留了足够的tsRNA来应对应激损伤,但在WT小鼠中,tsRNA只能在WT D3产生。

在进一步分析了处于肝损伤不同阶段的WT和NS-KO小鼠的tsRNA景观后,我们发现与其他tsRNA相比,NS-KO鼠的tRF-1突然增加。在所有肝损伤时间点,NS-KO组的tRF-1明显多于WT组,但WT组仅在第3天增加。对tRF-1的详细分析显示,tRF-1的长度主要在14到23nt之间,一般来说,NSun2的缺失主要在肝脏中产生14-23nt的tRF-1。同时tRF-1的表达在NS-KO小鼠中比在WT小鼠中更高,而其他类型的tsRNA在NS-KO小鼠中的表达比在WT鼠中更低。因此可以确定68个NS-KO衍生的tRF-1是预防肝损伤和应对应激损伤的候选tsRNA。



图4 tsRNA-seq显示了在受到应激的WT和NS-KO小鼠中tRF-1的特征

筛选tRF-1在体外和体内治疗肝损伤
如上所述,肝损伤的副产物主要是tRF-1。为了阐明tRF-1是否可能是肝损伤的潜在治疗方法,作者人工合成了68种tRF-1,并对其进行了修饰,然后将人工合成的tRF-1转染到HL-7702细胞和原代人肝细胞(PHH)中,并在体外和离体中验证了它们的功能。EdU掺入测定显示合成tRF-1促进细胞增殖,CCK-8测定显示tRF-1过表达后细胞活力提高,在PHH中,也获得了一致的结果。为了验证经修饰的合成tRF-1在体内的功能,将tRF-1静脉注射到肝损伤小鼠中,结果表明,损伤减轻,肝功能改善。这些结果表明,68个tRF-1在体外和体内加速了受损肝细胞的恢复,并筛选出改善肝损伤最有效的tRF-1---tG026,在NS-KO后tG026的表达增加。



图5 筛选的tG026促进细胞增殖和损伤后的存活

tRF-Gln-CTG-026通过调节核糖体组装减少全局蛋白质合成
为了探索tG026的潜在机制,作者进行了RNA下拉-LC-MS/MS分析,以筛选与tG026相互作用的蛋白质,并选择了参与前40S核糖体组装的前rRNA处理蛋白TSR1同源物(TSR1)用于后续实验。通过RNA下拉测定,验证了TSR1和tG026在两种细胞系中的相互作用。在HL-7702和AML12细胞中过表达tG026发现,tG026没有改变18S rRNA的表达,但抑制了TSR1和18S rRNA。表明tG026抑制TSR1和核糖体之间的相互作用,因为18S rRNA是核糖体复合体的重要组成部分,tG026抑制了GPS。且NSun2的缺失导致tG026的产生,tG026通过抑制TSR1和18S rRNA之间的结合来促进增殖和存活,从而减轻GPS



图6 tG026抑制TSR1和18S rRNA之间的相互作用以降低GPS


肝脏中有大量不同类型的tsRNA。作为独特的小RNA,不同的tsRNA通过不同的机制调节基因表达。而本研究阐明,从NS KO衍生的tsRNA中筛选出的一种新的tRF-1(tG026)通过抑制GPS改善肝损伤,因此从理论上讲,tRF-1可能是可以用作肝病临床RNA治疗的新靶点,为研究肝损伤治疗提供一个新的解题思路。
诺禾致源深耕蛋白质组学、代谢组学、免疫定量数年,积累了丰富的项目经验,为您提供深度、专业、丰富的质谱项目服务,助力您在科研上的每一次进取跨越。
回复 支持 反对

使用道具 举报

发表于 2025-5-11 16:23 | 显示全部楼层
蛋白质组学是研究生物体内所有蛋白质的全套组成和其在生物学过程中的功能、结构、动态变化等方面的科学领域。这一领域主要关注细胞、组织或生物体中蛋白质的全谱,以深入了解生物学的复杂性和多样性。
蛋白质组学的研究内容包括但不限于以下几个方面:
1. 蛋白质组的鉴定与定量:通过技术手段,如质谱(Mass Spectrometry,MS)和蛋白质芯片,识别和量化生物体内的所有蛋白质。这涉及样本的制备、分离、质谱分析等步骤。
2. 蛋白质的结构和功能:研究蛋白质的三维结构,以理解其功能和相互作用。这包括蛋白质折叠、后转译修饰等方面的研究。
3. 蛋白质组的动态变化:研究蛋白质组在不同生理和病理状态下的动态变化,以揭示与生物学过程和疾病相关的信息。
4. 蛋白质与其他生物分子的相互作用:研究蛋白质与核酸、小分子等其他生物分子之间的相互作用,以揭示生物学系统中的调控机制。
5. 蛋白质标志物的发现:发现与疾病状态相关的蛋白质标志物,用于生物标志物的诊断和治疗。
6. 系统生物学的蛋白质组学:将蛋白质组学与其他“组学”(如基因组学、转录组学)相结合,全面理解生物体内分子水平的相互关系和整体调控网络。
7. 功能蛋白质组学:研究蛋白质的功能,包括参与信号传导、代谢途径、细胞周期等方面的蛋白质。
蛋白质组学的发展推动了对生物体内复杂生物学过程的深入理解,为疾病的诊断、治疗和新药研发提供了重要信息。
回复 支持 反对

使用道具 举报

发表回复

您需要登录后才可以回帖 登录 | 立即注册 微信登录 手机动态码快速登录

本版积分规则

关闭

官方推荐 上一条 /3 下一条

快速回复 返回列表 客服中心 搜索 官方QQ群 洽谈合作
快速回复返回顶部 返回列表