蛋白质组学

北京青莲百奥生物科技有限公司

蛋白质诊疗标志物发现创新平台

服务咨询热线

010-53395839

蛋白质组学,糖基化蛋白质组学,多组学联合分析
您当前的位置 : 首 页 > 新闻动态 > 公司新闻

「青莲聚焦」强强联合—组学技术+WGCNA分析在阿尔茨海默病 (AD)中的应用

2022-03-17 00:00:00


痴呆症影响着世界9%的人口,造成巨大的社会和经济负担。其中阿尔茨海默病(AD) 是常见的痴呆类型疾病(占痴呆症病因的50%-75%),是老年人群中常见的神经变性病,随着人口老龄化的加剧,其发病率逐年升高。其病理特征是由Tau蛋白(微管系统是神经细胞骨架成分,可参与多种细胞功能,Tau蛋白是含量高的微管相关蛋白)过度磷酸化形成的神经原纤维缠结与由 Aβ 沉积物组成的老年斑。

WGCNAweighted gene co-expression network analysis,权重基因共表达网络分析是一种分析多个样本基因表达模式的分析方法,可将表达模式相似的基因进行聚类,并分析模块与特定性状或表型之间的关联关系,因此在疾病以及其他性状与基因关联分析等方面的研究中被广泛应用。简单来说利用WGCNA分析可以构建共表达网络关系,将所有的具有相同表达情况的基因群体进行聚类,根据相似性将网络切分为模块,再将模块与表型相关性进行联系分析模块的功能,了解模块的整体情况之后我们可以鉴定模块中的hub基因。

e1d7fdb1f9a9a503dc19f4ead9f35459.png

WGCNA分析流程


常规组学的筛选是通过筛选差异表达蛋白/基因/代谢物,结合研究方向而后通过生信分析的辅助,通过KEGG通路将转录组/蛋白质组/代谢组数据联合起来,找到同一生物进程(KEGG Pathway)中发生显著性变化的基因、蛋白质和代谢物,快速锁定关键基因、蛋白或代谢物。再结合富集分析、KEGG通路标色等实现关联结果的可视化。对比组学方法来看WGCNA分析通过构建共表达网络确定模块功能而后分析其中hub基因,在网络中被调控线连接的基因其表达模式是相似的我们可以认为它们有相似的功能。所以在这个网络中如果线条一端的基因功能是已知的那么就可以预测线条另一端功能未知的基因也有相似的功能这就为我们下一步功能验证未知基因打开了一扇窗户。两种方法的目的相似角度不同,因此利用WGCNA分析与组学方法结合是很好的研究方法,可以相辅相成互为补充。







接下来分享2篇案例



案例一




6f2622eb8fb20b4b774fb7f2d8d4e08f.png

Deep Multilayer Brain Proteomics Identifies Molecular Networks in Alzheimer's Disease Progression.

期刊:Neuron(IF= 14.415)

研究目的:
对人类脑组织进行蛋白组学和磷酸化组学分析,整合多个组学数据集共同揭示了AD进展过程中新的蛋白和分子网络。

实验分组:

(1)LPCs(对照组):老年斑和神经原纤维缠结程度较低;

(2)HPCs(对照组):Aβ病理学高但无明显认知缺陷;

(3)MCI(实验组):Aβ病理程度轻微其具有轻度认知损伤;

(4)AD(实验组):晚期AD伴老年斑和神经原纤维缠结程度较高;

(5)PSP(实验组):另一种神经退行性Tau病—进行性核上性麻痹。

选取样本:脑组织与脑脊液样本

采用方法:蛋白质组学、磷酸化蛋白质组学、WGCNA分析

实验设计:

bf89bb1b7fcec4e87ba0d4cfb3b877e6.png


研究内容:

首先通过蛋白组学分析,一共鉴定到了14513个蛋白。蛋白组学分析中,共获得173个差异蛋白,Aβ蛋白的表达水平与病理结果基本一致。聚类分析、主成分分析和相关性分析进一步支持了数据的可靠性。而后研究人员分别进行了WCGNA分析对差异蛋白进行聚类,并利用互作网络分析以及通路分析来解析蛋白组的表达规律以及分子网络变化特征,从分析中确定了三个完整的蛋白质组簇(称为 WPC)。WPC1 ( n = 50) 显示 HPC 和 MCI 在早期时期 AD 相关物质的持续积累,包括 Aβ、TREM2 和 CLU。以及这些蛋白质在富含淀粉样蛋白级联、WNT 信号传导、TGFβ/BMP 信号传导、G 蛋白信号传导、整合素途径、先天免疫、适应性免疫、细胞骨架和细胞外基质、膜转运、脂质代谢、蛋白质折叠和降解以及突触的 12 种途径功能。WPC2 ( n = 88) 在 HPC 和 MCI 阶段相对稳定,但在进展到 AD 时显示显著增加,包括 MAPT (tau) 和补体成分。WPC2 概括了 WPC1 中所有丰富的通路,并包含三个额外的细胞因子信号通路、补体和凝血以及铁稳态。相比之下,WPC3 ( n = 27) 的 HPC 和 MCI 没有明显变化,随后在 AD 组中显著下降(可能是神经保护作用的相关蛋白),确定了另外两条神经营养因子信号通路和线粒体功能通路。

71b44cabe6d100dc3446b887fd6451e1.png


之后,作者将每个 WPC 模式中的 DE 蛋白与蛋白质-蛋白质相互作用网络整合以定义 11 个功能模块,提供蛋白质-蛋白质相互作用的证据以支持这些富集途径。在 AD 中的 173 种 DE 蛋白中,163 种(94%)蛋白在 PSP 大脑中没有显示出显著变化,表现出高度的 AD 特异性。结合蛋白组学与WCGNA分析所鉴定到的大多数的差异蛋白质是新的,作者通过WB在 AD 样本中验证了 11 种蛋白,同时还增加大规模验证分析,其中 58 种(69%)在 AD 中表现出一致的变化。大规模的验证分析证明了蛋白质组学研究的可重复性。作者为了进一步检查 AD 脑组织中的这些差异蛋白质是否可作为脑脊液 (CSF) 中的潜在生物标志物被检测到,对 CSF 样本进行了蛋白质组学分析(n = 13,5个对照+ 8个 AD 病例)量化了 5940 种蛋白质。检测了 AD 脑组织中 58 种蛋白质变化中的 49 种蛋白质,其中 8 种蛋白质在脑脊液样本中持续变化。其中,4 种蛋白质(GPNMB、SMOC1、NPTX2 和 VGF)已在 AD CSF的相关研究中报道过,其他 4 种蛋白质(SLC39A12、SLC5A3、SLIT2 和 STEAP3)可作为新的候选生物标志物。

720a69279ee3d8d26b6a959a359f89b7.png


为了了解AD中磷酸化蛋白质组衍生的激酶活性,作者通过磷酸化蛋白组分析一共鉴定了7083个蛋白上的34173个磷酸位点,其中有来自398个蛋白的873个磷酸化肽段差异表达,微管相关蛋白Tau在AD组中的磷酸修饰水平,聚类分析结果也显示出AD组的磷酸化蛋白质组变化为剧烈。在聚类分析中,AD 组与其他组的距离大,表明 AD 具有显著的磷酸化蛋白质组变化。与整个蛋白质组分析类似,逐步计算流程用于鉴定 873 种 DE 磷酸肽,分成四个主要的磷酸肽簇,PPC1-4 模式表明蛋白质磷酸化是高度动态的,并且在 AD 的不同阶段积极重塑。同时检测了每种 PPC 模式中富集的磷酸化蛋白途径,揭示了 AD 中剪接功能障碍和钙假设的两种新途径。特别的是,磷酸化蛋白质组和蛋白质组之间只有 11 个蛋白质重叠, 表明磷酸蛋白质组分析代表了一个新的分子调控层面,可以对蛋白质组的全景信息进行补充。

ea82b3780d790bcfdc45970dad4977c3.png


接下来,研究人员利用 IKAP机器学习算法推断出186种激酶的活性,其中28种主要在AD组中发生变化。基本上涵盖了所有已知的Tau激酶。研究人员通过蛋白质组和磷酸蛋白质组分析了这28个激酶及其相关家族成员的表达水平。尽管绝大多数激酶在蛋白质水平上没有变化,但MAPK级联通路中表现出明显的磷酸化修饰水平上调,包括:MAP4K、MAP3K、MAP2K和MAPK。MAPK信号负调节因子DUSP6在AD组中显著降低。这些结果验证了前人的研究结论:MAP激酶信号的激活与AD的发病机制有关。

接下来作者为了探索 Aβ 积累诱导的分子事件,将确定到的 28 个 Aβ 相关差异蛋白在小鼠中进行检测观察,看会不会也有相同表现。8种Aβ相关的差异蛋白中有23种在小鼠中被鉴定到,15种持续增加,其中4种与RNA上调相关,这表明5xFAD小鼠中大多数Aβ相关蛋白受转录后机制调控。同时将小鼠差异蛋白质与人类组织差异蛋白质进行对比,结果表明:小鼠表现出与AD晚期相似的蛋白质组特征,但表现出自噬和干扰素反应的激活,并且缺乏人类特有的有害事件,例如神经营养因子和突触蛋白的下调。解释了小鼠模型和临床试验之间的转化差距。

77dddee931f739bf8123327c1a2e116b.png


研究人员整合了7个AD数据集(MCI蛋白质组、AD蛋白质组、磷酸蛋白质组、聚集蛋白质组;全基因组关联分析;转录组;蛋白相作组),使用顺序统计和基因集富集分析(GSEA) 对基因/蛋白质与途径进行等级排序。蛋白排序中,APP、APOE和MAPT为前3位,与目前对AD发病机制的理解一致。GSEA对信号通路进行了优先排序,确定了16条通路,共分为4大类:淀粉样蛋白和Tau通路、炎症、生长发育以及代谢和膜转运。此外,亚细胞定位分析表明,在AD中,分泌子体和细胞表面子体受到特别的干扰,可能对细胞通讯产生强烈的影响。同时,免疫组化实验表明,与正常对照病例相比,MDK、NTN1、SMOC1 和 ICAM1 在 AD 的某些斑块结构中明显积累。进一步使用亲和结合试验探讨了这些蛋白质是否与 Aβ 发生物理相互作用。发现,MDK 和 NTN1 直接与 Aβ 40柱结合,但不与对照柱结合,而其他两种蛋白质(SMOC1 和 ICAM1)在该试验中未显示与 Aβ 40结合。表明MDK 和 NTN1 显示直接 Aβ 结合,暗示它们可能在 AD 脑中一起发挥作用。

905d77d8be1c5ae924c7c545f7764a18.png





案例二




eebb613e691b598c0fc335e450cee2e6.png

Identification of Conserved Proteomic Networks in Neurodegenerative Dementia.
期刊:Cell Reports(IF= 8.109)
研究目的:
对人类脑组织进行蛋白组学和磷酸化组学分析,整合多个组学数据集共同揭示了AD进展过程中新的蛋白和分子网络。

实验分组:

(1)正常组:老年斑和神经原纤维缠结程度较低;

(2)无症状AD(AsymAD)组:Aβ病理学高但在死亡时间附近没有明显的认知障碍;

(3)AD组:晚期AD伴老年斑和神经原纤维缠结程度较高;

(4)PSP组:另一种神经退行性Tau病—进行性核上性麻痹。

选取样本:脑组织与脑脊液样本

采用方法:蛋白质组学、转录组学、WGCNA分析

实验设计:

b14b51e778de87341bbd441c97b47981.png


研究内容:

首先,研究人员运用蛋白质组学技术和转录组技术对超过1000个痴呆病理样本包括AD、无症状ADPSP和对照进行检测,共鉴定到65,000个肽段,对应每个样本约5000个蛋白。为了发现与脑库和皮层区域的共表达变化情况,作者对来自 BLSAACTMSBBBanner 和 Mayo 脑库的队列进行了WGCNA分析。确定了代表所有四种主要脑细胞类型的 10 个共有模块(标记为 C1-C10):神经元(C1 和 C2 模块)、小胶质细胞/内皮细胞(C10 模块)、星形胶质细胞(C8 模块)和少突胶质细胞(C5 模块)。在所有五个数据集中确定了两个与 AD 诊断显著相关的模块(C8 和 C10)(p < 0.05),一个模块(C1)在四个数据集中与诊断显著相关,另外三个模块(C2C3、和 C4)在五个数据集中的至少三个中与诊断显著相关(p < 0.05),总共六个 AD 相关模块。与对照组相比,AD 中四个共有模块(C3C4C8 和 C10)上调,两个共有模块(C1 和 C2)在 AD 中下调。

012e0047ad00a760e4b973a2a95542d2.png


进一步利用无症状AD(认知能力不受影响但有显著的神经原纤维缠结和斑块病理特征)作为疾病发展早期样本,研究者发现一个神经元模块(C1)被下调,两个神经胶质模块(C8C10)被上调。为了寻找与疾病发展相关的致病因素,研究者针对代表了疾病发展早期的无症状AD的蛋白表达模块进行研究。C1模块代表神经元中高表达的基因,与突触进程相关,富集突触前/后囊泡中枢蛋白如HOMER1DLG4SYT1C8代表星形胶质细胞中高表达的基因,富含免疫应答和细胞粘附蛋白;C10模块富集小胶质细胞和内皮标志物,其中一个蛋白ANXA1参与到小胶质细胞的抗炎和神经保护作用以及的清除过程中。综上,这些分析表明神经元/突触基因下调以及星形胶质和小胶质上调是AD早期发展的重要特征,并且与之前的研究相一致。

0084670fd359719d1d5d3934b26dc0c6.png


针对代表了疾病发展早期的无症状AD的蛋白表达模块进行研究之后,作者接下来评估了在代表 AD 的后期症状阶段的病例中发生的蛋白质组学变化,确定了 AD 中的一个下调 (C2) 和两个上调 (C3 和 C4) 模块。C2模块由线粒体电子传输链亚基和ATPase亚基组成;C3模块富含与MAPK信号传导有关的基因;C4模块富含参与mRNA剪接的基因。同时,这些模块与其他研究队列观察到了类似的趋势

8f3fdf7bf40b4f8be4ec2bec4181302c.png


得到上述结果后,作者认为点在于针对痴呆疾病转录组数据和蛋白组数据的整合分析,这对于了解疾病的进程非常重要,因此研究者利用多个神经退行性疾病的队列样本进行分析,结果显示几乎超过一半的蛋白组数据变化能反应基因的表达,并且相等比例的调控来自转录后,进一步强调了蛋白组研究以及两个水平数据互补整合的重要性。

654348b45c36ab7118b1abfc2b774970.png




青莲百奥个性化生信服务内容


0eab60a8fded91d36a703682d8eaeefb.png



随着组学技术的不断成熟,由组学分析所产生的数据量也不断丰富,众多科研人员对于数据的解析与可视化作图的需求日益增长,传统组学作图需要学习R语言,需要掌握一些编程知识,虽然现在不少生物学研究人员也逐渐开始学习使用R语言编写简单的程序进行数据分析,但在利用R语言进行数据分析的时候,也因为数据格式等问题需要花费不少时间进行前期数据处理等。
因此,为了加速生物学科研人员进行数据分析和可视化,青莲百奥推出BioLadder生物信息在线分析可视化云平台,使得不会编程或不想编程的研究人员能利用生物学的常用数据格式,必要时进行简单的编辑,就能直接进行相关的数据分析。


095d51b4ef48b5f8ab871b7e7ba5cc25.png

网址:www.bioladder.cn

目前上线了生物学分析常用的50个模块,主要包括以下四类:

数据可视化:箱线图,南丁格尔玫瑰图,韦恩图,UpSet图,饼图,词云图,小提琴图,饼图/甜甜圈图,弦图,柱形图等

组学数据分析序列的多重比对,表达数据的CV曲线图,饼图/甜甜圈图,T-SNE,热图,趋势分析的mFuzz,差异分析的火山图,富集分析的气泡图,修饰位点上下游模体分析的seqLogoMotif热图等

功能分析:GO弦图,相互作用网络图,富集分析


数据预处理:归一化,补值,FDR校正,长宽表互换等


c8d73acf31cb16c54b22edc12d6e6daa.png





青莲百奥技术服务从样本提取组学检测到数据分析一站式解决,让您送样无忧科研顺利,想您所想达您所及。




END

标签

0

最近浏览:

相关产品

相关新闻

北京青莲百奥生物科技有限公司

固话:010-53395839
邮箱:service@qinglianbio.com
地址:北京市海淀永捷南路2号院1号楼 中关村科学城·乡创中心


扫一扫,关注我们