作为一个涉及交叉学科的团体,我们的队伍由来自不同背景的人员 组成。
Welcome to Guomics
研究兴趣
蛋白质是生命活动的齿轮,也是疾病的主要治疗靶点。我实验室的研究重点是开发和应用用于精准医疗的蛋白质组学技术。临床蛋白质组学处理体积有限、数量巨大的临床标本,需要昂贵且高度迭代的仪器和多学科专业知识。该领域最重要的是研究结果是始终如一的高质量和可重复性,由于蛋白质组的巨大复杂性,蛋白质组学一直面临着挑战,迫切需要新的数据分析和整合方法。最后,还需要在生物医学应用中使用正交方法验证挑选的蛋白质和模型。
01.1 样品制备。我们的技术改进主要基于我们独创的基于压力循环技术(PCT)的样品制备方法,该方法可处理〜1mg新鲜冷冻组织(Guo, et al.Nat Med, 2015). 为了满足大规模临床研究的技术需求,我们进一步改进和简化了方案,以便能够有效分析〜0.1mg新鲜冷冻和福尔马林固定石蜡包埋(FFPE)组织样品(Gao, et al. J Prot Res. 2020; Zhu, et al. Mol Oncol. 2019. Cover paper; Gao, et al. J Prot Res. 2020; Cai, et al. Nat Protoc. 2022). 最近,我们将组织扩增技术与diaPASEF分析相结合,实现了对更小组织样品的有效蛋白质组学分析 ,即 低至~0.7 nL FFPE组织(~100个细胞)(Li,et al. In revision).
01.2 质谱分析。数据非依赖采集(DIA)MS可以支持对微量样品进行可重复和高通量的蛋白质组学分析(Zhang, et al. Proteomics. 2020. 期刊中访问量排名前 10 位的论文)。为了进一步提高MS分析的通量,我们优化了LC-MS工作流程,包括用于SWATH / DIA-MS分析的微流LC(Sun, et al. J Prot Res.2020)和ScanningSWATH(Gao, et al. J Prot Res.2022).我们还开发了PulseDIA,这是一种多注射气相分馏(GPF)策略,以增加DIA-MS的蛋白质组深度(Cai, et al. J Prot Res.2021).此外,我们还在实验室中优化了 TMTpro 16plex 工作流程(Zhou , et al. in press)。
01.3 MS原始数据分析。近年来,用于构建谱库的计算管道发展迅速。我们开发了一个用于DIA库构建的开源计算管道和一个全面的谱库,用于人类蛋白质组分析,用于Orbitrap的DIA和MRM/PRM分析的14,000多个蛋白质组(Zhu,et al. GPB. 2020. 访问量很高的文章)。我们的团队还开发了一种计算方法来完善泛人类谱库,用于组织特异性DIA分析(Ge, et al. J Prot Res. 2021).
01.4 DIA张量。我们为DIA-MS数据开发了一种通用张量格式,减小了文件大小。DIAT可以很容易实现可视化并支持直接输入到深度神经网络中以预测表型(Zhang, et al. JASMS. 2020). 我们进一步开发了将DIAT转换回mzXML的计算管道,以便由AI授权的信号处理算法处理的DIAT可以进行常规的肽和蛋白质鉴定(Zhang, et al. in preparation)。我们还开发了新的去噪技术。
01.5 生信分析。数据质量控制、有效的数据分析、可视化是分析大型蛋白质组数据集的主要瓶颈。我们开发了一个Web服务器ProteomeExpert,用于大规模蛋白质组学数据集的有效实验设计和分析(Zhu, et al. Bioinformatics. 2021),以及用于批效应评估和校正的Web服务器(Zhu, et al. J Prot Res.2020).
总而言之,这些技术进步,正如一篇受邀评论(Xiao,et al.Adv Drug Deliv Rev, 2021)和另一篇受邀的临床蛋白质组学快照论文(Zhu, et al. Cell.2021)所写的那样,可对微量临床标本进行可靠、高通量和深度蛋白质组学分析。
02.1 临床需求。在一般人群中50-60%可检测到甲状腺结节,但其中只有少数(10-20%)是恶性和/或临床相关的。甲状腺结节的精确诊断仍然是全球亟待满足的临床需求。此外,迫切需要为某些类型的难治性甲状腺癌确定新的治疗靶点。
02.2开发用于甲状腺结节的基于蛋白质的分类器。尽管已经开发了几种基于核酸的突变分析和诊断测试,但它们特异性有限,仍然会导致患者不必要的手术。为了开发基于蛋白质的甲状腺结节分类方法,我们首先建立了一个全面的谱库,涵盖五种主要类型的甲状腺组织(Sun, et al. Mol Oncol.2022.封面论文)。我们进一步应用它来分析多中心回顾性队列中来自578个个体的1700多个甲状腺活检蛋白质组,并开发了19个蛋白质生物标志物的神经网络模型。该分类器在独立队列中进行了外部验证 (Sun, et al. Cell Disc. 2022).该研究表明,将高通量蛋白质组学和机器学习整合到多中心回顾性和前瞻性临床队列中有助于精确的疾病诊断,这用其他方法很难实现。
自2020年以来,我们认为贡献我们的蛋白质组学专业知识和资源以加深对SARS-CoV-2的宿主反应的理解,从而快速获得临床相关结果是我们的首要任务和社会责任。中心研究目标是了解宿主对SARS-COV-2及其疫苗的不同反应背后的分子机制。我们的研究提出了COVID-19诊断和预后的新测试方法,并提出了治疗靶点。
03.1 COVID-19血液和尿液中的宿主反应。我们首先对COVID-19患者和对照组的血清进行了蛋白质组学和代谢组学分析,并建立了用于识别严重病例的蛋白质分类器。我们还确定了COVID-19患者血清的分子变化,与其他组相比,这些组涉及巨噬细胞失调,血小板脱颗粒,补体系统途径和大规模代谢抑制(Shen, et al. )。Cell.2020).我们进一步研究发现,COVID-19的严重程度也可以通过尿液中的蛋白质分类器来评估(Bi,et al. Cell Rep. 2022). 尿液中检测到的细胞因子和许多其他与疾病相关的蛋白质比在血清中检测到的更多。
RT-PCR是COVID-19的主要诊断方法,也用于监测病程。然而,由于RNA不稳定,这种方法存在假阴性,对医生来说风险很高。因此,我们研究了在COVID-19期间使用血清蛋白质组学预测病毒核酸阳性的潜力,并发现基于血清蛋白的机器学习模型可以监测COVID-19的进展,从而补充拭子RT-PCR测试(Zhang, et al. )。J Prot Res.2021).
03.2 尸检中的宿主反应和潜在的治疗药物靶点。我们还报告了对19名COVID-19患者(Nie, et al. )中来自7个器官的144个尸检样本的蛋白质组学分析。Cell.2021).从这些数据资源中,我们确定了潜在的治疗靶点,组织蛋白酶L1,并观察到睾丸间质细胞减少,当然还有其他更多发现。
03.3 预测COVID-19的长期作用。通过对两年来COVID-19队列的多组学分析,我们发现COVID-19患者在两年的随访中令人惊讶地出现了新的症状。我们的发现为预测和预防这些新后果提供了有用的证据(Wang, et al. In revision)。
03.4 疫苗接种后的宿主反应。我们对具有异质性血清学反应的已接种疫苗个体的血清和外周血单核细胞进行了蛋白质组学分析,并开发了一种蛋白质分类器来预测疫苗接种的有效性(Wang, et al. in revision)。我们的数据对于个性化疫苗接种和加强针接种计划具有参考价值。
03.5 宿主对Omicron毒株的反应。我们对Omicron患者和其他症状轻微的COVID-19患者,流感患者和健康对照组的血液样本的蛋白质组学分析表明,感染Omicron变体的疫苗接种患者的炎症反应比未接种疫苗的流感对照组弱(Bao,, et al. Cell Disc.2022).
03.6 COVID-19蛋白质组的蛋白质组数据库。我们将所有COVID-19蛋白质组学数据集与一个在线网络服务器文献中的其他数据集进行了汇编和组合(Zhang, et al. submitted)。
大多数生命科学研究都集中在一小部分经过充分研究的蛋白质上,导致大多数人类蛋白质组的研究仍然不足。这种差异导致了一种被称为“路灯效应”或“富者愈富综合症”的现象,也就是说,已得到研究的蛋白质会得到更广泛的研究,而研究不足的蛋白质则被忽略了。
许多未充分研究的蛋白质在 LC-MS 分析中没能有效地进行溶解、消化、洗脱或电离。其中有些存在于特定的组织类型或细胞类型中。此外,大量的蛋白型也没有得到分析。我们已经从各种人类标本中积累了超过60,000张DIA图,计划开发大数据驱动的AI赋能算法,用来分析来自这些蛋白质组学大数据的新型蛋白质和蛋白型,建立它们与生物和疾病表型的联系。同时使用细胞系和动物模型中的CRISPR和机械研究等遗传操作来研究这些蛋白质的功能。我们还将研究它们的可成药性。我们将联合多个国际倡议的合作伙伴,包括蛋白质组学驱动的精准医学(PDPM),HUPO 大挑战项目,未充分研究的蛋白质倡议 (the Understudied Protein Initiative) 等来研究未充分研究的蛋白质的表达和功能。