基于细胞系的泛癌单细胞RNA-seq分析22种癌症的异质性
肿瘤异质性的广泛存在已被证实,但瘤内不同克隆亚群间和克隆与微环境间的生物学关系仍不清楚,但可以肯定的是肿瘤是一个非常复杂的整体,目前的诊断及治疗是不全面的。培养的细胞系作为癌症研究的首选样本,其再现肿瘤中的恶性细胞之间的异质性的真实程度尚不明确。采用单细胞RNA-seq分析了来自22种癌症类型的198个癌细胞系,整体分析泛癌细胞的异质性问题,争取早日实现癌症的精确诊断和精准治疗。该研究发表在Nature genetics上,文章题为“Pan-cancer single-cell RNA-seq identifies recurring programs of cellular heterogeneity”。 单细胞分选方法 该团队开发了一种多路复用方法,利用10x Genomics Chromium系统对不同细胞系进行单细胞RNA-seq分析。多路复用策略的工作流程 ,用于同时描绘多个细胞系,使用基于液滴的scRNA-seq对细胞系进行汇集和分析。 细胞聚类及细胞类型鉴定 总的来说,通过数据质控、过滤,使用CCLE数据,根据细胞的整体基因表达和SNP模式,将细胞分配到最相似的细胞系。分析了来自198个细胞系的53,513个细胞的表达谱,反映了22种癌症类型。 细胞系内表达异质性的模式 在单个细胞系内的细胞中发现了基因表达的广泛变异性,包括离散的细胞亚群,以及反映细胞状态的连续模式 。离散集群仅在少数(11%)的细胞系中发现,并且离散集群的表达程序显示细胞系之间的相似性有限,这表明离散亚群通常是细胞系特异性的。接下来,为了识别细胞状态的连续和离散变异性,又对每个细胞系应用了非负矩阵分解(NMF)。总的来说,在所有细胞系中检测到1445个稳健的表达程序,在单个细胞系中有4到9个这样的程序。与NMF相比,基于它们共享的基因,强调类似计划的集群,使我们能够定义每个集群的一致性,称之为基因表达的重复异质程序(RHPs),其中,两个最为突出RHPs反映了细胞周期,细胞周期RHPs与G1/S期和G2/M期相对应,并且在临床肿瘤样本中也可以观察到。另外10个RHP反映了不同的生物学过程,且在很大程度上独立于细胞周期状态或被非周期细胞优先表达。研究人员通过对这10个RHP的标志基因、细胞系和潜在调节元件对这10个RHP进行了表征。 图. 10个RHPs的功能注释 RHP与多种应激反应有关,再现上皮与间充质细胞转换(EMT) 研究发现了与多种类型应激反应有关的RHPs。其中,RHP(8)反映了一种应激反应,包括DNA损伤诱导的和即刻早期基因(DDIT3、DDIT4和ATF3),类似于在黑色素瘤和HNSCC肿瘤中发现的程序;RHP(4)含有IFN响应基因(IFIT1-IFIT3),与卵巢癌中观察到的异质性程序非常相似。分析发现与上皮-间充质转化(EMT)相关的RHP(2),即EMT-I,是黑色素瘤特异性的,并与另一个黑色素瘤特异性RHP(1)呈负相关中,在体外和体内黑色素瘤细胞的联合分析中,这两个RHP(1)、 RHP(2)对应于前三个主成分(PCs),并定义了细胞状态 。另外两个RHP,EMT-II(3)和EMT-III (5)也得到了反映不同细胞系中类似EMT的过程。EMT-II主要在HNSCC细胞系中观察到,它包括VIM(编码波形蛋白)、FN1(纤连蛋白)等基因,与我们之前在头颈部鳞状细胞癌中观察到的部分EMT状态密切一致 。 RHPs与衰老程序有关 RHP 7与角质形成细胞衰老程序高度相似,也与其他已发表的衰老程序相似。因此, RHP 7被认为是上皮性衰老相关(EpiSen)程序。为了进一步研究上皮细胞衰老相关的程序,我们在依托泊苷诱导衰老后,通过批量RNA-seq分析了原代肺支气管细胞。衰老表型通过衰老相关β-半乳糖苷酶染色和RNA-seq显示细胞周期基因下调 。结果表明,EpiSen程序具有动态可塑性,且与遗传亚克隆存在有限的关联。研究人员选择具有EpiSen和EMT-II RHPs高度变异的HNSCC细胞株作为特定模型进行进一步分析,分离出EpiSen-high 和EpiSen-low两个细胞亚群,其表达差异达12倍 。EpiSen-low细胞对EMT-II RHP的富集程度最低,以EpiSen RHP为阴性对照。Episen高亚群在G0/G1期富集,与低水平增殖相一致(图6d) 。在培养1周后,高、低分类亚群的比例开始发生变化,4周后各亚群恢复到细胞状态的预分配分布,提示细胞发生转化 。 基因和肿瘤微环境对RHP的调控 在基于表达的离散集群中,39%与特定的遗传亚克隆显著相关,提示这些表达异质性案例的遗传基础, 接下来,研究人员考察了肿瘤微环境的可溶性因子和相关扰动对这些程序的诱导作用。最具活力的程序是EMT-II和EpiSen,它们对几种干扰作出相反的反应 。 总结 综上所述,该研究利用单细胞RNA-seq技术描绘了198个细胞系的细胞多样性图谱,描述了不同癌细胞株的异质性并识别肿瘤和特定细胞系之间共有的异质性复发模式,强调了在人类肿瘤中观察到的异质性程序的特定模型,对这些模型系统性研究可加强对肿瘤内异质性的理解,基于此有助于开发新的肿瘤相关治疗策略。 参考文献: Kinker GS, Greenwald AC, Tal R et al. Pan-cancer single-cell RNA-seq identifies recurring programs of cellular heterogeneity [J]. Nature genetics, 2020.