已有研究证明,正常组织的再生过程与肿瘤相关,但其在肿瘤进展期间和免疫监控的选择性压力下发挥的程度尚不清楚。本文研究表明,原发性肺腺癌的特征是再生细胞的出现(正常出现于肺损伤后),以及与肺泡和支气管上皮系相关的转录因子的显著混乱。相反,转移灶中富集了关键的内胚层和肺转录因子SOX2和SOX9,并涵盖了从干细胞样到再生性肺上皮祖细胞样状态的更加原始的转录程序。这一发育连续过程与小鼠模型中的转移性休眠自发爆发的进展阶段一致,并表现出对自然杀伤细胞的SOX9依赖抗性。由NK细胞缺失引起的大量转移灶中发育阶段特异性限制的丢失提示:在转移过程中,发育可塑性和免疫介导的修剪之间存在动态的相互作用。
2介绍干细胞可以维持组织稳态,而损伤组织将被激活的兼性祖细胞修复。在肺上皮细胞中,大多数上皮细胞可以在某些生长或损伤的情况下相互转化。有证据表明,原发性肺肿瘤中也会继承这种可塑性,其中,典型的调控干细胞及祖细胞行为的胚胎通路也将活跃起来。然而,发育可塑性在肿瘤进展转移中的角色尚不明确。特别的,在转移过程中,肿瘤细胞破坏再生过程的程度以及这种破坏是如何由抗肿瘤免疫的持续性选择压力所塑造的,也并不清楚。作者使用基于液滴的单细胞测序以及基于图(graph-based)的表型分析方法,从肺转移过程中的上皮再生这一角度探索了肿瘤细胞异质性,同时评估了肿瘤细胞可塑性和发育层次之间的平行关系。通过使用人肿瘤样本以及肺癌转移小鼠模型,本文评估了未经治疗的原位肿瘤中的再生性细胞以及谱系的混乱度。最终,作者发现,对自然杀伤细胞发育阶段特异性的敏感度差异将决定潜在转移起始细胞显性定植的表型图谱。在转移过程中,NK细胞的减少将导致各种被靶向的癌细胞的出现。在这种情况下,肿瘤细胞表达SOX9将抵抗由NK细胞介导的杀伤作用,这说明肺肿瘤进化过程中由谱系决定的转录程序与免疫缺陷之间具有密切的关系。
在肺的分支形态发生过程中,肺内胚层将沿着近端-远端轴分化出独特的细胞谱系:Sox2阳性标志着近端内胚层祖细胞谱系,而Sox9和Id2联合表达则标志着远端内胚层祖细胞谱系。其中近端祖细胞可分化成气道神经内分泌细胞、分泌细胞、纤毛细胞和粘膜细胞,而远端祖细胞可分化成I型和II型肺泡上皮细胞。
3具体结果(1)原发肿瘤和转移肺腺癌的单细胞转录图谱图1:人肺腺癌的单细胞转录图谱
Fig.1a样本:17例新鲜人体组织标本(4例正常肺组织+8例肿瘤样本(7例未经治疗LUAD+1例新辅助化疗后LUAD)+5例转移LUAD转移样本(脑、骨、肾上腺))→40,细胞。
样本跨越了肿瘤进展的不同阶段(具体信息见ExtendedDataFig.1),
将所有单细胞测序数据混合,标准化后,最终得到如下C图中的t-SNE图:
Fig.1bFig.1c根据图c,共得到包括基质细胞、淋巴细胞、骨髓细胞、上皮细胞、内皮细胞、周皮细胞、成纤维细胞以及肿瘤细胞在内的20多种细胞。
虽然不同样本的细胞丰度并不相同(Fig.1b),但是不同样本的大多数髓细胞,淋巴细胞以及基质细胞都有较高的一致性,并且无论在混合样本还是在单个病人样本中都可以检测到(ExtendedDataFigs.3,4,5)。相反,在新辅助治疗的原发肿瘤和转移肿瘤的癌细胞中出现了患者特异性细胞,这提示在晚期疾病中存在生物选择。
ExtendedDataFig.2a-e图反映了数据质量:文库大小、细胞复杂性以及活细胞数的分布情况均说明数据质量较高;并且根据d,e两图,不同病人间的细胞表达情况一致度也较高
为了避免细胞类型特异性捕获率带来的偏差,作者将髓细胞、上皮细胞以及基质细胞组分与淋巴细胞组分分开研究(分别展示在ExtendedDataFig.3和ExtendedDataFig.4)。
Fig.1d
根据d图展示结果,正常肺组织、原位肿瘤以及转移瘤中的不同细胞频率显著不同。比如:与正常组织相比,原位LUADs中的NK细胞显著减少(这与最近发表的研究结果一致)。
ExtendedDataFig.3a,c
根据ExtendedDataFig.3a,b(ExtendedDataFig.3a为髓细胞、上皮细胞、基质细胞重聚类后的t-sne图;ExtendedDataFig.3b为不同亚群的差异基因集表达热图(标准为标准化富集分数绝对值2以及校正p值?0.05)),髓细胞中炎症,伤口愈合以及抗原呈现相关基因上调,而基质细胞具有高增殖活性,高表达参与肺形态发生的骨形态发生蛋白,成纤维细胞生长因子和Wnt细胞因子。上皮和肿瘤细胞亚群表达不同的转录因子以及不同模式的特殊肺上皮细胞的表面标记物,其中就包括已知可在损伤后再生的肺泡上皮祖细胞(AlveolarEpithelialProgenitor,AEP)。
值得注意的是,测序得到的大部分细胞都是免疫细胞,肿瘤细胞的纯度在每个样本中从7–32%不等,而大规模靶基因测序得到的每个样本的肿瘤纯度为20–40%,差异可能来源于上皮细胞恢复的程度。同时,本文队列以及其他非小细胞肺癌研究中都表明肿瘤的免疫浸润水平很高。
ExtendedDataFig.5c,R=0.58,P=0.08(由单细胞测序数据和使用FACETS得到的配对肿瘤组织DNA测序结果估计的肿瘤纯度比较,FACETS是一种等位基因特异性拷贝数分析工具)
(2)原发肿瘤的再生及混合谱系本部分主要研究了原发肿瘤与成人肺上皮谱系之间的关系。
肺上皮谱系是在发展过程中表达转录因子SOX2和SOX9而发生定向分化,过程如Fig.2a所示:
在正常成人肺上皮中,作者鉴定出位于远端肺的包括Ⅰ型肺泡上皮(alveolarepithelialcelltypes1,AEC1)和Ⅱ型肺泡上皮(AEC2)在内的4种成熟细胞以及上呼吸道的纤毛细胞(ciliatedcells)和分泌细胞(clubcells)。
分泌细胞(clubcells),分泌呼吸道粘液成分,包括抗菌分子以及免疫调控蛋白;纤毛细胞(ciliatedcells),携带一种叫做纤毛的突出结构,负责清除粘液和碎片垃圾。
从第18.5天的小鼠胚胎中获得的谱系基因集可区分开这四种细胞,它们之间的最显著差异表达基因具有互斥性(ExtendedDataFig.6c,d)。最显著差异表达基因中就包含这几种肺上皮的标准标志物,同时,大部分AEC1,AEC2和纤毛细胞都表达超过60%的谱系特异性基因集中的基因。
ExtendedDataFig.6
正常成人肺组织的上皮细胞类型
了解正常上皮细胞的组成,联合分析正常上皮和原发肿瘤上皮,作者发现肿瘤中存在具有再生活性和混合谱系状态的上皮细胞。
Fig.2b–c
Fig.2bFig.2cFig.2d
有再生活性的细胞:
肿瘤组织中,除了4个在正常组织得到的成熟谱系上皮细胞外,还发现了两种参与严重肺损伤修复的肺再生祖细胞。具体而言,包括:SOX2驱动的KRT5+基底样细胞(PhenoGraphcluster13),它们表现出RAS信号通路表达增强以及与伤口反应相关的间充质基因富集的特点;SOX9+的AEPs(AlveolarEpithelialProgenitor,肺泡上皮祖细胞,PhenoGraphclusters10and11),它们具有肿瘤特异性,并且80%来自新辅助化疗后的原发肿瘤样本(MSK-LX)。
表达SOX9的AEP样细胞同时也经常表达于晚期转移腺瘤中。被标注为AEPs的细胞表达了与粘蛋白产生相关的基因,这支持了表现出祖细胞活性的细胞可能也保留了分化程序的观点;
第三例患者(MSK-LX)特异性肿瘤亚群表达典型神经内分泌(neuroendocrine,NE)标志物,这与该患者合并大细胞神经内分泌癌的诊断一致;
基本上所有肿瘤特异性细胞中,与祖细胞功能相关转录因子的表达都有所增高,如ID2,SOX2和SOX9。
ExtendedDataFig.7a-c
原发肿瘤与正常肺组织上皮细胞间的关系
混合谱系:
Fig.2dFig.2e所有肿瘤细胞中的50%都由剩下的6个亚群组成。因为异常表达的基因与多个近端和远端上皮细胞谱系有关,因此被注释为混合谱系。
由图e,混合谱系的显著差异表达基因包括了AEC1,AEC2,纤毛细胞细胞,AEP和基底样细胞的标志物。
Fig.2f-2g
为了在单细胞水平上进一步研究原发肿瘤的谱系混乱,作者基于未进行填充的数据,比较了正常上皮系和混合系肿瘤细胞亚群中表达的谱系特异性基因的比例。从图中可以看到,正常细胞表达ACE1和ACE2标志物的密度曲线与混杂谱系的肿瘤细胞重叠,这说明肿瘤细胞是这两种肺泡上皮的混杂。
细胞类型的数量及其依赖性是量化多个上皮系的转录因子的混杂度所面临的主要挑战。因此,作者运用了一种表型度量方法(phenotypicvolumemetric),以捕获肿瘤及正常肺上皮细胞中的谱系特异性基因共表达结构的复杂性。与正常肺上皮细胞相比,g图中原发肿瘤细胞谱系表型体积的扩大使原发肿瘤中由于谱系标志物异常组合而产生的更大的异质性以量化的形式表现出来。
尽管如此,肿瘤细胞状态中增加的谱系可塑性仍以正常的肺上皮细胞类型为主(AEC1,AEC2以及分泌细胞)。特别地,混合谱系亚群主要为边界状态之间的中间状态,边界状态就是前三个扩散分量的极值。扩散分量1和3的极值与AEC1,AEC2和分泌细胞相关,而扩散分量2则反映了肺组织的近-远端表达模式。同时发现,近端细胞中富含胚胎干细胞程序,这说明SOX2在肺内胚层特定分化和近端表达中的双重角色。其次,根据ExtendedDataFig.7g,肿瘤细胞与正常肺上皮细胞相似,但也可通过腺癌特征基因集的表达对两者进行区分:非癌性肺上皮细胞不表达该基因集,这也是它们的本质特征。
ExtendedDataFig.7d-g
这一部分的研究显示,原位肿瘤存在谱系多样性,肿瘤细胞的转录谱类似于肺损伤时的基因表达模式,也就是产生混合谱系及具有再生性质的细胞。
(3)人转移瘤的连续发育过程基于全基因组表达,对所有正常,原发肿瘤以及转移瘤的上皮细胞进行PhenoGraph聚类共发现21个不同的表型状态,其中的11个状态主要存在于转移瘤中(ExtendedDataFig.8a–d)。
转移亚群通过胚胎干细胞、伤口愈合和形态发生相关通路的上调以及高表达定义保守AEP的基因集与其他亚群区分开来。
ExtendedDataFig.8a
鉴定不同转移亚群的转录组
因此,作者基于不同亚群中特异性肺上皮发育基因集的平均表达水平对11个转移亚群进行了排序(3a,GO:),同时探索了它们与早期肺分化和发育程序之间的关系(3b)。
Fig.3a-3b
Fig.3aFig.3b3a:基于多个基因集的表达,作者将发育进程分为3个转移状态:Ⅰ-Ⅲ型;肺上皮发育的转移亚群排序与最近一篇文章中的与侵袭性上皮癌相关的成人干细胞特征的表达呈负相关。高表达的成人干细胞基因集亚群(Ⅰ型和Ⅱ型)的细胞迁移基因集同样高表达,而中间型细胞(Ⅱ型)同时上调形态发生和呼吸内胚层特异通路。相比之下,Ⅲ型亚群的AEP程序表达水平最高。
接下来,作者使用同样的肺上皮基因集对单个肿瘤细胞进行排序。
Fig.3c
可以看到,关键内胚层和肺特异性转录因子的表达同样支持“前肠内胚层发育(typeⅠ,SOX17和HHEX)→肺和气管形态发生(typeⅡ,SOX2,NKX2-1和FOXA2)→WNT反应的肺泡祖细胞,这些祖细胞将产生所有近端和远端细胞类型(typeⅢ,SOX9、WNT7B)”的表型发育过程。
为了具体探索发育性基因表达作为变异的重要来源,作者仅使用了这些基因的单细胞imputed表达矩阵(而不是全转录组)来聚集肿瘤细胞,并确定了4个发育阶段:一个增殖性(typeⅠ-P,proliferating),静止的(typeⅠ-Q,quiescent)成人干细胞样状态;SOX9high的再生状态(typeⅡ),以及SOX9high的AEP状态。
肺发育的方向很大程度上由SOX2和SOX9决定,根据图3b,SOX2还将指导胚胎发育和前肠内胚层的定向分化。在胚胎晚期和出生后阶段,很少有细胞在损伤反应之外保留这些转录因子的表达。作者使用免疫荧光技术在四个配对的原发性转移样本中分析这几个关键因子:
Fig.3d
可以观察到转移上皮细胞中存在SOX2和SOX9的高表达,而这在原发性肿瘤中是检测不到的。因此证明由单细胞转录组数据观察到的转移瘤中的干细胞和再生程序是真实可信的。
那么这些转移亚群是否也存在于原发性腺瘤中呢?
Fig.3e-3f
Fig.3eFig.3fFig.3e展示了各亚群细胞在原发性腺瘤中的占比,发现几乎所有原发肿瘤都不同程度地存在与干细胞和再生(Ⅰ型和Ⅱ型)转移阶段相对应的细胞;
Fig.3f则为各亚群细胞总生存率的HR:HR??1与不良预后相关,HR??1与较好的预后相关,而当95%置信区间跨过1说明与预后关系不显著。因此,可以看到,LUAD患者的Ⅰ型细胞越多,预后将越差。
上述发现与之前的报道一致:“干细胞转录程序与癌症的不良结果相关。”
相反,表达SOX9的AEP亚群在新辅助化疗后将表现出新的患者特异性特点。
ExtendedDataFig.8e
患者在每个亚群的熵值分布
总而言之,上述结果说明:转移灶再现了内胚层和肺形态发生的关键阶段,映射到正常发育(图3b),则位于成熟的近端和远端气道系的上游,这些气道系将区分原发肿瘤的表型。
(4)小鼠转移瘤模型发育的连续过程虽然可以在转移瘤患者的样本中检测到跨越内胚层和肺发生的各个关键阶段的表型状态,但是不同状态的细胞数量差异很大,并且样本是在一个动态,有多个关键节点的连续过程的某一时刻获得的。因此,作者试图在可移植小鼠肺癌转移模型中总结这些发现,该模型源于早期RAS突变的人类肺腺癌组织(H-潜伏性癌细胞latency