这篇文章是2019年上海交通大学邵志敏教授团队蒋一舟博士的文章

本文基于中国人群465个TNBC样本进行RNA-seq和外显子测序,并结合拷贝数变异,来分析中国人群的TNBC的特点,根据分子图谱,作者将中国人群的TNBC分为4个亚群。
中国人群队列的TNBC转录组和基因组图谱-编程知识网
本文聚焦
1.中国人的TNBC更倾向于PIK3CA的突变,而且表现的更像LAR亚型相比于TCGA基于欧洲人的基因组学图谱。
2.基于转录组的特点,将中国人的TNBC分为4个亚型。
3.多组学测绘鉴定出了TNBC亚型的潜在靶点。

根据临床特征和基因组和转录组学数据,将465例TNBC病人分成了四组
(1) luminal androgen receptor (LAR),呈现出更多的ERBB2的突变
(2) immunomodulatory
(3) basal-like immune-suppressed
(4) mesenchymal-like
TNBC的定义是不表达ER,PR和ERBB2扩增的乳腺癌,被称为是TNBC,TNBC约占所有乳腺癌亚型的10%-20%。更多的在年轻女性中发现,生物学上更具侵袭性。与其他亚型的乳腺癌病人相比,TNBC病人的远处复发率更高,5年存活率更低。
当前用于TNBC治疗的药物主要还是PPAR,当前免疫治疗仍具有较大的前景。针对TNBC的标准治疗还是化疗。

而对于TNBC的基因组学的研究,当前仅仅停留在mRNA的表达和DNA的拷贝数,因而在很大程度上使得对于TNBC的研究受限,TCGA数据对于TNBC的研究在2012年仅仅评估了100个TNBC样本,并且是在6个不同的平台进行的。

结果
1.
504个来自于病人原位肿瘤和血液样本经过质控处理后,得到了465个有效的病人样本。

在这465个病人样本中,只有279个进行了Whole exome seq,401个有SNA数据,360个有RNA-seq数据,这些病人样本是从2007年到2014年收集的,并且进行了45.8个月的随访。65个病人经历了复发和转移(表 S1和S2) 。

2.中国病人的体细胞基因组突变
在WES数据里,有25731个体细胞突变,其中单核苷酸突变的有24025个,以及由1688个插入或者缺失突变,在肿瘤里平均有46个非同义突变和4个插入突变,这与TCGA数据结果相似。其中最显著的突变是TP53,其次是PIK3CA,KMT2C和PTEN。其中的PIK3CA和PTEN和PIK3R1的突变与LAR( luminal androgen receptor)密切相关,ERBB2的突变与LAR也密切相关。从下图C我们可以看到,在多数的样本里MYC的扩增情况和功能获得情况明显占比很大,二对于RB基因,在多数样本里起功能缺失。

中国人群队列的TNBC转录组和基因组图谱-编程知识网

中国人群的TNBC突变情况和TCGA数据里面的突变情况
总体来说,在TCGA数据里,基因突变发生的频率更高,相比于 非洲裔美国人中PIK3CA主要发生在中国人群中(有图A)。在染色体上的突变可以明显的看到,在TCGA的21号染色体突变更加频繁。
中国人群队列的TNBC转录组和基因组图谱-编程知识网

接着,作者通过最近收缩质心法(nearest shrunken centroids method),将chinese TNBC基于mRNA-seq数据分为了4个亚群。并于TCGA数据进行了对比。发现中国人群中LAR亚型的占比最多。
中国人群队列的TNBC转录组和基因组图谱-编程知识网
3.基于多组学的TNBC亚型
作者采用**最近收缩质心法(nearest shrunken centroids method)**得到的结果,可以看到,当K=4的时候。CDF的斜率最大,B的下面一幅图,当K在4-7之间的时候,累积分布曲线的曲线下面积最大,大于7之后,几乎保持不变,综上所述,作者选用了k=4的情况
中国人群队列的TNBC转录组和基因组图谱-编程知识网
除此同时,作者对样本的基因数目进行聚类,结果发现,在选择差异的前2000个基因使,能够很好的将4个亚群进行区分,而选择其他的标准差在Top10%的mRNA,都无法很好的区分。
中国人群队列的TNBC转录组和基因组图谱-编程知识网
最终通过差异的前2000个基因,通过无监督聚类K=4将360个样本分成了4类。
同时通过体细胞突变和CNV变化情况也将样本分成了不同的类。

中国人群队列的TNBC转录组和基因组图谱-编程知识网
(1) a luminal androgen receptor (LAR) subtype (23%) characterized by androgen recep-
tor signaling;
(2) an immunomodulatory (IM) subtype (comprising 24% of tumors) with high immune cell signaling and cytokine signaling gene expression;
(3) a basal-like and immune-suppressed (BLIS) (39%) subtype characterized by upregulation of cell cycle, activation of DNA repair, and downregulation of immune response genes;
(4) a mesenchymal-like (MES) subtype (15%) enriched in mammary stem cell pathways

为了更综合的理解这几种亚型和多特征之间的关系作者进一步的考虑了表达量,CN,和基于亚型的突变特征的联系。同时通过COX风险回归模型来预测无复发生存率,置信区间是95%。

中国人群队列的TNBC转录组和基因组图谱-编程知识网

接下来对于4个不同的亚型进行分析,进行治疗靶点探索。
1.激活的ERBB2与细胞周期信号转

中国人群队列的TNBC转录组和基因组图谱-编程知识网

2.免疫检查点阻断在IM亚型中的潜在应用
此类预后较好,但存在复发或者转移,这种在细胞内观察到明显的免疫信号的升高。这类可用于免疫激活或者免疫刺激。

临床和组学特征均证实免疫识别在IM亚型中被激活,因此,这些肿瘤实现免疫逃逸的机制可能涉及免疫抑制细胞的募集或免疫检查点分子的激活。虽然IM亚型中免疫抑制细胞的数量没有增加,但表达谱分析显示免疫抑制剂,尤其是IDO1,在该亚型中显著过度表达,为使用免疫检查点阻断作为治疗方法提供了额外的理据。

主要进行了基质细胞浸润评分和基质浸润的免疫细胞的数目 。以及相关的免疫基因的表达量和信号通路的分析。
中国人群队列的TNBC转录组和基因组图谱-编程知识网
3.基于HRD评分的基底样免疫抑制亚型的进一步分类
从3D图可以看出,BLIS类型的TNBC主要是HDR突变率较高。HDR是一种基于拷贝数的生物标记物,有助于识别可能受益于DNA损伤剂的患者。不考虑生殖细胞和体细胞中的BRCA1/2的突变情况,仅有的根据HDR(中位数是41.64)将HDR的突变分为高HDR组合低HDR组。两组的5年复发率分别为95%和73%。高HDR的患者,对放疗和化疗都非常的敏感。

此外,高HRD BLIS TNBCs和低HRD BLIS TNBCs具有不同的基因组特。高HRD-BLIS-TNBCs中chr9p23amp和Chr13q34-amp亚型比例较高。相比之下,低HRD BLIS TNBC更可能出现全基因组倍增。因此,将HRD纳入以表达为基础的BLIS亚型表明,那些HRD高的患者可以从DNA损伤疗法(如铂类化疗)中获益匪浅,而HRD低的BLIS患者没有特效治疗方法,应考虑在复发后进行临床手术 。

中国人群队列的TNBC转录组和基因组图谱-编程知识网

4.MES亚型JAK/STAT3信号通路上调

MES亚型具有驱动基因组事件,例如E2F3增益和PIK3CA突变。对CNA/突变亚型的研究还表明,这类病人基因表达谱显示MES亚型显示乳腺癌干细胞(CSCs)的特征。为了进一步了解该亚型的变化,研究了JAK/STAT3信号通路,该通路在维持乳腺CSC中起着关键作用。结果表明,该亚型表现出较高的JAK1和IL6的表达,这是JAK/STAT3激活的重要驱动因素。

中国人群队列的TNBC转录组和基因组图谱-编程知识网
在JAKSTAT激活的人群中,MES亚型的识别可能是有益的,可以以STAT3抑制剂作为潜在的治疗策略。

总结这篇文章,作者主要通过RNA-seq和WES以及CNV三种组学联合分析,将中国人群的TNBC病人分为了4类,并于TCGA的数据进行比较,接下来从聚类得到的4个Cluster进行分步分析每一个亚群的特点,当然这是基于前期的分类来进行特异性分析的(主要包括突变,免疫基因表达和肿瘤干细胞相关通路以及HDR(针对基因组同源重组突变情况))进行的特定类群的特定分析。

总得来说这篇文章的思路还是很清奇的,密切结合了TNBC临床的特点,生信分析倒是很常规,IDEA比较新颖。