今天,我们来一起看一篇主要由数据分析和少量实验验证所构成的文章,其中的可复制性比较强,非常值得小伙伴们进行学习模仿。本文由中国医科大学于2024年2月发表在BMC Cancer(IF 3.8)上,题为“Glycosylation-related genes mediated prognostic signature contribute to prognostic prediction and treatment options in ovarian cancer: based on bulk and single‑cell RNA sequencing data”。
文章链接:https://pubmed.ncbi.nlm.nih.gov/38355446
01 文章逻辑
这篇文章的逻辑从公共单细胞数据入手,得到了糖基化相关基因(GRGs)的评分,这个评分获得也很简单,只要学习一下AUCell这个R包的使用就可以轻松实现。随后作者就可以根据这个评分,对样本进行GRGs评分的高低分组,接下来就是传统的寻找差异基因和富集分析。
随后作者根据这些差异基因,通过回归分析,构建了由16个基因组成的预测模型,这个预测模型能够准确的预测OC(卵巢癌)患者的预后。
既然可以预测预后,那么里面有什么机制上的改变呢?这里作者就做了突变和免疫环境的分析。其实到这里的逻辑都是挺通顺的,但是在临床中,OC其实是通过化疗治疗为主,作者为了更贴近临床,通过药物数据库,筛选了潜在治疗OC的药物。另外,最后作者还验证了GRGs其中一个基因的与卵巢癌细胞侵袭能力的关系,也算是一篇文章中的实验数据支撑。
02 分析项目及描述举例
这篇文章主要可以分成三块来看:
01 构建GRGs预测模型
作者首先使用了公共单细胞数据集来看OC中观察指标糖基转移酶(GT)活性,发现肿瘤和非肿瘤之间是存在差异的,这个就是本文从生信分析手段获得的现象,大家其实换个疾病或指标也是这个思路,首先去探索现象,再去挖掘机制。
接下来作者便想通过多元COX回归来构建具有预测价值的糖基化相关基因(GRG)signature。构建了模型就需要验证吧?这里作者就通过ROC证实了对于OV患者生存的预测性能较好,且通过富集分析,大致推测了一下其中的潜在通路。
02 机制挖掘
进一步的有了现象,就要探索其中的潜在机制,目前机制这一块突变图谱和免疫环境作者都用上了。作者首先从突变图谱入手,发现了其中的单碱基突变和肿瘤突变符合(TMB)都存在差异。更进一步的,作者通过CIBERSORT、ESTIMATE等常规分析挖掘了其中的免疫环境变化,并使用了免疫治疗的公共队列,分析了其中对抗PD-1治疗的敏感性。
03 修修补补
最后的两幅figure是让文章变得更加贴近临床,同时实验证据强一些。第一个是由于OC主要通过化疗手段治疗,作者前面所分析的都是免疫环境和免疫检查点抑制剂,因此作者这里贴近临床,挖掘了CTRP和PRISM这两个数据库,得到了一些可能的敏感的药物,但是也没有了下文。
随后作者的最后一幅figure所作的是预测模型中的其中一个基因,并在卵巢癌细胞中将这个基因进行敲减,通过Transwell实验观察其侵袭能力的改变。
03 审稿意见
对于这篇文章的审稿,基本上提出的问题都是生信相关的,比如说为什么选用AUCell这个算法确定基因集,其中用于分组的指标为什么不换用其他的。又例如作者在分析TMB和免疫环境中,单一指标来进行评估是不足以说明问题的,需要多种指标来结合分析复杂问题,或者我们一开始就将问题细化。再者,文中用到了单因素COX分析,但是没有多因素COX分析。
总的来说,reviewer所问的问题都比较温和,这篇文章于2023年10月投稿,一个月后反馈审稿信息,最终在今年1月接收,2月见刊,总周期比较短,过程也算顺利。
04 综合评价
这篇文章从单细胞数据入手,通过计算GRGs评分来对OC患者进行分组,并用回归分析构建了预测模型,发现从GRGs中挑选出的16个基因的预测能力挺强,进一步的分析了其中的机制,也联系了临床,最终也有实验的验证。总的来说这篇文章做的比较全面,但是要说深度的话,欠缺度还是挺大的,整体故事的连贯性也是一个比较大的问题,很多方向其实可以深入挖掘,但是都草草掠过,给人的感觉就是走了一个形式。
这篇文章发表在3.8分的杂志上,其实工作量而言,这个分数段也算是合格。
更多信息见:10月投稿,2月见刊:从中国医科大学这篇IF 3 公共单细胞数据分析,教你设计简单实验的临床相关生信文章思路
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。