实验记录3:用R包Seurat进行QC、PCA分析与t-SNE聚类
1、其中PCA, t-SNE和UMAP在scRNA-seq中使用非常普遍。
2、设置 reduction = harmony ,后续分析就会调用Harmony矫正之后的PCA降维数据。使用Harmony 矫正之后的数据,UMAP 和 Nearest Neighbor分析。
3、PCA中QC样本的聚集程度 QC样本的相关性 单变量分析 一次只分析一个变量,即一个m/z,考察不同组别不同样本的这个m/z表达有无差异? 常见的方法有倍数分析,t检验,秩和检验,方差分析等。
4、但仍然存在一些问题:标记识别分析可以帮助我们解决所有这些问题!下一步将是进行标记识别分析,这将输出聚类之间表达显着差异的基因。使用这些基因,我们可以确定或提高对集群/亚群群识别的信心。
5、Monocle是用于分析single-cell RNA-seq的R包,能够将细胞按照模拟的时间顺序进行排列,显示它们的发展轨迹如细胞分化等生物学过程。Monocle从数据中用无监督或半监督(?)的方式直接获得这个轨迹。
6、描述统计是通过图表或数学方法,对数据资料进行整理、分析,并对数据的分布状态、数字特征和随机变量之间关系进行估计和描述的方法。描述统计分为集中趋势分析和离中趋势分析和相关分析三大部分。
单细胞数据处理小细节汇总
1、总表达式对每个单元格的要素表达式度量进行标准化,将其乘以比例因子(默认为10,000),并对结果进行对数转换 scale.data#存储 ScaleData()缩放后的data,此步骤需要时间久。元数据,对每个细胞的描述。
2、GSVA不需要预先对样本进行分组,可以计算每个样本或者细胞类型***定基因集的富集分数,然后将富集分数在不同的样本或细胞类型间对比。
3、单细胞RNA测序是目前的一大热门。通过单细胞RNA测序,能够带给我们原来 bulk RNA (群体RNA)测序所得不到的信息,对于研究发育生物学、肿瘤生物学、免疫等有着极其重要的价值。单细胞测序的核心就是T-sne降维,以及聚类。
4、整个单细胞分析的核心其实就是确定cell types/ lineages。而在此之前的一步就是数据质控(QC, quanlity control)。
5、首先第一步:利用模型估计单细胞数据的细胞类型的表达特征。例如,通过使用常规聚类来识别细胞类型和亚群,然后估算平均聚类基因表达谱而获得的结果(如下图) ,我们需要逐步分析。
单细胞转录组分析—追踪移植后造血干细胞的分化
由于技术上的限制,移植的造血干细胞(HSCs)在预处理的宿主体内后不久的表现还没有被研究过。在这里,利用单细胞RNA测序,我们首先获得了28种造血细胞类型的基于转录组的分类。
血干细胞,属于分化程度较高的干细胞,即单一干细胞,这种细胞只能分化成各种血细胞的母细胞,比如红母细胞(红细胞的母体)等等。不过,如果在体外合适条件培养下,造血干细胞可以脱分化,成为具有高度全能性的细胞。
造血干细胞,是各种血细胞与免疫细胞的起源细胞。
scanpy作者使用了小鼠造血髓样数据进行了轨迹分析,我们这儿为了方便,我们直接使用pbmc3k数据进行测试。 注:pbmc这套数据集因为本身就是基本分化完全的细胞,分化轨迹没有啥实际生物学意义,这儿只是做测试。
ICA又称为独立成分分析,在单细胞转录组学里面作为一种线性降维参与到单细胞转录组的分析中。
在胚胎发育研究中,可以通过细胞互作探索发育相关细胞类型之间的相互作用,分析胚胎发育机制。2021年,发表在Cell Research上的一篇文章联合了单细胞和空间转录组数据研究小鼠胎肝(造血干细胞与多能祖细胞)HSCs/MPPs的扩增功能。
[免责声明]本文来源于网络,不代表本站立场,如转载内容涉及版权等问题,请联系邮箱:83115484@qq.com,我们会予以删除相关文章,保证您的权利。