03

表型性状特异性单细胞亚群

看到了2022的一个单细胞文章:《Single-Cell RNA Sequencing Reveals the Temporal Diversity and Dynamics of Cardiac Immunity after Myocardial Infarction》,里面有表型性状特异性单细胞亚群的概念,详见:Characterization of MI Contribution in Different Macrophage Subsets,需要同时考虑伴随表型变化的单细胞亚群数量以及表达量差异,看起来是蛮复杂的数学公式,如下所示: Continue reading

03

癌症细胞系模型里面有肿瘤免疫微环境吗

众所周知,实验室培养的癌症细胞系肯定是非常纯粹的恶性增殖的肿瘤细胞啦。

它被人诟病的一个缺点就是没办法代表真实的肿瘤病人的肿瘤部位的微环境,既然它缺失了肿瘤微环境,如果你测肿瘤细胞系培养物(药物处理前后)的单细胞转录组,就没办法follow我们分享的绝大部分的肿瘤领域的单细胞转录组的第一层次降维聚类分群以及生物学命名,详见之前的介绍 CNS图表复现08—肿瘤单细胞数据第一次分群通用规则, 是 : Continue reading

03

R语言里面如何高效调试代码

出版社送了一本书(R语言)给我,就是这个《R语言实战》第三版,它已经是R语言领域的“老兵”了,几乎是人手一本。

新鲜出炉的第三版,更新也很大,全面拥抱了ggplot体系。对我来说,比较新的知识点可能是一些小技巧,这里借花献佛给大家。 Continue reading

03

R语言里面如何高效编程

出版社送了一本书(R语言)给我,就是这个《R语言实战》第三版,它已经是R语言领域的“老兵”了,几乎是人手一本。

新鲜出炉的第三版,更新也很大,全面拥抱了ggplot体系。对我来说,比较新的知识点可能是一些小技巧,这里借花献佛给大家。 Continue reading

03

R语言里面的文本文件操作技巧合辑

偏底层的函数

常规需求是文本文件交互,比如 文件打开、文件写入、文件内容刷新等等,如果默认的文件没有规则仅仅是里面有内容,就需要使用比较底层的函数:

  1. 打开文件:你可以使用file()函数来打开一个文件。这个函数会返回一个连接,你可以通过这个连接来读取或写入文件。例如: Continue reading
03

R语言基础函数没有排序后取前面几个的功能函数top

R语言基础函数很多都是超级简单的英文单词,以下是一些R语言中基础函数的简单英文单词举例:

  1. print():打印输出结果。
  2. sum():计算向量或矩阵中元素的总和。
  3. mean():计算向量或矩阵中元素的平均值。
  4. max():找出向量或矩阵中的最大值。
  5. min():找出向量或矩阵中的最小值。
  6. length():计算向量中元素的个数。
  7. sqrt():计算数值的平方根。
  8. round():将数值四舍五入到指定的小数位数。
  9. sort():对向量或矩阵进行排序。
  10. unique():返回向量中的唯一元素。 Continue reading
03

PRJNA815461

学员给了一个2023的单细胞文章:《Single-cell RNA sequencing reveals a mechanism underlying the susceptibility of the left atrial appendage to intracardiac thrombogenesis during atrial fibrillation》里面的单细胞转录组数据集仅仅是公开了数据集的fastq文件,并没有表达量矩阵。我们就顺手下载并且处理了。

首先需要参考 小鼠的5个样品的10x技术单细胞转录组上游定量(文末赠送全套代码),走cellranger流程,主要是拿到服务器后配置自己的conda环境,以及下载项目对应的单细胞转录组数据集的fastq文件,如下所示: Continue reading

03

ebi旗下的ArrayExpress数据库的E-MTAB-11450

做生物信息学的我们经常会接触到生物信息学相关数据库等网络资源,绕不开的就是EBI和NCBI,我们以前介绍的单细胞转录组项目数据通常是ncbi旗下的sra或者geo数据库,但实际上ebi旗下的ArrayExpress数据库的也是有部分单细胞数据资源。

EBI (European Bioinformatics Institute) 和 NCBI (National Center for Biotechnology Information) 都是全球领先的生物信息学研究机构,它们提供了大量的生物信息学数据库和工具,对全球的科研工作者开放。 Continue reading

28

chatGPT教你做孟德尔随机化

如果你去openAI问chatGPT关于孟德尔随机化的流程,它是这样的回答:


是的,我可以为您提供一个孟德尔随机化的流程介绍。

孟德尔随机化是一种常见的生物信息学算法,用于评估基因对生物学过程的影响。该算法通过模拟随机基因重排来评估基因组和外显子组的对生物学目标的影响。

以下是孟德尔随机化的流程: Continue reading

28

CD4和CD8的T细胞在单细胞转录组水平本来就很难确定亚群和名字

隔三差五就有小伙伴在交流群里面问到他自己在进行CD4和CD8的T细胞细分亚群的时候非常纠结,根本就没办法确定下来到底应该是分多少群以及到底是应该按照什么顺序分。其实很正常,之前我们组建了CD4和CD8的T细胞的交流群就探讨失败,虽然说CD8 T和CD4 T细胞亚群 是一种分类方法,但是各自内部又是可以按照功能进行划分,naive, memory ,effector,cytotoxic,Exhaustion。 Continue reading

26

张泽民课题组的泛癌层面NK单细胞水平分群及其标记基因能带动一波数据挖掘文章吗

这两天看到了各种交流群以及朋友圈小伙伴都在转发和祝贺张泽民课题组的泛癌层面NK单细胞数据挖掘文章, 我简单看了看,类似的策略的数据挖掘居然一直可以发CNS级别杂志,让人膜拜:

  • 2021年2月发表在CELL的《A pan-cancer single-cell transcriptional atlas of tumor infiltrating myeloid cells》
  • 2021年12月发表在science的《Pan-cancer single cell landscape of tumor-infiltrating T cells》
  • 2023年9月发表在CELL的《A pan-cancer single-cell panorama of human natural killer cells》 Continue reading
26

怎么可能有如此重要的基因在泛癌层面出现缺失呢

众所周知,单个单细胞的转录组,如果是目前流行的10x这样的单细胞转录组技术,具体到每个细胞层面我们拿到的表达量信息通常是500到2000个基因的范围,也就是说如果我们的参考基因组注释文件里面是2万或者6万基因会出现起码90%的基因是缺失的,这个现象在单细胞转录组领域称作是drop-out (大家可以自行统计一下pbmc3k这个示例数据的drop-out情况 ) Continue reading