看到了2022的一个单细胞文章:《Single-Cell RNA Sequencing Reveals the Temporal Diversity and Dynamics of Cardiac Immunity after Myocardial Infarction》,里面有表型性状特异性单细胞亚群的概念,详见:Characterization of MI Contribution in Different Macrophage Subsets,需要同时考虑伴随表型变化的单细胞亚群数量以及表达量差异,看起来是蛮复杂的数学公式,如下所示: Continue reading
Category Archives: 未分类
表达量是否有差异你说了算
有小伙伴在交流群问:自己的目标基因在做完表达量差异分析后发现它并不在上下调列表里面,感觉有点惶恐,如果是真实现象,那么: Continue reading
癌症细胞系模型里面有肿瘤免疫微环境吗
众所周知,实验室培养的癌症细胞系肯定是非常纯粹的恶性增殖的肿瘤细胞啦。
它被人诟病的一个缺点就是没办法代表真实的肿瘤病人的肿瘤部位的微环境,既然它缺失了肿瘤微环境,如果你测肿瘤细胞系培养物(药物处理前后)的单细胞转录组,就没办法follow我们分享的绝大部分的肿瘤领域的单细胞转录组的第一层次降维聚类分群以及生物学命名,详见之前的介绍 CNS图表复现08—肿瘤单细胞数据第一次分群通用规则, 是 : Continue reading
R语言里面如何高效开发R包
出版社送了一本书(R语言)给我,这个《R语言实战》已经是R语言领域的“老兵”了,几乎是人手一本,目前是第三版,更新也很大,全面拥抱了ggplot体系。对我来说,比较新的知识点可能是一些小技巧,这里借花献佛给大家。 Continue reading
R语言里面如何高效调试代码
出版社送了一本书(R语言)给我,就是这个《R语言实战》第三版,它已经是R语言领域的“老兵”了,几乎是人手一本。
新鲜出炉的第三版,更新也很大,全面拥抱了ggplot体系。对我来说,比较新的知识点可能是一些小技巧,这里借花献佛给大家。 Continue reading
R语言里面如何高效编程
出版社送了一本书(R语言)给我,就是这个《R语言实战》第三版,它已经是R语言领域的“老兵”了,几乎是人手一本。
新鲜出炉的第三版,更新也很大,全面拥抱了ggplot体系。对我来说,比较新的知识点可能是一些小技巧,这里借花献佛给大家。 Continue reading
R语言里面的文本文件操作技巧合辑
偏底层的函数
常规需求是文本文件交互,比如 文件打开、文件写入、文件内容刷新等等,如果默认的文件没有规则仅仅是里面有内容,就需要使用比较底层的函数:
- 打开文件:你可以使用
file()
函数来打开一个文件。这个函数会返回一个连接,你可以通过这个连接来读取或写入文件。例如: Continue reading
R语言基础函数没有排序后取前面几个的功能函数top
R语言基础函数很多都是超级简单的英文单词,以下是一些R语言中基础函数的简单英文单词举例:
- print():打印输出结果。
- sum():计算向量或矩阵中元素的总和。
- mean():计算向量或矩阵中元素的平均值。
- max():找出向量或矩阵中的最大值。
- min():找出向量或矩阵中的最小值。
- length():计算向量中元素的个数。
- sqrt():计算数值的平方根。
- round():将数值四舍五入到指定的小数位数。
- sort():对向量或矩阵进行排序。
- unique():返回向量中的唯一元素。 Continue reading
PRJNA815461
学员给了一个2023的单细胞文章:《Single-cell RNA sequencing reveals a mechanism underlying the susceptibility of the left atrial appendage to intracardiac thrombogenesis during atrial fibrillation》里面的单细胞转录组数据集仅仅是公开了数据集的fastq文件,并没有表达量矩阵。我们就顺手下载并且处理了。
首先需要参考 小鼠的5个样品的10x技术单细胞转录组上游定量(文末赠送全套代码),走cellranger流程,主要是拿到服务器后配置自己的conda环境,以及下载项目对应的单细胞转录组数据集的fastq文件,如下所示: Continue reading
NIH的癌症中心每周常规生信培训
无意中看到了这个宝藏资源:https://bioinformatics.ccr.cancer.gov/btep/,是NIH的癌症中心每周常规生信培训,值得推荐:
每次培训都有全部的授课资源整理并且网络公开分享,比如:https://btep.ccr.cancer.gov/docs/data-visualization-with-r
GEO数据库的每个GPL平台对应的详细信息获取txt文本文件
一般来说,GEO数据库的每个GPL平台都有对应的网页,而且可以获取其详细信息的txt文本文件,比如:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GPL6244
就是如下所示: Continue reading
ebi旗下的ArrayExpress数据库的E-MTAB-11450
做生物信息学的我们经常会接触到生物信息学相关数据库等网络资源,绕不开的就是EBI和NCBI,我们以前介绍的单细胞转录组项目数据通常是ncbi旗下的sra或者geo数据库,但实际上ebi旗下的ArrayExpress数据库的也是有部分单细胞数据资源。
EBI (European Bioinformatics Institute) 和 NCBI (National Center for Biotechnology Information) 都是全球领先的生物信息学研究机构,它们提供了大量的生物信息学数据库和工具,对全球的科研工作者开放。 Continue reading
chatGPT在生物信息学的应用讨论组
一大早就看到了两个chatGPT在生物信息学的应用,感觉有必要参与到其中了。如果大家看完后也有同感,可以一起加入讨论组哈, 群策群力,看看如何更好的向chatGPT提问,如何更好的使用这个AI助手,在我们的生物信息学数据处理过程中。 Continue reading
chatGPT写了个计算蛋白质序列的分子量的函数
我首先让chatGPT帮我根据fasta格式的蛋白质序列文件,使用Python语言计算里面的每个蛋白质的序列长度和分子量,它给了描述了解题思路。。。
看起来蛮厉害的,我怀疑它可能是对我的真正的需求不够了解,我其实就是想让他帮忙写代码,就继续追问它: Continue reading
chatGPT教你做孟德尔随机化
如果你去openAI问chatGPT关于孟德尔随机化的流程,它是这样的回答:
是的,我可以为您提供一个孟德尔随机化的流程介绍。
孟德尔随机化是一种常见的生物信息学算法,用于评估基因对生物学过程的影响。该算法通过模拟随机基因重排来评估基因组和外显子组的对生物学目标的影响。
以下是孟德尔随机化的流程: Continue reading
CD4和CD8的T细胞在单细胞转录组水平本来就很难确定亚群和名字
隔三差五就有小伙伴在交流群里面问到他自己在进行CD4和CD8的T细胞细分亚群的时候非常纠结,根本就没办法确定下来到底应该是分多少群以及到底是应该按照什么顺序分。其实很正常,之前我们组建了CD4和CD8的T细胞的交流群就探讨失败,虽然说CD8 T和CD4 T细胞亚群 是一种分类方法,但是各自内部又是可以按照功能进行划分,naive, memory ,effector,cytotoxic,Exhaustion。 Continue reading
真的是所有的基因都可以随心所欲的差异吗
最近在交流群看到了一个很有意思的讨论,就是他看到了他们领域的癌症高分文献,发现里面的差异分析结果跟之前的另外一个高分文献里面的基因很不一样,就以为我们生物信息学是万能魔法,可以让任意基因都有差异:
Continue reading
张泽民课题组的泛癌层面NK单细胞水平分群及其标记基因能带动一波数据挖掘文章吗
这两天看到了各种交流群以及朋友圈小伙伴都在转发和祝贺张泽民课题组的泛癌层面NK单细胞数据挖掘文章, 我简单看了看,类似的策略的数据挖掘居然一直可以发CNS级别杂志,让人膜拜:
- 2021年2月发表在CELL的《A pan-cancer single-cell transcriptional atlas of tumor infiltrating myeloid cells》
- 2021年12月发表在science的《Pan-cancer single cell landscape of tumor-infiltrating T cells》
- 2023年9月发表在CELL的《A pan-cancer single-cell panorama of human natural killer cells》 Continue reading
怎么可能有如此重要的基因在泛癌层面出现缺失呢
众所周知,单个单细胞的转录组,如果是目前流行的10x这样的单细胞转录组技术,具体到每个细胞层面我们拿到的表达量信息通常是500到2000个基因的范围,也就是说如果我们的参考基因组注释文件里面是2万或者6万基因会出现起码90%的基因是缺失的,这个现象在单细胞转录组领域称作是drop-out (大家可以自行统计一下pbmc3k这个示例数据的drop-out情况 ) Continue reading
院士团队的WGCNA挖掘文章修改成为癌症转移与否关键模块
基本上每年我们都会在生信技能树等公众号写多个教程分享WGCNA的实战细节,比如: Continue reading