看到了《单细胞天地》公众号分享了一个学徒实战的笔记,详见:BD平台单细胞的优点都被你弄丢了,那个肺癌的免疫治疗数据集在GSE207422,很容易读取作者给出来了的表达量矩阵后进行降维聚类分群,然后我看了看结果里面的中性粒细胞种qc指标都很差,确实很容易被忽视。。。。 Continue reading
BD平台单细胞的优点都被你弄丢了
因为众所周知的原因(详见: 很抱歉我这里没有朝九晚五 ,以及得了吧,不缺你这点关注 ),我现在是没有实习生了。但是我还有学徒,所以可以在培养 他们的同时,给他们布置一些数据分析实战任务。
这次我给学徒布置了一个非小细胞肺癌的免疫治疗的单细胞转录组数据,文章是2023的《Tumor microenvironment remodeling after neoadjuvant immunotherapy in non-small cell lung cancer revealed by single-cell RNA sequencing》,因为我注意到里面的降维聚类分群有大量的中性粒细胞,如下所示: Continue reading
10x的空间单细胞文件格式详解
虽然现在(2023年12月30日)空间单细胞技术已经是百花齐放了,主要是基于测序的10x Genomics Visium平台和Slide-seq技术,另外基于成像的技术也有一点点市场,比如:seqFISH+、MERFISH、 NanoString GeoMx Digital Spatial Profiler (DSP),还有其它小众产品就不值得一提啦。
是否需要 spaceranger count 的定量过程 Continue reading
10X这样的单细胞转录组里面的非编码基因信息很难挖掘
数据挖掘真的是把人逼到花样百出,我们《生信技能树》作为华语圈生物信息学自媒体界扛把子自然也是被各种开脑洞的思路“骚扰”着,不过大家请不要无限制的怼我的私人微信哈,如果提问,在公众号推文文末留言即可,或者发邮件给我,我的邮箱是 jmzeng1314@163.com
10x官网下载pbmc3k数据集走RNA速率分析
突然间发现我们的RNA速率分析笔记仅仅是分享了在Linux操作的部分,见:使用基于python的velocyto软件做RNA速率分析,已经是2021年7月的事情了。 Continue reading
10x官网下载pbmc3k的bam文件走定量流程
最近各个交流群总是看到大家询问一些单细胞公共数据集处理,居然是从bam文件开始,可能是因为都是从ENA数据库下载吧。
https://www.ebi.ac.uk/ena/browser/view/PRJNA578550?show=reads : Continue reading
4个基因如何做go和kegg数据库注释
看到公众号后台有人这样提问:4个基因如何做go和kegg数据库注释!
我觉得这样的问题蛮好玩,说明初学者很容易被各种各样的高大上的数据分析项目给误导,以为go和kegg数据库注释是什么了不得的高级分析,或者说不知道为什么要做,也不知道它可以解决什么问题,仅仅是想搞一下高大上的图表而已。 Continue reading
10x的单细胞转录组fastq文件的R1和R2不能弄混哦
正常走cellranger的定量流程即可,代码我已经是多次分享了。参考:
10x的单细胞ATAC上游流程之cellranger-atac
前面我们组建的《 单细胞多组学上下游全打通 》的微信交流群,提到了该文章的数据集PRJNA768891里面的 atac的10x的单细胞,在ena下载是没有用的,必须去ncbi的sra下载,然后自己转fq文件。见:单细胞数据在ENA数据库和NCBI的SRA是有区别的
docker学习资源合辑
我们这些年一直在《生信技能树》上面分享过部分docker教程, 但是也说不清楚为什么docker一直没有conda那么流行,教程目录如下: Continue reading
CCLE数据库也单细胞信息啦!
文章标题是:《Pan-cancer single-cell RNA-seq identifies recurring programs of cellular heterogeneity》,链接是 https://www.nature.com/articles/s41588-020-00726-6 值得细读! Continue reading
BRCA1基因突变的乳腺癌患者数据哪里找?
乳腺癌研究领域里面BRCA1基因知名度无需方法强调了,毕竟 BRCA1基因的全称就是乳腺癌1号基因,于1990被研究人员确定,它是遗传性乳腺癌有关的基因,所以命名为乳腺癌1号基因,英文简称BRCA1。其实,还有一个姐妹基因BRCA2 ,在1994年被确定。 Continue reading
Bioconductor亚洲线上会议
今天给大家安利一个可以免费报名参加的生物信息线上学术会议:BioC Asia 2021。会议下周就要开始了,先把注册链接放在这里,感兴趣的小伙伴赶紧报名吧:点这里注册参会。 Continue reading
nature文章的差异分析就值得模仿吗?
最近有粉丝提问,他的差异分析跟一篇nature文章的差异分析结果交集少得可怜,不知道自己哪里错误了。 Continue reading
tryCatch的简单实现和复杂实现方式
最近在实习生在处理一个单细胞转录组数据集的时候,发现该研究的全部10x样品里面居然有5个是无法读取的, 所以像我求助。 很有意思。文章是:《Single-cell transcriptomic analysis of the tumor ecosystems underlying initiation and progression of papillary thyroid carcinoma》: Continue reading
在Linux的黑白命令行无法看R语言配色的解决方案
通常情况下我们是在自己的Windows或者Mac电脑使用R语言,出图,每一个步骤都是动态交互并且随时随地的可视化。 Continue reading
SCI文章教你胰腺癌小鼠模型单细胞样品制备
前面我们单细胞天地和联川生物联合分享了单细胞样品制备心得,系列目录如所示: Continue reading
医学教授选择在耄耋之年拿下了物理学博士学位
一口气安装800个R包
我们周末班准备工作主要就是希望大家学会安装R包 http://www.bio-info-trainee.com/3727.html Continue reading
一个**R**NA-seq数据分析的Snakemake流程
RNA-seq数据分析我们分享了很多,有RNA-seq数据分析经验的小伙伴都会觉得很简单,直接把fastq格式的测序数据比对到合适的参考基因组,然后根据匹配的基因组注释文件去定量就可以拿到表达量矩阵。后续就是基于表达量矩阵的差异分析,富集分析! Continue reading