终于做了这个决定,把我们的单细胞转录组视频课程限时免费!是真的免费,不玩虚的!
前天在生信技能树以及单细胞天地公众号及社区跟大家讨论了,开源一些视频,也为抗击SARS-CoV-2
引起的急性呼吸疾病 COVID-19
做贡献,毕竟 华清大学、京北大学联合发现:#学习R语言之数据挖掘可抑制新型冠状病毒#,是目前有效的防范冠状病毒的手段之一。 Continue reading
Monthly Archives: 2月 2020
450K芯片上面的甲基化探针到底需要进行哪些过滤
最近在做illumina的甲基化芯片数据处理知识整理,所以看了不少文献咯,发现甲基化探针到底需要进行哪些过滤这么一个小细节,值得探讨的却很多。欢迎大家加入我们的讨论群:一个甲基化芯片信号值矩阵差异分析的标准代码 ,我整理的资料,都在群里共享。 Continue reading
2020学习主旋律B站74小时免费教学视频为你领路
生物信息学必备计算机背景
书籍贪多不烂,必买工具书如下,每个读5遍以上,或者买同类书籍5本,总之想方设法打牢基础!
- R语言之书 编程与统计 https://book.douban.com/subject/33418263/
- Linux命令行与shell脚本编程大全.第3版
视频必须强推生信技能树近30万学习量的基础合辑:https://space.bilibili.com/338686099/#/ Continue reading
不同时间点不同药物浓度不同细胞系的转录表达
看到数据集 GSE103115,是关于:Cisplatin-induced gene expression changes in triple-negative breast cancer (TNBC) cells,是4种三阴性乳腺癌细胞系的同一个药物的不同时间的转录表达水平效应,每个处理是2个生物学重复。这个数据集发表在Cell Rep. 2019 Aug ,题目是:Modeling of Cisplatin-Induced Signaling Dynamics in Triple-Negative Breast Cancer Cells Reveals Mediators of Sensitivity. 分析策略的确是蛮有意思的。 Continue reading
查看感兴趣基因的甲基化水平和RNA表达水平相关性
处理大型数据集的11条技巧
nature杂志的TECHNOLOGY FEATURE 栏目在13 JANUARY 2020发表了一个有趣的小短文:Eleven tips for working with large data sets,副标题是:Big data are difficult to handle. These tips and tricks can smooth the way.
我简要概括一下: Continue reading
单基因GSEA分析策略
单细胞大样本也不好发出去了
2013年,《Nature Methods》杂志将单细胞测序列为年度技术。
2013年,《Science》杂志将单细胞测序列为年度最值得关注的六大领域榜首。
与此同时,随着测序成本的下降,越来越多的单细胞的文章发表在顶级的期刊上,这些都表明单细胞测序已经成为科研的热点。 但是并不意味着冲向这个领域就有CNS,哪怕花了几百万经费测大量单细胞转录组数据。尤其是某些癌症领域,已经有了几十个单细胞相关研究发表,如果确实从实验设计和数据角度来看都平淡无奇,那么很可能大量单细胞的转录组数据也不是很好发出去。 Continue reading
单细胞转录组数据分析大放价 (疫情期间不打烊)
2020年开局有点难,不知道是天灾还是人祸的新冠病毒疫情打的中小企业是措手不及。我五年前在深圳的同事,又在华大工作了三年,好不容易才找到机会回到家乡小城市且找到生信对口工作,兢兢业业工作了两年。贷款买房,结婚生子,昨天初为人父的他接到老板电话说要砍掉一半的工资,基本上等于变相逼他离职了。 Continue reading
都2020年了你还在用tophat吗
五年前我在生信菜鸟团博客写过一个《RNA-seq流程需要进化啦》,上面分享过:
Tophat 首次被发表已经是6年前
Cufflinks也是五年前的事情了
Star的比对速度是tophat的50倍,hisat更是star的1.2倍。
stringTie的组装速度是cufflinks的25倍,但是内存消耗却不到其一半。 Continue reading
对转录组测序的counts矩阵去除批次效应
关于RNA-seq,我们在生信技能树应该是至少推出了400篇教程,而且是我们全国巡讲的标准品知识点,其中还有一个阅读量过两万的综述翻译及其细节知识点的补充:
多个表达矩阵文件合并
今天群主给了我们学徒一个任务,下载数据集:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE84073
我想看到,HCC,CHC,CC这3组,跟healthy的分开比较,然后出3个火山图,3个热图。那么首先需要下载counts值矩阵,样本信息如下: Continue reading
干扰一个基因分析全局基因表达其实是无法定位该基因完整功能
目前主流探索全局基因表达的技术就是芯片和测序了,不管是编码蛋白的基因,还是其它表观相关分子,比如:
根据感兴趣基因看肝癌免疫微环境的T细胞亚群差异
在单细胞水平探究肝癌免疫微环境研究领域里,最早且出名的就是北大张泽明教授团队发表在Cell. 2017 Jun 的文章:Landscape of Infiltrating T Cells in Liver Cancer Revealed by Single-Cell Sequencing.,他们测序策略是: Continue reading
甲基化的一些基础知识
前面我们系统性的总结了circRNA的相关背景知识:
甲基化芯片的一般分析流程
前面我们系统性的总结了circRNA的相关背景知识:
甲基化芯片数据的一些质控指标
前面我们介绍了一些背景知识,主要是理解什么是DNA甲基化,为什么要检测它,以及芯片和测序两个方向的DNA甲基化检测技术。具体介绍在:甲基化的一些基础知识,也了解了甲基化芯片的一般分析流程 。 Continue reading
甲基化芯片数据下载的多种技巧
数据是一切的开始,万事开头难哦!
前面我们介绍了一些背景知识,主要是理解什么是DNA甲基化,为什么要检测它,以及芯片和测序两个方向的DNA甲基化检测技术。具体介绍在:甲基化的一些基础知识,也了解了甲基化芯片的一般分析流程 。 Continue reading
甲基化芯片数据下载如何读入到R里面
数据是一切的开始,前面我们介绍了一些背景知识,主要是理解什么是DNA甲基化,为什么要检测它,以及芯片和测序两个方向的DNA甲基化检测技术。具体介绍在:甲基化的一些基础知识,也了解了甲基化芯片的一般分析流程 。既然要开始甲基化芯片数据挖掘实战,那么首先要有数据咯!需要区别的是甲基化芯片样本的idat原始文件,以及甲基化信号值矩阵。前面我们介绍了如何在GEO里面下载甲基化数据,拿到的数据文件必须要导入到R里面才能分析,现在我们就讲一下不同数据如何导入R里面。 Continue reading
甲基化信号值的差异分析也许不应该是看logFC
最近在系统性整理DNA甲基化相关文献,也顺便在生信技能树分享教程:
- 甲基化的一些基础知识
- 甲基化芯片的一般分析流程
有意思的是,甲基化分析其实和普通的mRNA表达矩阵分析有很多概念问题是无法迁移的,包括质量控制,WGCNA分析,哪怕是简单的差异分析都有区别。 Continue reading