我用rmarkdown写过的教程

Featured

用rmarkdown写教程真心非常方便,尤其是R语言相关的,比如一些R包的应用,或者一些可视化,或者一些统计,下面我简单列出一些我以前写过的,图文并茂,关键是还非常省心,不需要排版,不需要上传图片,整理图片。

一般来说看链接最后的文件名就知道这篇文章讲的是什么了:

Continue reading

一个MeDIP-seq实战-超级简单-2小时搞定!

Featured

请不要直接拷贝我的代码,需要自己理解,然后打出来,思考我为什么这样写代码。
软件请用最新版,尤其是samtools等被我存储在系统环境变量的,考虑到读者众多,一般的软件我都会自带版本信息的!
我用两个小时,不代表你是两个小时就学会,有些朋友反映学了两个星期才 学会,这很正常,没毛病,不要异想天开两个小时就达到我的水平。

MeDIP-seq 跟ChIP-seq的分析手段是一模一样的,同理hMeDIP-seq,caMeDIP-seq等等,都没有本质上的区别,只是用的抗体不一样而已,请自行搜索基础知识,我只讲数据分析。

一个ChIP-seq实战-超级简单-2小时搞定!

一个RNA-seq实战-超级简单-2小时搞定!

Continue reading

15

生活中有的是意外

明天和意外,哪一个先到来呢?

在运行picard的时候,总是报错,如下;

To get help, see http://broadinstitute.github.io/picard/index.html#GettingHelp
Exception in thread "main" picard.PicardException: Start on sequence 'chr10' was past the end: 133797422 < 133805459

从字面上很难理解, 我查看了一些,最新版的hg38基因组里面的10号染色体长度是133797422 ,那么为什么我的bed文件里面会超出呢?

Continue reading

29

在KRAS-TRP53基因驱动的LADC依赖于rRNA的合成依赖于Ect2基因

KRAS-TRP53基因驱动的LADC依赖于rRNA的合成依赖于Ect2基因

今天JC的时候,同学分享的是一个比较难懂的文章,我尝试着follow她,但失败了。文章发表于2017年1月的CELL,是 Ect2-Dependent rRNA Synthesis Is Required for KRAS-TRP53-Driven Lung Adenocarcinoma , 里面太多陌生的名词,如下: Continue reading

28

找个motif嘛,简单

我在生信菜鸟团发布的自学CHIP-seq分析第八讲就提到过如何寻找motif,motif是比较有特征的短序列,会多次出现的,一般认为它的生物学意义重大,做完CHIP-seq分析之后,一般都会寻找motif 。查找有两种:

Continue reading

28

单细胞系列停更通知及组建单细胞数据分析交流小组

跟单细胞结缘已久,早在三年前我还是药厂生信工程师的时候就接触过一些前沿团队,听了他们的讲座后我就下意识的搜索了相关资料,了解到了欧洲的EMBL-EBI在组建十几个单细胞研究中心,也在全球范围内招聘RA和博士生,当时还把那些招募信息发送给了在南科大的学生,希望他们可以赶上这个机会。 Continue reading

26

bulk转录组数据的基因表达变化情况探索

 

 

一般来说可以用CV或者MAD来衡量某基因在某些样本的表达变化情况。

标准差与平均数的比值称为变异系数,记为C.V(Coefficient of Variance)。 变异系数又称“标准差率”,是衡量资料中各观测值变异程度的另一个统计量。 当进行两个或多个资料变异程度的比较时,如果度量单位与平均数相同,可以直接利用标准差来比较。

平均绝对误差(Mean Absolute Deviation),又叫平均绝对离差,它是是所有单个观测值与算术平均值的偏差绝对值的平均

用下面的代码可以看看,标准差,平均数,变异系数, 平均绝对误差的关系,如下: Continue reading

25

自己写代码计算单细胞转录组数据的CNV及绘制热图

25

使用inferCNV来推断2014的science关于GBM文章的单细胞转录组数据的拷贝数情况

前面我们介绍了单细胞转录组表达矩阵可以推断CNV的文献出处及历史,也简单过了broad开发的inferCNV软件,在其提供的测试数据上面成功运行了,也测试了airway这个转录组数据,还测试了CCLE数据库的RNA-seq和microarray数据,发现效果都不好,也暂时没能搞清楚问题出在哪里。

Continue reading

24

使用inferCNV来推断CCLE转录组数据的拷贝数变异

前面我们介绍了单细胞转录组表达矩阵可以推断CNV的文献出处及历史,也简单过了broad开发的inferCNV软件,在其提供的测试数据上面成功运行了,也测试了airway这个转录组数据,但是效果不好,现在看看CCLE数据库的测试结果吧,比较文章里面对之进行过同样的处理。

Continue reading

24

使用inferCNV来推断airway转录组数据的拷贝数变异

使用inferCNV来推断airway转录组数据的拷贝数变异

前面我们介绍了单细胞转录组表达矩阵可以推断CNV的文献出处及历史,也简单过了一半broad开发的inferCNV软件,但是只运行了其测试数据,远远不够。

现在我们来,使用inferCNV来推断airway转录组数据的拷贝数变异,其实主要就是如何制作input文件给inferCNV这个软件,要制作的数据文件如下:​

Continue reading

23

使用broad出品的inferCNV来对单细胞转录组数据推断CNV信息

使用broad出品的inferCNV来对单细胞转录组数据推断CNV信息

软件项目地址: https://github.com/broadinstitute/inferCNV.git

我在 https://mp.weixin.qq.com/s/Qns9TCSgNg_CQuwQxQbVnw 里面讲到了对单细胞转录组数据推断CNV信息的历史文献。其实看懂那些文件的补充材料的对单细胞表达矩阵的处理描述后是可以自己写代码来分析的,但是难度有点大,我们先来体验一下作者的软件。

Continue reading

01

RNA-seq仍然可以不做重复

RNA-seq仍然可以不做重复

很多benchmark文章推荐做RNA-seq的时候,每个处理最好是做5个以上的重复,当然,研究者为了节约经费,通常只做3个重复,更有甚者做两个也行。但是只做一个,往往就麻烦了,因为没办法进行常规的统计学检验看处理前后的差异表达的显著性。 Continue reading