28

单细胞系列停更通知及组建单细胞数据分析交流小组

跟单细胞结缘已久,早在三年前我还是药厂生信工程师的时候就接触过一些前沿团队,听了他们的讲座后我就下意识的搜索了相关资料,了解到了欧洲的EMBL-EBI在组建十几个单细胞研究中心,也在全球范围内招聘RA和博士生,当时还把那些招募信息发送给了在南科大的学生,希望他们可以赶上这个机会。 Continue reading

26

bulk转录组数据的基因表达变化情况探索

 

 

一般来说可以用CV或者MAD来衡量某基因在某些样本的表达变化情况。

标准差与平均数的比值称为变异系数,记为C.V(Coefficient of Variance)。 变异系数又称“标准差率”,是衡量资料中各观测值变异程度的另一个统计量。 当进行两个或多个资料变异程度的比较时,如果度量单位与平均数相同,可以直接利用标准差来比较。

平均绝对误差(Mean Absolute Deviation),又叫平均绝对离差,它是是所有单个观测值与算术平均值的偏差绝对值的平均

用下面的代码可以看看,标准差,平均数,变异系数, 平均绝对误差的关系,如下: Continue reading

25

自己写代码计算单细胞转录组数据的CNV及绘制热图

25

使用inferCNV来推断2014的science关于GBM文章的单细胞转录组数据的拷贝数情况

前面我们介绍了单细胞转录组表达矩阵可以推断CNV的文献出处及历史,也简单过了broad开发的inferCNV软件,在其提供的测试数据上面成功运行了,也测试了airway这个转录组数据,还测试了CCLE数据库的RNA-seq和microarray数据,发现效果都不好,也暂时没能搞清楚问题出在哪里。

Continue reading

24

使用inferCNV来推断CCLE转录组数据的拷贝数变异

前面我们介绍了单细胞转录组表达矩阵可以推断CNV的文献出处及历史,也简单过了broad开发的inferCNV软件,在其提供的测试数据上面成功运行了,也测试了airway这个转录组数据,但是效果不好,现在看看CCLE数据库的测试结果吧,比较文章里面对之进行过同样的处理。

Continue reading

24

使用inferCNV来推断airway转录组数据的拷贝数变异

使用inferCNV来推断airway转录组数据的拷贝数变异

前面我们介绍了单细胞转录组表达矩阵可以推断CNV的文献出处及历史,也简单过了一半broad开发的inferCNV软件,但是只运行了其测试数据,远远不够。

现在我们来,使用inferCNV来推断airway转录组数据的拷贝数变异,其实主要就是如何制作input文件给inferCNV这个软件,要制作的数据文件如下:​

Continue reading

23

使用broad出品的inferCNV来对单细胞转录组数据推断CNV信息

使用broad出品的inferCNV来对单细胞转录组数据推断CNV信息

软件项目地址: https://github.com/broadinstitute/inferCNV.git

我在 https://mp.weixin.qq.com/s/Qns9TCSgNg_CQuwQxQbVnw 里面讲到了对单细胞转录组数据推断CNV信息的历史文献。其实看懂那些文件的补充材料的对单细胞表达矩阵的处理描述后是可以自己写代码来分析的,但是难度有点大,我们先来体验一下作者的软件。

Continue reading

十一 24

生信技能树论坛的生信基础板块-统计学

如果你是最近关注我们,你将又知道一个学习生信的好地方;

如果你是一直关注我们,你肯定对这个地方不陌生;

那就是我们的生信技能树论坛(附上网址:http://www.biotrainee.com/forum.php)。

本周我们将为大家带来论坛-生信基础版块的介绍。

今天给大家推送:生信基础板块-统计学

作者:王HH

Continue reading

十一 23

使用cnvkit来对大批量wes样本找cnv

cnvkit被设计来处理同一个批次的多个肿瘤配对样本测序情况,首先对所有的normal数据进行bin处理拿到背景值,然后就这个背景值来处理所有的tumor测序数据计算拷贝数变异情况。

该软件使用比较复杂,建议读一读官网教程。所有的命令都被包装到一个python脚本里面,使用该脚本调用一系列字命令,如下:

Continue reading