我用rmarkdown写过的教程

Featured

用rmarkdown写教程真心非常方便,尤其是R语言相关的,比如一些R包的应用,或者一些可视化,或者一些统计,下面我简单列出一些我以前写过的,图文并茂,关键是还非常省心,不需要排版,不需要上传图片,整理图片。

一般来说看链接最后的文件名就知道这篇文章讲的是什么了:

Continue reading

一个MeDIP-seq实战-超级简单-2小时搞定!

Featured

请不要直接拷贝我的代码,需要自己理解,然后打出来,思考我为什么这样写代码。
软件请用最新版,尤其是samtools等被我存储在系统环境变量的,考虑到读者众多,一般的软件我都会自带版本信息的!
我用两个小时,不代表你是两个小时就学会,有些朋友反映学了两个星期才 学会,这很正常,没毛病,不要异想天开两个小时就达到我的水平。

MeDIP-seq 跟ChIP-seq的分析手段是一模一样的,同理hMeDIP-seq,caMeDIP-seq等等,都没有本质上的区别,只是用的抗体不一样而已,请自行搜索基础知识,我只讲数据分析。

一个ChIP-seq实战-超级简单-2小时搞定!

一个RNA-seq实战-超级简单-2小时搞定!

Continue reading

13

sam和bam格式文件的shell小练习

首先使用bowtie2软件自带的测试数据生成sam/bam文件,代码如下:

mkdir -p ~/biosoft
cd ~/biosoft
wget https://sourceforge.net/projects/bowtie-bio/files/bowtie2/2.3.4.3/bowtie2-2.3.4.3-linux-x86_64.zip 
unzip bowtie2-2.3.4.3-linux-x86_64.zip 
cd ~/biosoft/bowtie2-2.3.4.3-linux-x86_64/example/reads
../../bowtie2 -x ../index/lambda_virus -1 reads_1.fq -2 reads_2.fq > tmp.sam
# samtools view -bS tmp.sam >tmp.bam

Continue reading

30

第41周文献分享-肝癌复发的CpG甲基化信号特征

发表于2017年,杂志是 JOURNAL OF CLINICAL ONCOLOGY 影响因子26.303 , 文章是 CpG Methylation Signature Predicts Recurrence in Early-Stage Hepatocellular Carcinoma: Results From a Multicenter Study 亮点应该是自己的数据,然后使用了两个机器学习算法

  • LASSO, Least Absolute Shrinkage and Selector Operation;
  • SVM-RFE, Support Vector Machine-Recursive Feature Elimination;
    前面我们讲解了一篇2013年多组学数据探索乳腺癌细胞系药物敏感性使用的也是两个机器学习算法,不过是LS-SVM和RF,但是也有借鉴意义。

    Continue reading

30

第39周文献分享-探索BRCA1基因全部可能的突变的功能

2018年9月朋友圈刷屏的nature文章,题目是:Accurate classification of BRCA1 variants with saturation genome editing 字面意思是探索了BRCA1基因上面的全部可能的突变位点的生物学意义,但事实上只是探索了96.5% of all possible single-nucleotide variants (SNVs) in 13 exons that encode functionally critical domains of BRCA1.

Continue reading

12

第36周-时间序列表达矩阵揭示肿瘤转移的动态过程

时间序列表达矩阵揭示肿瘤转移的动态过程

肝癌很可怕,尤其是转移后,很多关于其转移前后对比的研究,但是缺乏中间过程数据,特别是转移临界点
作者通过肝癌模型,在不同时间点取样做芯片转录组,试图分析 non-metastatic (or normal) and pre-metastatic (or critical) 这两种状态区别。顺利找到了临界点及其相关调控网络,而且还重点分析了其中一个网络的最重要的节点基因:CALML3
To discover early warning signals of pulmonary metastasis in HCC, we analysed time-series gene expression data in the spontaneous pulmonary metastasis mouse HCCLM3-RFP model with our novel dynamic network biomarker (DNB) method.
构建了 xenograft HCCLM3-RFP mice , 20只小鼠分成4组,即4个时间点(W2, W3, W4, W5)取样。

Continue reading

09

第30周-乳腺癌病人的原位癌多点采样测序看异质性

乳腺癌病人的原位癌多点采样测序看异质性

于2015年发表在 Nature Medicine杂志,标题是:Subclonal diversification of primary breast cancer revealed by multiregion sequencing 来自于:Cancer Genome Project, Wellcome Trust Sanger Institute, Hinxton, UK.
对50个患者取了303个样进行测序,其中13个是WGS,剩余的290个取样只是特定基因的捕获测序。偏偏是没有WES的数据。

Continue reading

30

第29周-FGFR3-TACC3基因融合机制探究

FGFR3-TACC3基因融合机制探究

文章发表于2018年1月,在大名鼎鼎的nature杂志上面,题目是;A metabolic function of FGFR3-TACC3gene fusions in cancer, 美国哥伦比亚大学医学中心(CUMC)的研究人员发现两个相邻基因的融合能够导致线粒体过度运转和增加细胞疯狂生长所需的燃料数量,从而导致癌症产生。他们也发现在人癌细胞和一种脑癌类型的小鼠模型中,靶向这个新鉴定出的癌症通路的药物能够阻止肿瘤生长。
全文的重点应该是实验探索及验证FGFR3-TACC3基因融合机制。

Continue reading