最近看到一个文章,标题是:《Comprehensive circular RNA profiling reveals the regulatory role of the circRNA-000911/miR-449a pathway in breast carcinogenesis》,发表于February 5, 2018 https://doi.org/10.3892/ijo.2018.4265 实验设计超级简单: Continue reading
Category Archives: 未分类
为什么百分百还原文献结果反而不对呢
去年我在《生信技能树》给学员分享过一个案例:GSE16561 复现,小众的illumina bead芯片,链接在:http://www.bio-info-trainee.com/7483.html ,当时大费周折才拿到跟其数据集原始文献类似的结果,已经是很满意了。最近把这个数据集作为任务安排给最新学徒们,他们反馈给我的结果让我丈二和尚摸不着头脑,居然是百分百还原文献结果,如下所示的差异基因列表: Continue reading
为什么的网页版Rstudio登陆总是失败
通常我们拿到一个全新服务器,要给大家使用,需要配置最新版R环境,代码如下:
为什么一个基因可以既是lncRNA又是protein_coding
有一些学生的Linux功底实在是太差了,所以我不得不重启六年前的《生信工程师》面试题给他们练习,有一个题目就是探索gtf。有意思的是学生们给我反馈了有几个基因居然既是lncRNA又是protein_coding。
好事成三的纪念卫衣
大家应该是注意到了我们最近两周在《生信菜鸟团》紧锣密鼓的福利轰炸:
Continue reading
SNV和INDEL仅仅是比较数量吗?
看到于2020年11月发表在杂志《nature cancer》的文章:《Mutations in BRCA1 and BRCA2 differentially affect the tumor microenvironment and response to checkpoint blockade immunotherapy》里面有全基因组测序数据,文献链接是:https://www.nature.com/articles/s43018-020-00139-8 Continue reading
Linux系统shell环境下的通配符远比我想的复杂
最近共享了一些服务器,主要是唐医生的功劳,已经成功运行3台:
Continue reading
为什么是AUC值而不是GSEA来挑选转录因子呢
前面我们通过RcisTarget包的 cisTarget()
函数,一句代码就完成了我们的hypoxiaGeneSet.txt文本文件的171个基因的转录因子注释。见:基因集的转录因子富集分析
使用curatedTCGAData下载TCGA数据库信息好用吗
好久没有写TCGA数据库教程了,因为TCGA计划早在2017年就陆陆续续停止了,我那个时候写了几百个教程并且录制了视频。
- 我三年前的TCGA教学视频课程B站地址:https://www.bilibili.com/video/av49363776
- 售后文档记录 https://docs.qq.com/doc/DYkVzUmZLWlhRRXVz 请先通读文档后再发问
- 我这边备份的TCGA数据来源于xena,ucsc的,都在,https://share.weiyun.com/5zLnKmO
没有什么基因芯片的探针是不能注释的
最近收到读者求助,说他感兴趣的表达量芯片数据集用到的的芯片是:[HT_HG-U133_Plus_PM] Affymetrix HT HG-U133+ PM Array Plate ,看起来跟我们授课的 hg133plus2比较类似。
但是很明显,看主页信息,一点都不简单 https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GPL13158 Continue reading
凭什么定位到UBR5基因
看到于2017年发表在Cancer Res 杂志的文章;E3 Ubiquitin Ligase UBR5 Drives the Growth and Metastasis of Triple-Negative Breast Cancer. 做的是肿瘤外显子数据,最后是: An analysis of primary TNBC specimen by whole-exon sequencing revealed strong gene amplifications of UBR5 associated with the disease. Continue reading
你还缺乳腺癌表达量数据集吗
生存分析你还是在TCGA吗?
最近有粉丝求助说他研究乳腺癌做了单细胞转录组数据,定位到了一个稀有细胞亚群,先看它感兴趣的亚群细胞特异性基因的临床意义,问我有没有除了TCGA数据库之外的其它数据库资源推荐。恰好我做这方面就顺手检索了一下,发现了 curatedBreastData 包,值得推荐!
基因集的转录因子富集分析
一般来说,大家拿到了感兴趣的基因集后,通常是做超几何分布检验看看富集到了什么生物学功能数据库,比如KEGG或者GO数据库,或者走gsea/gsva这样的富集分析,也是注释生物学功能数据库。 大家读我的表达芯片的公共数据库挖掘系列推文应该是够多了:
构建单细胞亚群网络(类似于细胞通讯分析)
最近一直在这里细胞通讯分析相关软件工具及原理,看到不同细胞亚群的网络图,就以为是细胞通讯分析。
Continue reading
最适合ChIP-seq实战的文献推荐
我有一个 免费视频课程《ChIP-seq数据分析》 ,其视频观看方式:
Continue reading
肿瘤基因测序数据分析视频课程终于上架B站啦
不知道还有多少人记得上半年的活动:0元,10小时教学视频直播《跟着百度李彦宏学习肿瘤基因组测序数据分析》,可能是因为免费所以大家都不珍惜吧,实际上参加这个活动的人数还不到200 ,连一个微信群都装不满!!!
Continue reading
真人工智能招聘(微信群答疑)
前段时间,我们分享了: 确实很吸引眼球,也引发了广泛的讨论,见:狼来了!聊个天就能做生信分析的人工智能是否要替代一大波生信人员?
但实际情况是,我们的各个交流群仍然是充斥着“显而易见”的初学者问题,人工智能的出现并不能帮我们减轻工作量。而且我搞出来的群有点太多了,每一个ngs组学教学视频都免费在B站,就同步组建好交流群,见: Continue reading
张泽民团队的单细胞研究把T细胞分的如此清楚
在教程 CNS图表复现08—肿瘤单细胞数据第一次分群通用规则,这个第一次分群规则是 :
- immune (CD45+,PTPRC),
- epithelial/cancer (EpCAM+,EPCAM),
- stromal (CD10+,MME,fibo or CD31+,PECAM1,endo) Continue reading
优于ANNOVAR和VEP的遗传变异位点注释软件
一般来说, 遗传变异位点注释软件我会介绍ANNOVAR和VEP,以及snpEFF,他们三个的引用是最多的。并不是说就他们3个软件可以做遗传变异位点注释啦,比较知名的还有GEMINI以及SeqAnt,也是萝卜青菜各有所爱哈。
Continue reading
这个芯片仅提供了GenBank的索引号
粉丝来信求助,他感兴趣的一个数据集的芯片平台是:GE Healthcare/Amersham Biosciences CodeLink Human Whole Genome Bioarray,链接是:GPL2895