经过朋友圈投票,我们选择了幕布这个软件的经典样式作为我们表观调控13张图视频课程目录,如下: Continue reading
Category Archives: 未分类
4年前的TCGA重磅资料你学了吗
还记得当初在微信公众号已经成为了一片红海的时候,我们生信技能树由论坛和博客这样过时的互联网形态转型杀进来微信公众号自媒体战场,当时奋斗的非常辛苦,虽然现在已经成为生物信息学领域当之无愧的流量当担。 Continue reading
TCGA年度(共4年)研讨会资料分享
最近搜索很多资料,都跳转到TCGA年度(共4年)研讨会PPT了,觉得有必要再次分享,第一次分享在:http://www.bio-info-trainee.com/958.html
TCGA年度(共4年)研讨会PPT官网是: http://www.genome.gov/17516564 Continue reading
TCGA的maf文件开始控制下载了
大家都知道maf文件记录着肿瘤患者的somatic突变情况,通常我们可以根据这个信息来在同一个肿瘤内部进行分组挖掘数据,比如:
如果你还不了解maf格式,请看:https://docs.gdc.cancer.gov/Data/File_Formats/MAF_Format/ Continue reading
pubmed.mineR说明书
HGS-OvCas有点类似于TNBC
这个纯粹是生物学背景知识,毕竟我们生信工程师仍然是处理的生物学数据,所以得抓住一切机会来扩充自己的生物学背景。 Continue reading
hg38按照200k分区间统计测序深度及GC含量
以前是自己写脚本: 【直播】我的基因组47:测序深度和GC含量的关系 可能是太复杂,大多数读者表示看不懂,所以我重新使用已有的轮子来做这件事。 Continue reading
estimate数据挖掘
看到文章 Aging (Albany NY). 2018 标题是:Mining TCGA database for genes of prognostic value in glioblastoma microenvironment
安排给了生信菜鸟团学徒进行数据分析图表复现,大家可以去菜鸟团公众号搜索到全部代码。 Continue reading
easyPubMed说明书
文档:https://cran.r-project.org/web/packages/easyPubMed/easyPubMed.pdf
作者是 Damiano Fantini ,看它的 Title: 搜索和读取 PubMed 上的文章发表信息。
看它的自我介绍: easyPubMed
可以查询 NCBI Entrez,以 XML 或 文本 格式获得 PubMed 信息,可以提取、整合数据,可以 轻 而 易 举 地下载一大堆记录信息,比如单独得到 作者、单位、题目、关键词、摘要、发表时间……
中文解读发在生信技能树公众号: Continue reading
awk命令在mac和Ubuntu下面表现不一样
最近在带领学徒,重现当初的 »生信技能树›互动作业›脚本能力实践›生信人必练的200个数据处理任务 Continue reading
招聘都需要有项目经验肿么办
借第一届生物信息学人才大会的契机
我们给大量有招聘需求的企业及科研单位和我们的十多万生信工程师建立了连接,然后发现一个很有趣的问题:就是招聘方通常是要求有项目实战经验,但大量的工程师都是初出茅庐,虽然不少是生物信息学专业科班出身,但是才走出象牙塔的他们也的确没有什么机会实战,那么我们就讨论一下,这个项目实战经验的问题! Continue reading
再次说明md5检查文件完整度的重要性
最近服务器停电,发现几个星期前提交的项目失败了几个样本: Continue reading
用ffmpeg转mov为mp4格式
通常我们的MAC录制视频后文件都非常大,15min的视频可以达到2G大小,所以需要转换和压缩,但是不能降低太多的分辨率。 这里我的御用视频编辑师推荐了一款非常轻量级的命令行工具FFmpeg
可以做到,下面是FFmpeg
的简短介绍: Continue reading
一起分析中国人的TNBC队列
看到标题进来的,肯定是知道TNBC(三阴性乳腺癌)的定义的,详见:https://mp.weixin.qq.com/s/wWFYLBIfexaP1PuhqgcA9w
乳腺癌是高度异质性疾病,临床分期及病理分级相同
的患者对治疗的反应和预后大不相同。
但是目前仍然是根据临床病理特点如HER2表达、雌激素受体状态、肿瘤大小、分级和淋巴结转移等选择辅助治疗,包括化疗,内分泌治疗,抗HER2治疗等。 Continue reading
寻找生存分析的最佳基因表达分组阈值
想做单细胞数据分析,完成一个R考核题
打开你的Rstudio,运行下面的代码: Continue reading
统计学10讲之示例数据
本来有statquest珠玉在前,我实在是提不起笔和勇气写统计学专题,但是最近直播单细胞转录组数据分析发现这系列知识点实在是太重要,而我的习惯是,讲不清楚的知识点不认为自己掌握了,所以还是尝试着介绍一波。 Continue reading
使用gtex数据库找组织特异性表达基因
组织特异性表达基因在单细胞领域应用比较广泛,毕竟一下子好几千个细胞的表达量矩阵就出来了,通过降维聚类,可以拿到不同的亚群,就需要对这些亚群进行生物学注释,这个时候,如果我们有人类的每个组织的特异性表达基因列表,就很容易操作。 Continue reading
使用DSS包多种方式检验差异甲基化信号区域
一个背景
哺乳动物基因组CpG位点通常集中在称为CpG岛(CpG island,CGI)的区域中,并且已知人基因启动子约60%含有CpG岛。CpG岛上下游不超过2000个碱基对(2kb)的基因组区域称为CpG“岛岸”(shores),其中CpG shelves指位于CpG shores 上下游2kb以内的区域,open sea指CpG islands、CpG shores和CpG shelves之外的其他区域。这4种情况形成了CpG resort,CpG位点的密度从island到open sea递减。 Continue reading
十年前收集病人五年前公布数据今天发nature
文章信息
题目:Immune evasion before tumour invasion in early lung squamous carcinogenesis
杂志:nature
时间:26-june-2009
链接: https://www.nature.com/articles/s41586-019-1330-0 Continue reading