看到了交流群小伙伴分享了一系列数据挖掘文章,都是浙江大学李兰娟院士的学生的成果。其中一个《Characteristic Analysis of Featured Genes Associated with Cholangiocarcinoma Progression》倒是蛮简单的,挑选TCGA数据库里面的 GDC TCGA Bile Duct Cancer (CHOL)&removeHub=https%3A%2F%2Fxena.treehouse.gi.ucsc.edu%3A443) 数据集,然后根据里面的样品的二分类属性(肿瘤样品和正常组织对照)做一个简单的差异分析,然后基于差异分析后的基因列表进行go和kegg的数据库注释,以及使用WGCNA算法构建网络,然后挑选合适的网络看里面的hub基因而已。 Continue reading
Category Archives: 未分类
一个好消息一个坏消息
前些天,我们的《生信技能树》论坛所在的服务器被我格式化,所以论坛过往七八年的几万篇笔记就灰灰湮灭了。
其中论坛所在服务器背后还有有一个简易的生物信息学书籍,详见:都不知道自己还有一本书,很多人过来询问该如何继续浏览。然后热心的阿越居然帮我找到了存稿,而且帮我重新制作成为了可以被浏览的在线书籍,最新的链接在《生信菜鸟团》博客里面,是: http://bio-info-trainee.com/basic/ (应该算是一个好消息吧!) Continue reading
# 学员的转录组实战笔记之胰腺癌差异
文章是:《Identification and functional analysis of novel oncogene DDX60L in pancreatic ductal adenocarcinoma》,细读它可以发现两个不同的数据集, (GSE171485 and GSE171486).
- SRP313524-PRJNA719796-GSE171485 (polyadenylated-RNA extracted from 6 PDAC specimens and 6 non-tumor adjacent tissues.)
- SRP313537-PRJNA719795-GSE171486 (knockdown MYEOV, KCNN4, S100A16 and DDX60L in MiaPaCa2 and PANC-1 cells.) Continue reading
学术交流一定要以SCI文章为前提吗?试试Octopus
学术交流是研究人员与同行、学术界以及社会大众分享他们的研究成果、发现和观点的重要方式。然而,并不是所有的学术交流都必须通过SCI(Science Citation Index)期刊发表文章 :
- 多元化的交流方式: 学术交流的方式多种多样,除了发表SCI文章外,还包括会议报告、演示、研讨会、书籍章节、科普文章、博客等。不同的交流方式可以满足不同层次和领域的交流需求。 Continue reading
学术海报发表在Zenodo就可以被正规引用啦
Zenodo 是一个开放的研究数据存储和共享平台,旨在促进学术界内的数据、出版物和其他研究成果的共享。以下是 Zenodo 平台的主要学术功能:
- 数据存储和共享: Zenodo 提供了一个安全的存储环境,使研究人员能够将各种类型的研究数据上传、存储和共享。这包括原始数据、实验结果、图表、图像、文本文件等。 Continue reading
选择小众技术做同样的课题(事半功倍)
昨天我们diss了肿瘤外显子技术,很容易设计课题,任意肿瘤对象招募病人集齐样品送给公司进行肿瘤外显子测序即可,公司一般来说也会给出来somatic突变信息,包括SNV和CNV,甚至给出来发表级别的图表。详见:几乎不提供任何有用信息的肿瘤外显子你还做吗 Continue reading
胞类型和细胞状态如何区分?
最近看到了一个博客讨论了细胞类型和细胞状态,详见:https://mbernste.github.io/posts/cell_types_cell_states/,里面提到了Svennson 等人(2021)的预印本研究发现,随着研究人员测量更多的细胞,他们往往会发现更多的“细胞类型”。。。
为什么CD4和CD8的T细胞在单细胞转录组水平本来就很难确定亚群和名字,因为绝大部分已经发表的文章对他们的细分都是依据细胞形态,而不是真正的细胞类型。 Continue reading
我有故事你有酒吗
原文发表在《生信技能树》公众号,详见:https://mp.weixin.qq.com/s/IVAPcGLIZmNoS8YXsCm7Dg
生物信息学是一个跨学科的领域,涉及生物学、计算机科学、数学和统计学等多个领域的知识。因此,入门生物信息学可能会遇到以下一些困难:
- 编程技能:生物信息学大量依赖编程来处理和分析数据。对于没有编程背景的人来说,学习如Python、R或Perl等编程语言可能会有一定的挑战。 Continue reading
我们当然不至于只有转录组啊
前些天有一个人给了我这样的留言,让我我现在很迷茫:
这个人已经是四五年的老粉了,确实,如果他一路看过来,很容易发现我们其实一直是三板斧(编程基础+ngs多组学+单细胞)。很单调,是有点乏善可陈,但是我个人确实是感觉写什么都很难突破过去的自己,这个公众号创作是越来越搞不下去了。。。。 Continue reading
我理解初学者可以不懂,但是感觉没必要在微信群提问
每个人都是从初学者走过来的,我当然是知道纯粹的初学者肯定是没办法凭空去获得如何查看自己的r包安装在电脑什么目录的知识点,但是我觉得这个不应该是在微信交流群里面讨论的,只需要简单的购买书籍去学习最基础r知识点即可。
为什么一定要处理测序仪出来的10x技术单细胞转录组测序数据呢
官网说的很清楚:https://support.10xgenomics.com/single-cell-gene-expression/software/pipelines/latest/using/fastq-input
To serve as inputs for cellranger, FASTQ files should conform to the naming conventions of bcl2fastq and mkfastq:
[Sample Name]
S1_L00[Lane Number]
[Read Type]
_001.fastq.gz
Where Read Type
is one of:
I1
: Sample index read (optional)I2
: Sample index read (optional)R1
: Read 1R2
: Read 2 Continue reading
为什么绝大部分教程都是Read10X读取3个文件
我们《生信菜鸟团》的单细胞周更专辑作者分享过好几次了基础文件读取技巧啦,详见: 读取不同格式的单细胞转录组数据及遇到问题的解决办法。
其中最常见的就是使用Read10X读取3个文件,但是Read10X读取3个文件还得注意版本,而且必须保证3个文件名字完全一样,要么是 Continue reading
网页工具可能没必要使用,但它很适合学习底层原理
最近刷到了生物信息学领域著名期刊NAR的最新文章:《NORMSEQ – a tool for evaluation, selection and visualization of RNA-Seq normalization methods》是一个网页工具,NORMSEQ,它介绍了一些转录组测序表达量矩阵的归一化标准化方法学而且提供了一个在线网页工具给大家使用。
之所以注意到它,是因为NORMSEQ的流程图画的很吸引眼球: Continue reading
糖尿病早期的病人和正常人的肾脏单细胞水平差异
文章概述
文章标题:《The single-cell transcriptomic landscape of early human diabetic nephropathy 》
发表日期和杂志:2019年发表在PNAS
在线阅读链接:https://www.pnas.org/cgi/doi/10.1073/pnas.1908706116 Continue reading
刷了一下历年的中国生物信息学十大进展
蛮有意思的,看了看这个《中国生物信息学十大进展》评选活动起始于2018,恰好经历了一个疫情。从生物信息学的3个领域方向挑选成果,包括:
从上面的3个分类评选的入选的工作中进一步评选,产生每个年度“中国生物信息学十大进展”。 Continue reading
适合学生的第一款从零开始学习Linux的云服务器
看到了朋友圈的腾讯云大促活动,一个你可以拥有完整root权限的服务器仅需要95每年!比如这一款 轻量应用服务器-入门型,适合低负载应用,学生和个人开发者入门首选。首年低至95元!!!可以看到: Continue reading
是的,不同版本的cellranger软件对10x技术单细胞定量结果可以相差两倍以上
今年的暑期实习生开启了他的单细胞学习笔记系列,就是《暑假一起学单细胞》,其中第二讲是 一文搞定基本cellranger定量,就有小伙伴留言说:用最新版本的cellranger出的单细胞数量比老版本的多很多,该怎么办? Continue reading
使用中国区chatGPT解析gtf文件
前面我们直播了转录组测序后的表达量矩阵的下游分析标准代码,其中为了方便大家复现,我们使用了人类的airway数据集,它表达量矩阵整理代码如下所示: Continue reading
使用单细胞技术发文章不要纠结于样品数量
可以怎么说, 但凡是使用单细胞技术的科研课题,都是“幼儿园”水平,实验设计肯定是几十年前的甚至几百年前的,区别是N多年前大家是使用癌症和正常对照看其它技术指标,而现在大家看的单细胞指标,基本上都不会有科学含金量。大家拼的就是经费,燃烧吧广大劳动人民的血汗钱。 Continue reading
使用AUCell结合单细胞亚群标记基因列表来判断亚群名字
之前我们介绍了:这近100种单细胞亚群的2348个标记基因好用吗,提到了作者这里并不是采用我们标准的单细胞可视化标记基因的方法。以前我们做了一个投票:可视化单细胞亚群的标记基因的5个方法,下面的5个基础函数相信大家都是已经烂熟于心了: Continue reading