31

通过IMGT数据库认知免疫组库

免疫组库测序(Immune Repertoire Sequencing,IR-Seq)是非常小众的产品,并不属于TCGA的7种数据(WGS,WES,RNA-seq,miRNA,450K等等),所以我并没有在B站录制公益教学视频。
有趣的是,最近突然接到了一些粉丝求助,关于免疫组库数据处理的。所以就系统性的整理一下相关知识点,并且带领大家实战演练一个完整的免疫组库测序数据项目分析流程哈。 Continue reading

31

生物信息学大百科全书

不知道多久以前在朋友圈看到转发分享:因为疫情,Johns Hopkins的Project Muse 限时免费,包括普林斯顿、康奈尔、乔治亚、哈佛、港中文、ACA、Early Theatre等40多家出版社基本都开放了自己的电子资料库,共有近24000本原版英文书,282本期刊。 链接是:https://about.muse.jhu.edu/resources/freeresourcescovid19/ Continue reading

31

什么,你连10块钱的云服务器都不想买

前些天为了帮助广大粉丝度过难关,所以开放了生信技能树全平台的招聘信息,见:还说啥呢,继续免费啊,而且里面还有一个是:购买入门级服务器免费送Linux直播培训服务,有粉丝留言说之前我们还赠送服务器的,现在居然还要自己购买,这免费活动不诚心啊!我连忙删除了这个留言还把它拉黑!

不过,到的确有无需购买10块钱的云服务器就可以学Linux的骚操作,因为是薅腾讯的羊毛,而且还有免费的教学,都是他们的工程师。我以前推荐学生做这个,https://cloud.tencent.com/developer/labs/lab/10000 点击进入就是一个免费的服务器,可以使用几个小时, 足够你跟着他们的免费教学视频入门Linux啦!

教学视频在:https://cloud.tencent.com/edu/learning/course-1676-12066

腾讯云大学之Linux快速入门

大家可以直接从第3章开始学习,常规文件夹及文件管理基础命令不多

ls ## list 列出当前路径下信息
pwd ## print working directory 打印工作目录,即当前所在目录
cd ## change directory 切换目录
mkdir ## make directory建立一个新的目录
touch ## 创建文本
mv ## Move 更改文件或目录,移动目录或文件
rm ## ReMove 删除目录或文件
cp ## copy and paste 将给出的文件或目录复制到另一个文件或目录中 tar ## Tape archive 解压文件
ln ## LINk 链接文件
3. 基操之常用命令
  • 3.1 章节介绍
  • 3.2 Linux命令帮助文档的使用
  • 3.3 文件目录创建及切换等命令
  • 3.4 相对路径和绝对路径
  • 3.5 文件目录命名规则
  • 3.6 ls命名详解
  • 3.7 文件目录拷贝命令
  • 3.8 重命名及移动命令
  • 3.9 文件目录删除命令
  • 3.10 文件内容查看命令
  • 3.11 软链接和硬链接
  • 3.12 history命令
  • 3.13 echo命令完成覆盖和追加内容
  • 3.14 文件命令综合案例
  • 3.15 时间命令
  • 3.16 tar打包及解压
  • 3.17 tar结合gzip压缩
  • 3.18 tar结合bzip2
  • 3.19 压缩在大数据中的使用详解
  • 3.20 系统命令实操
4. 文本编辑上古神器之VIM
  • 4.1 章节介绍
  • 4.2 VIM神器概述
  • 4.3 VIM工作模式
  • 4.4 VIM插入命令
  • 4.5 VIM定位命令
  • 4.6 VIM删除命令
  • 4.7 VIM复制粘贴命令
  • 4.8 VIM替换和取消命令
  • 4.9 VIM退出命令
5. 爱恨情仇之用户、 用户组及权限管理
  • 5.1 章节介绍
  • 5.2 Linux安全性模型
  • 5.3 用户详解
  • 5.4 用户组详解
  • 5.5 用户管理
  • 5.6 用户组管理
  • 5.7 Linux文件和目录的权限解读
  • 5.8 权限管理实操之字符表示法
  • 5.9 权限管理实操之数字表示法
  • 5.10 权限管理实操之赋予可执行权限
6. 行走江湖之常用软件安装
  • 6.1 章节介绍
  • 6.2 Linux软件安装概述
  • 6.3 RPM方式软件安装实操
  • 6.4 YUM方式软件安装实操
  • 6.5 JDK安装实操
  • 6.6 Tomcat安装实操
6.7 MySQL安装实操
    1. 课程总结
  • 7.1 Linux 基础入门

当然了,这个只能说是简单的认识Linux,如果你想精通,还是建议购买一个最低配服务器,跟着练习。

可以把Linux的学习过程分成6个阶段 ,一般来说,每个阶段都需要至少一天以上的学习:

  • 第1阶段:把linux系统玩得跟Windows或者MacOS那样的桌面操作系统一样顺畅,主要目的就是去可视化,熟悉黑白命令行界面,可以仅仅以键盘交互模式完成常规文件夹及文件管理工作。
  • 第2阶段:做到文本文件的表格化处理,类似于以键盘交互模式完成Excel表格的排序、计数、筛选、去冗余,查找,切割,替换,合并,补齐,熟练掌握awk,sed,grep这文本处理的三驾马车。
  • 第3阶段:元字符,通配符及shell中的各种扩展,从此linux操作不在神秘!
  • 第4阶段:高级目录管理:软硬链接,绝对路径和相对路径,环境变量
  • 第5阶段:任务提交及批处理,脚本编写解放你的双手
  • 第6阶段:软件安装及conda管理,让linux系统实用性放飞自我

而且,如果你学习Linux是为了生物信息学的数据处理,那么我建议你看完下面的3个视频:

文末友情宣传

强烈建议你推荐我们生信技能树给身边的博士后以及年轻生物学PI,帮助他们多一点数据认知,让科研更上一个台阶:

31

谁说肿瘤高表达基因就是生存风险因子

非常多的粉丝在我们生信技能树后台留言询问,为什么他/她关注的基因明明是癌基因,明明是在肿瘤病人高表达(TCGA数据库搜索后的结果),但是却发现它对生存的影响居然是保护因子!(同样的网页工具)

所以我这里安排一个学徒作业,大家需要去下载TCGA数据库的BRCA这个癌症的芯片和RNA-seq的表达矩阵,分别进行差异分析,拿到统计学显著的上下调基因列表。 Continue reading

31

如果你问我R代码调试我就会告诉你head

任何一个编程语言, 要想足够好用,都必须要有完善的代码调试机制,毕竟谁写代码还不碰到几个bug呢。

比如R语言编程,简单的R代码调试,其实靠head,str,help函数即可。所以我从强调初学者应该是要至少把这3个函数敲1000遍以上。比如,群里有人问它的表达矩阵里面的探针ID,跟他准备好的探针ID与基因对应表格, 无法匹配,自己在Excel手动搜索,明明是每一个探针都存在于准备好的探针ID与基因对应表格里面。 Continue reading

30

每个基因都值得研究吗?

最近看到朋友圈都在宣传一个队列研究成果,就是2020年4月30日,ChinaMAP联盟携全国29家研究机构和医院,在中科院上海生命科学研究院主办的Cell Research**杂志发表了长文章“The ChinaMAP analytics of deep whole genome sequences in 10,588 individuals”Continue reading

30

连最基础服务都不让我们专业人士来做了

做知识分享这六年,太多粉丝需要帮助,所以我选择了全部无偿公开我所有技能,不仅仅是R和Linux基础,还包括多种ngs技术数据处理,甚至单细胞,这些教学视频都在B站。这样我就可以轻松上阵,但是千分之一左右粉丝是有科研经费,而且也没有时间精力慢慢看教程钻研摸索的,所以我们仍然是提供一点点学习辅导服务: Continue reading

30

绝大部分情况下,我们其实是不知道如何提问

有意思的是,如果能合理的提问,绝大部分问题其实就可以自己抽丝剥茧的解决掉

最近有一个学徒非常执着的要自费私聊提问(主要是专家咨询费),这里需要说明一下,我其实每天都会处理十几个粉丝提问,部分比较耗费时间的问题就会让大家等等,因为我也不是每天没事只做公益。除非是实在是等不及的,才需要自费紧急求助于我。 Continue reading

30

给你8个甲基化探针, 你可以在tcga数据库进行怎样的探索

我喜欢把TCGA数据库的应用划分为8个领域:

  • 1、探索各类肿瘤不同临床特征(性别、年龄、种族、临床分期)的预后(生存曲线)
  • 2、探索各类肿瘤与对照的单个分子(mRNA,lncRNA,miRNA,甲基化,蛋白)水平的差异情况(箱线图)
  • 3、探索各类肿瘤与对照的全局(mRNA,lncRNA,miRNA,甲基化,蛋白)水平的差异情况(差异分析流程) Continue reading