01

辣鸡科研搞一次就算了吧

众所周知,绝大部分科研都是制造辣鸡。生活所迫嘛,升职加薪需要这个辣鸡玩意儿,肯定是大家趋之若鹜,也很容易走入灰色地带交易。
很多人说硕博士毕业不得已而为之,一辈子就怎么一次制造辣鸡,反正毕业后就再也不碰科研这个肮脏玩意儿,所以也很难对它们这样的行为追责!
但是,刚才在朋友圈看到了一个骇人听闻的新闻,英国莱斯特大学张煜东作为通讯作者发一口气制造了9个科研辣鸡,大家看看这些文章的在线链接就明白了是什么肮脏玩意儿: Continue reading

01

各种单细胞表达量矩阵和空间信息的导入

前面我们演示了R语言里面的最流行的Seurat的单细胞流程是如何导入标准10x技术空间单细胞文件, 虽然说也有其它空间单细胞技术可以产出各式各样的数据。详见:10x的空间单细胞文件格式详解,但是我们粗浅的可以认为空间单细胞约等于10x技术。不过Seurat官网确实是给出来了两个分类: Continue reading

01

可能是作者把部分样品标记错误了分组吗

看到了一个2023年11月发表的文章《Cross-talk between Myeloid and B Cells Shapes the Distinct Microenvironments of Primary and Secondary Liver Cancer》是非常简单的普通转录组结合单细胞转录组的数据分析案例,取样是 hepatocellular carcinoma (HCC) 和 colorectal cancer liver metastasis (CRLM)的两个分组,非常清晰的实验设计。 Continue reading

01

具体的样品被表达量芯片技术检测到的基因数量如何计算

学徒做了个GSE26305数据集的表达量芯片练习,总体上来说,经过了我们的标准分析训练,是可以完成差异分析和富集分析的,详见我十年前的公众号推文,目录在:

但是具体是到细节,学徒就傻眼了,比如文章里面提到了不同的样品使用这个芯片的时候仅仅是检测到1.33万个基因,如下所示: Continue reading

31

几乎没有差异,并且完全没有交集的组学数据分析结果

最近刷到了一个2023的文章《DNA methylome and transcriptome identified Key genes and pathways involved in Speckled Eggshell formation in aged laying hens》,家禽蛋壳的质量与蛋品生产的盈利能力密切相关。蛋壳斑点是影响鸡蛋外观和顾客偏好的一个重要品质性状。然而,斑点的形成机制仍然知之甚少。有斑点蛋和正常蛋的主要区别包括: Continue reading

31

关键单细胞亚群辅助判定之生存分析

做过单细胞转录组数据分析的小伙伴都知道,多分组多样品的单细胞项目很容易就十几万个单细胞了所以第一层次降维聚类分群就有十个左右亚群,然后每个亚群又可以细分十几个,算起来就是近百的单细胞亚群。

这样的话图表会非常多,但是数据分析的终极目标是发文章,而文章就必须要有故事性有落脚点。接下来我们就系统性梳理一下使用生存分析来辅助判定关键单细胞亚群。这里我们采用的仍然是2022的肺腺癌相关的文章,标题是:《Delineating the dynamic evolution from preneoplasia to invasive lung adenocarcinoma by integrating single-cell RNA sequencing and spatial transcriptomics》,肺癌单细胞数据集也有好几十个了,拿到表达量矩阵后的第一层次降维聚类分群通常是: Continue reading

31

给你一个病毒感染与否的时间序列采样的转录组你能挖掘出什么

大家最常接触的转录组数据分析教学环节都是二分组,处理和对照,疾病和正常,这样的差异分析很容易理解。但是真实的科研往往是更复杂一点,前面我们分享了:时间序列转录组多次差异分析以及时序分析,是不同时间点处理的肿瘤细胞系表达量芯片数据。 Continue reading

31

搞孟德尔随机化热点的小伙伴数据分析能力有点弱啊

看到了《生信菜鸟团》公众号组建了一个孟德尔随机化的交流群,大家热火朝天的推荐各种学习资源和公众号合集。

其中有一个资源是最新的(2023年10月)NC文章《Genome-wide association analysis of plasma lipidome identifies 495 genetic associations》里面的数据在GWAS catalog ,里面的索引号是 GCST90277238-GCST90277416,但是这个公众号的小伙伴却不知道该如何批量下载, 或者说发现规律去写代码,而且手动整理好全部的链接后下载然后把它当做是宝贝来宣传。。。。 Continue reading

31

肿瘤单细胞转录组的第一层次降维聚类分群

前些天在《生信技能树》的微信视频号做了一个肿瘤单细胞转录组的数据分析直播,文章是:《Delineating the dynamic evolution from preneoplasia to invasive lung adenocarcinoma by integrating single-cell RNA sequencing and spatial transcriptomics》详见:换一个分析策略会导致文章的全部论点都得推倒重来吗

主要的分析就是第一层次降维聚类分群,然后大概认识一下有什么亚群,以及比例差异情况,最后就是把每个亚群都细分一下做同样的分析即可。 Continue reading

31

导师是如何让你废掉的

前面我们指出来了如何避坑那些已经废掉了的在读硕博士,详见:这5种博士千万不要招进课题组

因为人是环境的产物,有一些情况下其实废掉了的在读硕博士本性并不坏,也并不是说完全的烂泥扶不上墙,有可能是其导师或者课题组氛围出了问题,也是需要避坑。接下来我们主要是参考:《院士谈博士避坑:这10种导师千万不要选》,来源:中国教育报 ,作者:杨卫。指出来了导师应当遵守的“十戒”,作为导师的指导原则,如下所示 : Continue reading

31

当算法和肉眼冲突了肿么办

通常情况下,如果大家提问说他们对自己的“照猫画虎”的生物信息学数据分析结果的准确性不确定的时候,我们会让他可视化后部分结果然后肉眼判断。因为为算法通常是给出来一个统计学指标,而我们高通量数据的分析通常是批量做大量的数据统计,会有大量的结果产生,这个其实就呼应了昨天的视频号直播: 生信分析和实验结果哪个更可靠(我和y叔的回答),y叔提到了因为存在大量的生物信息学初学者,他们对数据分析的认识不足导致数据分析出错误也会造成生信分析的不准确性。。。

比如,差异分析后一般来说有成百上千个上下调基因,如果对一个具 Continue reading