九 02

蛋白质组学上游数据处理知多少

Posted on 2024年9月2日 by ulwvfje

上游数据分析里面的蛋白质鉴定与定量是两个不同的过程，但是在实践中，蛋白质鉴定和定量通常是联合进行的。例如，在质谱实验中，首先通过MS/MS数据进行蛋白质鉴定，然后利用相应的肽段信号强度或特定的定量标签来量化蛋白质的表达水平。这种结合使用鉴定和定量的方法可以提供关于蛋白质在不同条件下表达模式的详细信息，从而有助于理解生物学过程和疾病机制。

蛋白质鉴定（Protein Identification）： Continue reading →

九 02

单细胞转录组可以这样简单计算相关性吗

Posted on 2024年9月2日 by ulwvfje

我一直强调：数据挖掘的核心是缩小目标基因！

各种数据挖掘文章本质上都是要把目标基因集缩小，比如表达量矩阵通常是2万多个蛋白编码基因，不管是表达芯片还是RNA-seq测序的，采用何种程度的差异分析，最后都还有成百上千个目标基因。如果是临床队列， Continue reading →

九 02

单细胞转录组差异分析的8大痛点

Posted on 2024年9月2日 by ulwvfje

最近刷到了一个预印本的文章：《The curses of performing differential expression analysis using single-cell data》，是来自于美国的密西根大学和芝加哥大学的研究论文。他们提到了单细胞数据分析的“诅咒”（curses）。单细胞转录组差异分析之所以困难，主要是由于以下8个方面的原因： Continue reading →

九 02

单细胞亚群合理命名是数据分析基石啊

Posted on 2024年9月2日 by ulwvfje

前面我们diss了一个单细胞数据挖掘文章，详见：天啦，啥肿瘤有如此高比例的树突细胞，研究者们就是把单核细胞当做是了树突细胞，闹了个笑话。强烈建议新手如果是想利用好单细胞公共数据集，可以看我们的数据分析顾问服务哈，否则很容易被diss，参考：单细胞，单细胞，我要diss你！

其实这样的笑话在单细胞数据挖掘文章里面层出不穷，比如另外一个数据挖掘文章；《Identification of Five Hub Genes Based on Single-Cell RNA Sequencing Data and Network Pharmacology in Patients With Acute Myocardial Infarction》，链接是： Continue reading →

九 02

单细胞亚群该细分到什么程度呢

Posted on 2024年9月2日 by ulwvfje

通常我们拿到了肿瘤相关的单细胞转录组的表达量矩阵后的第一层次降维聚类分群通常是：

immune (CD45+,PTPRC),
epithelial/cancer (EpCAM+,EPCAM),
stromal (CD10+,MME,fibro or CD31+,PECAM1,endo)

参考我前面介绍过 Continue reading →

九 02

单细胞亚群的命名的细致程度需要有一个度

Posted on 2024年9月2日 by ulwvfje

看到了首都医科大学的北京积水潭医院的一个2024的单细胞数据挖掘文章，标题是：《Single-cell RNA sequencing and transcriptomic analysis reveal the critical signatures involved in nonhealing diabetic foot ulcers》： Continue reading →

九 02

单细胞水平看指定基因的表达量差异情况

Posted on 2024年9月2日 by ulwvfje

看到了一个简单的单细胞转录组数据挖掘文章：《Single-cell analysis revealed that MTIF2 could promote hepatocellular carcinoma progression through modulating the ROS pathway》，这个研究就是针对GSE242889数据集进行了一个简单的降维聚类分群，然后进行合理的单细胞亚群的生物学命名，如下所示： Continue reading →

九 02

单细胞水平的差异分析是不是就会合理的产出这样的火山图呢

Posted on 2024年9月2日 by ulwvfje

看到了一个新鲜出炉的单细胞数据挖掘文章，标题是：《Single-cell analysis of tumor microenvironment and cell adhesion reveals that interleukin-1 beta promotes cancer cell proliferation in breast cancer》，研究者重新处理了GSE176078这个数据集，里面是26个乳腺癌患者的单细胞表达量矩阵 (five HER2+, 12 ER+/PR+, and nine TNBC samples) 。
很简单的降维聚类分群后，可以看到是如下所示是的主要单细胞亚群： Continue reading →

九 02

单细胞GSVA分析专用R包

Posted on 2024年9月2日 by ulwvfje

单细胞转录组数据分析最基础的就是给每个细胞一个身份，通常是降维聚类分群后然后对每个亚群进行描述，首先可以描述每个亚群的高表达量的特异性基因，然后可以对基因进行生物学功能数据库注释。也可以直接对亚群进行打分，比如gsea和gsva算法，针对免疫或者代谢等基因集进行打分，也是拿到每个亚群的特异性生物学功能。 Continue reading →

九 02

从msigdb下载的hallmark基因集里面的基因数量上限是200？？

Posted on 2024年9月2日 by ulwvfje

最近有小伙伴反馈在做题的时候出现了一个百思不得其解的bug，是不同数据库的hallmark基因集的冲突，蛮适合我们的人工智能大模型答疑的专辑，所以我也视频演练了一下； Continue reading →

九 02

拆分你的百万级别单细胞数据集后做降维聚类分群

Posted on 2024年9月2日 by ulwvfje

有粉丝在交流群提问说看到了2022的一个泛癌文章但是数据量有点大以至于他自己的个人电脑或者课题组服务器都没办法hold住，标题是：《Pan-cancer single-cell analysis reveals the heterogeneity and plasticity of cancer- associated fibroblasts in the tumor microenvironment》，这个泛癌单细胞数据挖掘文章纳入了很多不同癌症的单细胞转录组数据集做了一个汇总的降维聚类分群，如下所示： Continue reading →

九 02

差异分析的时候到底是p值重要还是变化倍数重要？

Posted on 2024年9月2日 by ulwvfje

我们的生物信息学在线互动授课的案例数据集一般来说是癌症等疾病相关的，肿瘤组织和正常对照的差异是很明显的。所以，标准的代码，标准的阈值绰绰有余的，可以拿到合理的差异分析结果。目前简单的差异分析流程，基本上转录组测序技术和芯片技术拿到的表达量矩阵后续分析大同小异，公众号推文在： Continue reading →

九 02

差异分析的火山图为什么不喷发呢

Posted on 2024年9月2日 by ulwvfje

2024的一个单细胞数据挖掘文章：《Integration of single‐cell sequencing and bulk RNA‐seq to identify and develop a prognostic signature related to colorectal cancer stem cells》，链接是：https://www.ncbi.nlm.nih.gov/pmc/articles/PMC11133358/ ，研究者们重新分析了2011的一个表达量芯片数据集（GSE33113），然后给出来了主要的差异分析结果，火山图就很奇怪： Continue reading →

九 02

不装了，摊牌了，转录组测序表达量矩阵就这么简单！

Posted on 2024年9月2日 by ulwvfje

前面我在笔记：作者仅提供了fpkm格式表达量矩阵的转录组测序数据集该如何重新分析呢提到了一个小技巧，是可以通过下面的r代码读取geo数据库里面的转录组测序表达量矩阵，这个矩阵来自于geo官方的转录组定量流程，如下所示的r代码： Continue reading →

九 02

不要总盯着上皮细胞看拷贝数变异啦

Posted on 2024年9月2日 by ulwvfje

大多数情况下，癌症组织里面的恶性细胞都是上皮细胞，比如：

肝细胞癌（Hepatocellular Carcinoma, HCC）：虽然大多数肝癌是肝细胞的恶性肿瘤，但它们也属于上皮细胞癌的一种，因为肝细胞是上皮细胞的一种。 Continue reading →

九 02

不同泛癌研究的髓系免疫细胞一致性如何

Posted on 2024年9月2日 by ulwvfje

整理多个癌症的多个单细胞转录组数据集，就是泛癌研究。聚焦到某个单细胞亚群，这样的汇总的文章北京大学张泽民课题组发了很多cns文章，包括髓系免疫细胞，t细胞以及nk细胞； Continue reading →

九 02

不同泛癌研究的内皮细胞一致性如何

Posted on 2024年9月2日 by ulwvfje

通常我们拿到了肿瘤相关的单细胞转录组的表达量矩阵后的第一层次降维聚类分群通常是：

immune (CD45+,PTPRC),
epithelial/cancer (EpCAM+,EPCAM),
stromal (CD10+,MME,fibro or CD31+,PECAM1,endo) Continue reading →

九 02

并不是得到文献那样的分群才是正确的单细胞分析

Posted on 2024年9月2日 by ulwvfje

我发现初学者在入门单细胞转录组数据分析的时候会有很多“细枝末节”的过度纠结，比如过分的追求得到文献那样的分群。

学员给我反馈了一个2018的人类肝脏单细胞图谱研究：《Single cell RNA sequencing of human liver reveals distinct intrahepatic macrophage populations》，如下所示的单细胞转录组降维聚类分群图谱可以看到仅仅是肝细胞就可以分成6个群： Continue reading →

九 02

百万级别数量的单细胞数据在r里面如何更快处理呢

Posted on 2024年9月2日 by ulwvfje

前些天在朋友圈看到了小伙伴分享了张泽民老师的一个最新单细胞文章：《Spatiotemporal single-cell analysis decodes cellular dynamics underlying different responses to immunotherapy in colorectal cancer》，数据集是GSE236581，是 primary tumor tissues, adjacent normal tissues, and peripheral blood of 22 CRC patients underwent neoadjuvant anti-PD-1 treatment. 总计 169 single-cell samples ，数据量确实是非常可观。

小伙伴表示如果是在r编程语言里面处理它，仅仅是读取就耗费25分钟啦。我们可以在其GEO界面（https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE236581）看到研究者们公开的，如下所示的文件： Continue reading →

九 02

癌症转移到肝脏后是肝细胞还是胆管上皮细胞会恶化呢

Posted on 2024年9月2日 by ulwvfje

我们首先让人工智能代码帮忙整理一下肝脏器官原发性癌症的背景知识：
肝细胞癌（HCC）和胆管上皮细胞癌（ICC）虽然都被称为肝癌，而且是原发性的肝癌。它们在发病原因、症状、治疗方法以及病理特征上存在明显的区别。最起码肝细胞癌（HCC）应该是肝细胞的恶化，而胆管上皮细胞癌（ICC）是上皮细胞的恶化。因为肝脏是一个复杂的器官，由多种细胞类型组成，主要包括肝细胞和胆管上皮细胞（也称为胆管细胞）。 Continue reading →

Page 4 of 92‹ Previous 1 2 345 6 7 Next ›Last »

生信菜鸟团

欢迎去论坛biotrainee.com留言参与讨论，或者关注同名微信公众号biotrainee

Category Archives: 未分类

蛋白质组学上游数据处理知多少

单细胞转录组可以这样简单计算相关性吗

单细胞转录组差异分析的8大痛点

单细胞亚群合理命名是数据分析基石啊

单细胞亚群该细分到什么程度呢

单细胞亚群的命名的细致程度需要有一个度

单细胞水平看指定基因的表达量差异情况

单细胞水平的差异分析是不是就会合理的产出这样的火山图呢

单细胞GSVA分析专用R包

从msigdb下载的hallmark基因集里面的基因数量上限是200？？

拆分你的百万级别单细胞数据集后做降维聚类分群

差异分析的时候到底是p值重要还是变化倍数重要？

差异分析的火山图为什么不喷发呢

不装了，摊牌了，转录组测序表达量矩阵就这么简单！

不要总盯着上皮细胞看拷贝数变异啦

不同泛癌研究的髓系免疫细胞一致性如何

不同泛癌研究的内皮细胞一致性如何

并不是得到文献那样的分群才是正确的单细胞分析

百万级别数量的单细胞数据在r里面如何更快处理呢

癌症转移到肝脏后是肝细胞还是胆管上皮细胞会恶化呢

2026年7月
一	二	三	四	五	六	日
« 九
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31