四 03

表型性状特异性单细胞亚群

Posted on 2024年4月3日 by ulwvfje

看到了2022的一个单细胞文章：《Single-Cell RNA Sequencing Reveals the Temporal Diversity and Dynamics of Cardiac Immunity after Myocardial Infarction》，里面有表型性状特异性单细胞亚群的概念，详见：Characterization of MI Contribution in Different Macrophage Subsets，需要同时考虑伴随表型变化的单细胞亚群数量以及表达量差异，看起来是蛮复杂的数学公式，如下所示： Continue reading →

四 03

表达量是否有差异你说了算

Posted on 2024年4月3日 by ulwvfje

有小伙伴在交流群问：自己的目标基因在做完表达量差异分析后发现它并不在上下调列表里面，感觉有点惶恐，如果是真实现象，那么： Continue reading →

四 03

癌症细胞系模型里面有肿瘤免疫微环境吗

Posted on 2024年4月3日 by ulwvfje

众所周知，实验室培养的癌症细胞系肯定是非常纯粹的恶性增殖的肿瘤细胞啦。

它被人诟病的一个缺点就是没办法代表真实的肿瘤病人的肿瘤部位的微环境，既然它缺失了肿瘤微环境，如果你测肿瘤细胞系培养物（药物处理前后）的单细胞转录组，就没办法follow我们分享的绝大部分的肿瘤领域的单细胞转录组的第一层次降维聚类分群以及生物学命名，详见之前的介绍 CNS图表复现08—肿瘤单细胞数据第一次分群通用规则，是： Continue reading →

四 03

R语言里面如何高效开发R包

Posted on 2024年4月3日 by ulwvfje

出版社送了一本书（R语言）给我，这个《R语言实战》已经是R语言领域的“老兵”了，几乎是人手一本，目前是第三版，更新也很大，全面拥抱了ggplot体系。对我来说，比较新的知识点可能是一些小技巧，这里借花献佛给大家。 Continue reading →

四 03

R语言里面如何高效调试代码

Posted on 2024年4月3日 by ulwvfje

出版社送了一本书（R语言）给我，就是这个《R语言实战》第三版，它已经是R语言领域的“老兵”了，几乎是人手一本。

新鲜出炉的第三版，更新也很大，全面拥抱了ggplot体系。对我来说，比较新的知识点可能是一些小技巧，这里借花献佛给大家。 Continue reading →

四 03

R语言里面如何高效编程

Posted on 2024年4月3日 by ulwvfje

出版社送了一本书（R语言）给我，就是这个《R语言实战》第三版，它已经是R语言领域的“老兵”了，几乎是人手一本。

新鲜出炉的第三版，更新也很大，全面拥抱了ggplot体系。对我来说，比较新的知识点可能是一些小技巧，这里借花献佛给大家。 Continue reading →

四 03

R语言里面的文本文件操作技巧合辑

Posted on 2024年4月3日 by ulwvfje

偏底层的函数

常规需求是文本文件交互，比如文件打开、文件写入、文件内容刷新等等，如果默认的文件没有规则仅仅是里面有内容，就需要使用比较底层的函数：

打开文件：你可以使用file()函数来打开一个文件。这个函数会返回一个连接，你可以通过这个连接来读取或写入文件。例如： Continue reading →

四 03

R语言基础函数没有排序后取前面几个的功能函数top

Posted on 2024年4月3日 by ulwvfje

R语言基础函数很多都是超级简单的英文单词，以下是一些R语言中基础函数的简单英文单词举例：

print()：打印输出结果。
sum()：计算向量或矩阵中元素的总和。
mean()：计算向量或矩阵中元素的平均值。
max()：找出向量或矩阵中的最大值。
min()：找出向量或矩阵中的最小值。
length()：计算向量中元素的个数。
sqrt()：计算数值的平方根。
round()：将数值四舍五入到指定的小数位数。
sort()：对向量或矩阵进行排序。
unique()：返回向量中的唯一元素。 Continue reading →

四 03

PRJNA815461

Posted on 2024年4月3日 by ulwvfje

学员给了一个2023的单细胞文章：《Single-cell RNA sequencing reveals a mechanism underlying the susceptibility of the left atrial appendage to intracardiac thrombogenesis during atrial fibrillation》里面的单细胞转录组数据集仅仅是公开了数据集的fastq文件，并没有表达量矩阵。我们就顺手下载并且处理了。

首先需要参考小鼠的5个样品的10x技术单细胞转录组上游定量（文末赠送全套代码），走cellranger流程，主要是拿到服务器后配置自己的conda环境，以及下载项目对应的单细胞转录组数据集的fastq文件，如下所示： Continue reading →

四 03

NIH的癌症中心每周常规生信培训

Posted on 2024年4月3日 by ulwvfje

无意中看到了这个宝藏资源：https://bioinformatics.ccr.cancer.gov/btep/，是NIH的癌症中心每周常规生信培训，值得推荐：

每次培训都有全部的授课资源整理并且网络公开分享，比如：https://btep.ccr.cancer.gov/docs/data-visualization-with-r

四 03

GEO数据库的每个GPL平台对应的详细信息获取txt文本文件

Posted on 2024年4月3日 by ulwvfje

一般来说，GEO数据库的每个GPL平台都有对应的网页，而且可以获取其详细信息的txt文本文件，比如：https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GPL6244

就是如下所示： Continue reading →

四 03

ebi旗下的ArrayExpress数据库的E-MTAB-11450

Posted on 2024年4月3日 by ulwvfje

做生物信息学的我们经常会接触到生物信息学相关数据库等网络资源，绕不开的就是EBI和NCBI，我们以前介绍的单细胞转录组项目数据通常是ncbi旗下的sra或者geo数据库，但实际上ebi旗下的ArrayExpress数据库的也是有部分单细胞数据资源。

EBI (European Bioinformatics Institute) 和 NCBI (National Center for Biotechnology Information) 都是全球领先的生物信息学研究机构，它们提供了大量的生物信息学数据库和工具，对全球的科研工作者开放。 Continue reading →

四 03

chatGPT在生物信息学的应用讨论组

Posted on 2024年4月3日 by ulwvfje

一大早就看到了两个chatGPT在生物信息学的应用，感觉有必要参与到其中了。如果大家看完后也有同感，可以一起加入讨论组哈，群策群力，看看如何更好的向chatGPT提问，如何更好的使用这个AI助手，在我们的生物信息学数据处理过程中。 Continue reading →

三 28

chatGPT写了个计算蛋白质序列的分子量的函数

Posted on 2024年3月28日 by ulwvfje

我首先让chatGPT帮我根据fasta格式的蛋白质序列文件，使用Python语言计算里面的每个蛋白质的序列长度和分子量，它给了描述了解题思路。。。

解题思路

看起来蛮厉害的，我怀疑它可能是对我的真正的需求不够了解，我其实就是想让他帮忙写代码，就继续追问它： Continue reading →

三 28

chatGPT教你做孟德尔随机化

Posted on 2024年3月28日 by ulwvfje

如果你去openAI问chatGPT关于孟德尔随机化的流程，它是这样的回答：

是的，我可以为您提供一个孟德尔随机化的流程介绍。

孟德尔随机化是一种常见的生物信息学算法，用于评估基因对生物学过程的影响。该算法通过模拟随机基因重排来评估基因组和外显子组的对生物学目标的影响。

以下是孟德尔随机化的流程： Continue reading →

三 28

CD4和CD8的T细胞在单细胞转录组水平本来就很难确定亚群和名字

Posted on 2024年3月28日 by ulwvfje

隔三差五就有小伙伴在交流群里面问到他自己在进行CD4和CD8的T细胞细分亚群的时候非常纠结，根本就没办法确定下来到底应该是分多少群以及到底是应该按照什么顺序分。其实很正常，之前我们组建了CD4和CD8的T细胞的交流群就探讨失败，虽然说CD8 T和CD4 T细胞亚群是一种分类方法，但是各自内部又是可以按照功能进行划分，naive, memory ，effector，cytotoxic，Exhaustion。 Continue reading →

三 26

真的是所有的基因都可以随心所欲的差异吗

Posted on 2024年3月26日 by ulwvfje

最近在交流群看到了一个很有意思的讨论，就是他看到了他们领域的癌症高分文献，发现里面的差异分析结果跟之前的另外一个高分文献里面的基因很不一样，就以为我们生物信息学是万能魔法，可以让任意基因都有差异：
Continue reading →

三 26

张泽民课题组的泛癌层面NK单细胞水平分群及其标记基因能带动一波数据挖掘文章吗

Posted on 2024年3月26日 by ulwvfje

这两天看到了各种交流群以及朋友圈小伙伴都在转发和祝贺张泽民课题组的泛癌层面NK单细胞数据挖掘文章，我简单看了看，类似的策略的数据挖掘居然一直可以发CNS级别杂志，让人膜拜：

2021年2月发表在CELL的《A pan-cancer single-cell transcriptional atlas of tumor infiltrating myeloid cells》
2021年12月发表在science的《Pan-cancer single cell landscape of tumor-infiltrating T cells》
2023年9月发表在CELL的《A pan-cancer single-cell panorama of human natural killer cells》 Continue reading →

三 26

怎么可能有如此重要的基因在泛癌层面出现缺失呢

Posted on 2024年3月26日 by ulwvfje

众所周知，单个单细胞的转录组，如果是目前流行的10x这样的单细胞转录组技术，具体到每个细胞层面我们拿到的表达量信息通常是500到2000个基因的范围，也就是说如果我们的参考基因组注释文件里面是2万或者6万基因会出现起码90%的基因是缺失的，这个现象在单细胞转录组领域称作是drop-out (大家可以自行统计一下pbmc3k这个示例数据的drop-out情况 ) Continue reading →

三 26

院士团队的WGCNA挖掘文章修改成为癌症转移与否关键模块

Posted on 2024年3月26日 by ulwvfje

基本上每年我们都会在生信技能树等公众号写多个教程分享WGCNA的实战细节，比如： Continue reading →

Page 1 of 8312 3 4 Next ›Last »

生信菜鸟团

欢迎去论坛biotrainee.com留言参与讨论，或者关注同名微信公众号biotrainee

Category Archives: 未分类

表型性状特异性单细胞亚群

表达量是否有差异你说了算

癌症细胞系模型里面有肿瘤免疫微环境吗

R语言里面如何高效开发R包

R语言里面如何高效调试代码

R语言里面如何高效编程

R语言里面的文本文件操作技巧合辑

偏底层的函数

R语言基础函数没有排序后取前面几个的功能函数top

PRJNA815461

NIH的癌症中心每周常规生信培训

GEO数据库的每个GPL平台对应的详细信息获取txt文本文件

ebi旗下的ArrayExpress数据库的E-MTAB-11450

chatGPT在生物信息学的应用讨论组

chatGPT写了个计算蛋白质序列的分子量的函数

chatGPT教你做孟德尔随机化

CD4和CD8的T细胞在单细胞转录组水平本来就很难确定亚群和名字

真的是所有的基因都可以随心所欲的差异吗

张泽民课题组的泛癌层面NK单细胞水平分群及其标记基因能带动一波数据挖掘文章吗

怎么可能有如此重要的基因在泛癌层面出现缺失呢

院士团队的WGCNA挖掘文章修改成为癌症转移与否关键模块

2024年4月
一	二	三	四	五	六	日
« 三
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30