GO、KEGG富集分析(一)有参情况
1、GO富集分析 加载了注释库之后,读取基因列表文件,并使用clusterProfiler的内部函数enrichGO()即可完成GO富集分析。读取基因列表文件,并使用clusterProfiler的内部函数enrichKEGG()即可完成KEGG富集分析。
2、KEGG指的是京都基因与基因组百科全书,通常我们使用KEGG中的pathway模块,将基因映射到某些通路上,了解基因参与生物体中的代谢过程等。
3、Gokegg富集分析是一种生物信息学工具,用于分析一组基因在细胞、组织或生物体中是否具有共同的生物学功能或通路。它可以将不同基因集之间的差异性比较和功能注释结果整合起来,进而预测哪些生物学过程与不同基因集相关联。
4、单细胞富集分析我最常用的是 分组GSVA ,但最近用到了GO分析,就复习一下GO和KEGG富集分析及绘图。载入无比熟悉的pbmc.3k数据集 (已注释好,数据准备见 monocle )pbmc3k数据集只有1个样本,没办法区分HC和病例组。
什么是GO富集分析,常说的GO功能分析、功能分析、Pathway分析是什么意...
基因本体(gene ontology),简称GO,是一种描述基因或基因产物基本特性的词汇,由基因本体协会开发。
go富集分析是什么意思如下:富集分析(Enrichment Analysis) 是一种广泛应用于 生物信息学Q 研究的统计方法,主要用于检验一个基因***中某些功能或特征的富集程度。
GO term或Pathway 是否在实验结果的差异基因集中富集常使用的统计学检验基于超几何、卡方或二项式分布。基于基因组中基因注释到某个GO term的概率不变,查看差异基因集有多少基因可以注释到同一个GO term, 从而得到P值。
GO富集是组学数据分析常用的手段,通常用来挖掘差异基因中GO term的富集程度。Fishers exact test是常用的统计检验方法,但这种方法存在明显的缺点。
有一个大概的认识,就是,自己的基因集中某种功能基因的占比要高于这种功能的基因在所有基因中的占比。
详解GO的层级关系在富集分析中的应用
1、GO富集的根本问题在于一个基因对应的GO term有多个,一个term对应多个gene,同时还有层级关系。这样导致如果一个term显著富集,那和它共享很多基因的term也会显著富集。
2、分析对实验结果有提示的作用,通过差异基因的Pathway 分析,可以找到富集差异基因的Pathway 条目,寻找不同样品的差异基因可能和哪些细胞通路的改变有关。
3、在是否需要构建的问题上,我看到徐洲更在 功能注释后如何做富集分析 中提到 “你不需要构建Orgdb,因为Orgdb的用途是进行基因编号和GO/KEGG的转换。
4、GO富集分析原理: 有一个term注释了100个差异表达基因参与了哪个过程,注释完之后(模式生物都有现成的注释包,不用我们自己注释),计算相对于背景它是否显著集中在某条通路、某一个细胞学定位、某一种生物学功能。