当前位置: 首页 > news >正文

甲基化组学全流程分析(适用于27k的甲基化数据)

甲基化组学全流程分析(适用于27k的甲基化数据)

前面我已经讲过450k和870k EPIC的甲基化芯片的全流程分析教程,分析功能更为完善和强大,今天讲讲甲基化位点探针较少的27k甲基化芯片的分析流程。

我开发了一款本地电脑无限使用的零代码生信数据分析作软图神器电脑软件OmicsTools,欢迎大家使用OmicsTools进行生物医学科研数据分析和作图,该软件件能让大家在不需要任何编程和代码编写的基础上,分析次数没有限制,可以无限使用,让您在自己的电脑上快速进行大量的生信分析和加速大家的科学研究。
我开发的本地电脑OmicsTools 软件在github上的zihaoxingstudy1/OmicsTools仓库中,大家可以下载安装OmicsTools进行各种生信分析和可视化作图。

ad90395cfad588b7f02b84e560c35bfb.jpeg


具体的分析流程

分析步骤简介

  1. 第一步把甲基化的表达矩阵提取出来
  2. 第二步拿到甲基化的表达矩阵后,不用再做其它的处理,直接用Limma做差异分析就行了。
  3. 第三步是甲基化探针注释出基因名称,并跟甲基化差异分析结果文件合并
  4. 第四步做火山图热图,箱式图这些
  5. 第五步,go,kegg,gsea通路富集分析等。

我开发了一款本地电脑无限使用的零代码生信数据分析作软图神器电脑软件OmicsTools,欢迎大家使用OmicsTools进行生物医学科研数据分析和作图,该软件件能让大家在不需要任何编程和代码编写的基础上,分析次数没有限制,可以无限使用,让您在自己的电脑上快速进行大量的生信分析和加速大家的科学研究。

我开发的本地电脑OmicsTools 软件在github上的zihaoxingstudy1/OmicsTools仓库中,大家可以下载安装OmicsTools进行各种生信分析和可视化作图。

GEO甲基化27k芯片数据下载教程

1.1根据GEO的GSE数据集编号自动下载和处理GEO数据教程(必须要运行的模块,GEO数据下载要首先运行这个模块)

309b28f027fe16f333966f7b9ba7291c.jpeg

详细教程地址: https://zhuanlan.zhihu.com/p/708053447

下载GEO数据一定要先运行下这个模块,部分数据集不一定能下载提取出表达矩阵,但是一般能下载到非常完整的样本的注释信息等数据文件,这在对GEO数据集临床信息分析或分组差异分析是非常重要的,当然如果少数GSE数据集遇到没有提取出GSEXXX_sample_info.csv的情况,也可以看看我b站的教学视频,根据GEO网页中的样本编号的分组情况,自建一个这样的分组文件,分组文件一般是长这个样子的,有两列,一列列名叫sample.id,是GSM编号信息,另一列是group.level,存放的是分组信息,当然sample.id这一列的样本名还是要以表达矩阵的样本名为准,这样才能让表达矩阵后面跟样本分组信息按照相同的列名整合在一起:

5283ecc207e78637912a7324accae2e5.jpeg

对于部分没有下载出表达矩阵的数据集,如果该数据集的GEO网页中有GSEXXX_RAW.tar格式的压缩包,可以运行下面的1.2这一步对RAW.tar的压缩包文件进行提取和处理。

1.2 甲基化芯片GSE数据集RAW.tar压缩包下载和多样本整合处理教程 (GEO网页中有RAW.tar压缩包可以用这一步下载处理)

bf256c1bfdaa54f917a2e04b7a42f892.jpeg

教程地址

教程地址:转录组和基因芯片GSE数据集RAW.tar压缩包下载和多样本整合处理教程 - 邢博士谈科教的文章 : https://zhuanlan.zhihu.com/p/708244032

7d139d4c3b2da9f7c8ae9ac40a7ae087.jpeg

b3927f6825eff07f3a5c4271bff50c1e.jpeg

1.3 GEO网页中存在可以手动下载的表达矩阵等文件的下载处理教程

如果在1.1步没有自动下载提取出基因表达矩阵,GEO网页中也没有GSEXXX_RAW.tar压缩包文件,但是存在可以手动下载的一些表达矩阵等数据文件,可以用这一步进行下载和处理。

2d6307a3c612d2e5d3c936da6ff27157.jpeg

9358de0d7a206fe14e8f86dedc69aca9.jpeg

教程视频: https://www.bilibili.com/video/BV1Yf421X7Cj/

下载到的甲基化beta矩阵用limma做差异分析

这个分析很简单,刚开始就两步,第一步把甲基化的表达矩阵提取出来,第二步拿到甲基化的表达矩阵后,不用再做其它的处理,直接用Limma做差异分析就行了。

提取得到的甲基化beta矩阵示意图

95ac65127d38b5b6dba1a20229c6f081.jpeg

甲基化beta就是在0-1之间,0是该位点没有发生甲基化,1是该位点完全甲基化了

使用limma甲基化矩阵做差异分析

49cffb062ab1e6fbde85e33acaacf919.jpeg

b9e1b4f8bcac228bb56ffa4d04ca9d57.jpeg

limma差异分析结果

a06d7f4a0b9e75dc48de7f89ce1a12fc.jpeg

这里limma差异分析结果的gene列是甲基化探针位点,不是甲基化基因名称,需要跟甲基化探针跟基因的注释关系文件进行合并

甲基化探针注释出基因名称,并跟甲基化差异分析结果文件合并

因为每个基因含有多个甲基化位点,所以差异分析结果必须同时保留甲基化位点列和基因名称列,不能把甲基化位点列删掉,同时尽量也包含的有甲基化位点在基因组染色体的起始位置,终止位置,染色体编号,甲基化位点的注释区域等信息,这些都可以从甲基化探针对应的注释文件中获取。

3.1 获取甲基化探针的注释文件(以GEO数据集为例)

GEO的数据集的探针注释信息一般都是存放在GPL平台网页的注释文件中。

进入到GPL平台页面后,下拉到页面末尾,如果有Download full table ,就把这个注释table下载一下

下载得到甲基化探针对应的注释信息

e5103e2e5281bdc8829224657baffa74.jpeg

0499a22acea512c1a9e3b16b483e7c7f.jpeg

3.2把甲基化探针注释文件跟差异分析结果文件合并

d36621e2b3e596340b39dd0f5b328069.jpeg

9d4de7e7ec57e870a355f897aff3a6c7.jpeg

4b11a11a815e393cda6f1e447f46d721.jpeg

根据甲基化的差异分析结果绘制火山图

9a6d21339853fa0d16194e9c51ebf15e.jpeg

eafadad9d77475d02f7e4f73d212ef69.jpeg

将甲基化的差异分析结果跟转录组差异分析的结果取交集

因为甲基化的foldchange都比较小,因此甲基化的logFC的阈值过滤是跟转录组差异分析的阈值过滤是不一样的,有两种方法可以让两个差异分析的结果取交集。具体方法如下:

  1. 甲基化位点的差异分析结果先进行过滤筛选,用过滤后的甲基化差异分析结果跟转录组的差异分析结果取交集并绘制韦恩图。
  2. 我后面会更新多个文件取交集绘制韦恩图的模块,新的模块在合并多个差异分析结果文件取交集时候,可以支持对每个差异分析结果文件指定特定的logFC值和p值。
5.1 先对甲基化位点的差异分析文件进行过滤,再跟转录组的差异分析结果进行合并
5.1.1 先对甲基化位点的差异分析文件进行过滤筛选

77a9246e8659eb9aeae1bcc85886468e.jpeg

5.1.2 将筛选好的甲基化位点的差异结果跟转录组的差异结果进行合并

9389359e36665d2b79185b13f5571770.jpeg

a1793fb034409f7f620919d074f95722.jpeg

abd42396ef59773603ffd178bf145179.jpeg

005654572edcfd57ff8e45034f0a83e9.jpeg

甲基化的差异基因跟转录组的差异基因的交集基因的通路富集分析

96e3f2be7edb65b2ed39ea96b490f3ea.jpeg

cffdc9d0b0eb0a9d5e0346d792928e0d.jpeg

go通路富集分析结果

ddf69b2894b3547f5fbab7f66fc39b6b.jpeg

kegg通路富集结果

51b54281cf8468fbed56ed25053de901.jpeg


http://www.mrgr.cn/news/31236.html

相关文章:

  • 基于SpringBoot+Vue的校园失物招领系统
  • STL 源码剖析 | 第1章:概论
  • git merge如何忽略部分路径
  • 【数据结构与算法 | 灵神题单 | 二叉搜索树篇】力扣99, 1305, 230, 897
  • 模板字符串中定义方法并传参
  • SpringBoot 项目如何使用 pageHelper 做分页处理 (含两种依赖方式)
  • 如何理解变量提升和函数提升
  • Lichee NanoKVM基本使用环境
  • 【AI写作】介绍 Docker 的基本概念和优势,以及在应用程序开发中的实际应用
  • OpenAI o1解决了Quiet-STaR的挑战吗?(下)
  • Java 并发编程 —— AQS 抽象队列同步器
  • 信奥初赛解析:1-3-计算机软件系统
  • ARM/Linux嵌入式面经(三七):CVTE
  • LTE和NR空口技术区别
  • Redis基本命令详解
  • 二、pandas入门
  • arkts基础知识
  • 实例代码逐行解读
  • Git常用指令
  • 想要监控电脑?这十款电脑监控软件推荐!