评论

别人生信有发不完的文章,就是用对了这3大数据库

纵观目前 SCI 发表现状,生信分析依旧是热潮。如果你还在羡慕别人有写不完的课题思路,不如赶紧动身学学生信,从生信入手挑选合适的基因进行后续的实验研究为目前课题开展的不二选择。

而进行基因生信分析又与表达量离不开关系,那么笔者今天就给大家总结整理一下读博期间经常用到的一些数据库,帮助大家从 mRNA、蛋白质、免疫组化等不同层面开展基因表达分析 ~

一、 GEPIA

图片来源:网站截图

看过笔者之前推文的小伙伴们可能有些印象,笔者介绍过 GEPIA2.0 数据库,对于分析基因的表达量 GEPIA 就可很好满足我们的需求。

GEPIA 数据库为一个以 TCGA 数据为样本库进行在线生信分析的工具,突出特点为零代码操作,其功能主要分为 3 个模块。

  • 单基因分析「Single Gene Analysis」
  • 肿瘤类型分析「Cancer Type Analysis」
  • 多基因分析「Multiple Gene Analysis」

今天主要介绍一下单基因分析这个模块进行基因表达量分析的相应功能。

在首页输入基因名或基因 ID,即 Gene Symbol 或 Gene ID,以 ERB B2 为例,输入后点击右侧的 GoPIA!

图片来源:网站截图

我们可以看到左侧页面详细展示该基因 ID、基因描述、基因别名和基因功能的总结,让我们对该基因有初步的掌握;对于基因别名的问题,笔者想说有的时候换别名搜索文献,可能会让我们柳暗花明,所以记得通过不同基因名搜索来掌握该基因全面的信息。

接下来点击 Expression DIY,列出 Profile、Boxplot、Stage plot 和 Multiple gene comparison 四个选项,若我们想输出结果以箱氏图的方式呈现,则点击 Boxplot。

图片来源:网站截图

根据我们的实验需求设置 Log2FC 的 cutoff 值,默认为 1,即该基因在癌组织和正常组织中表达量的相对倍数,若 > 1,则说明癌组织中为相对高表达,若 < 1,则说明癌组织中为相对低表达。

因此,我们也可将 cutoff 值提高至 1.5 倍或 2 倍,则说明两者的表达差异更加显著。

P 值及图形颜色展示均可个性化选择设置;中间栏的 Datasets Selection 位置选择所研究的目标癌种;右侧可以选择用 TCGA 数据库中的正常样本作为参照或选择 GTEx 中的正常样本;点击 plot 生成 mRNA 表达水平的比较图。

图片来源:网站截图

如图所示展示 ERB B2 在 OV 中 426 例癌组织及 88 例正常组织样本表达量的比较,虽然在癌症组表达量明显升高,但是不存在统计学差异。

二、 UALCAN

图片来源:网站截图

该数据库主页的分析内容主要包括三大部分:

  • TCGA: 为基因 TCGA 数据库进行转录水平的分析,因此该功能和前面介绍的 GEPIA 是相同的
  • Protemics: 蛋白组学分析,不同基因在多种癌症中蛋白表达水平的分析
  • CBTN: 儿童脑肿瘤数据

为研究目的基因在蛋白水平的表达情况,我们首先点击上方的 Proteomics。

图片来源:网站截图

在下方的框内输入目的基因 ERB B2,注意此处也可输入多个基因名,在 CPTAC dataset 处选择我们所要研究的癌症类型,以 Breast cancer 乳腺癌为例;点击 Explore 进行后续分析。

图片来源:网站截图

点击 Total-Protein,即总蛋白含量进行分析;在下方的结果图中所展示的为 125 例乳腺癌原发肿瘤中蛋白表达含量少于 18 例正常对照组织,下方的 Statistical significance 则展示出统计分析后的 P 值,可见具有统计学差异。

在该界面左侧所展示的为不同的癌症类型,可再次点击不同癌症类型进行分析。

图片来源:网站截图

值得推荐的宝藏功能为上方的 Sample types 处,点开之后我会们发现还可根据分期、种族、年龄、病理类型甚至 Wnt 信号通路的激活状态进行比较,不得不说,数据库真是强大!

图片来源:网站截图

另一重要宝藏功能为下方的四个功能链接,研究基因蛋白发挥功能时通常需要比较该基因磷酸化等活化形式的蛋白质含量情况,别担心,下方的 Phospho Protein Exp 就能够完全解决我们的困惑 ~

图片来源:网站截图

上图所展示的为 ERB B2 在乳腺癌中磷酸化蛋白的表达含量比较,从下方的统计结果来看并不符合统计学差异。

三、 The Human Protein Atlas

分析基因表达量的情况,通常包括 RNA、蛋白质免疫组化三个层面,因此接下来笔者介绍一个在线查找基因免疫组织化学染色表达情况的数据库 ~

图片来源:网站截图

输入 ERB B2,点击 Search;从下图的分析结果中我们可以看到该数据库展示了在不同的组织、细胞系及单细胞测序水平的相关数据。

在这里我们首要介绍免疫组化相关结果的展示;首先点击上方的 Tissues。

图片来源:网站截图

随后选择我们想要分析的器官类型,以肝脏 liver 为例;点击下图中的 liver。

图片来源:网站截图

下图的结果详细展示了应用不同的抗体所染出的 ERB B2 在肝脏组织中的免疫组织化学染色结果图,可分别点开详细查看并下载。

图片来源:网站截图

病理状态下的免疫切片则点击上方的 Pathology, 随后点击左侧的 CANCER, 根据弹出的不同癌症类型选择我们所需要的病理切片。

图片来源:网站截图

关于基因表达量研究的相关数据库就分享到这啦,希望各位小伙伴们在艰苦的读博过程中可以找到指引自己前进的动力,祝愿各位早日发文,早日毕业!返回搜狐,查看更多

责任编辑:

平台声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
阅读 ()
大家都在看
推荐阅读