DiCoExpress提供从质量控制到共表达的完整主动脉分析。它根据广义线性模型内的对比度执行差分分析。此外,它还可以对差异表达基因列表和共表达基因簇进行富集分析。
DiCoExpress的主要优点是它可以被像我这样的人使用,而无需任何统计或空中编程方面的特定知识。它真正帮助非专业用户编写差异基因表达分析所需的对比度。它还提供图形输出,说明准备发布的结果。
DiCoExpress不是一个计划专用工具。它可以用于任何生物体,只要实验设计完成最多两个生物因子。此外,膜的设计在条件之间重复次数不相等也是可能的。
初学者应该对 R 有初步了解,你应该知道如何使用函数并确定必需参数和可选参数。然后,关键步骤是正确提供包含 和 实验设计的文件。若要开始,请打开 R 工作室会话。
将目录设置为模板脚本,然后打开 DiCoExpress 教程点 R 脚本。在 R 会话中加载 DiCoExpress 函数。然后在 R 会话中加载数据文件,并将对象数据文件拆分为多个对象,以便轻松操作文件。
接下来,在NB条件或NB重复中选择一个策略和一个阈值来过滤低表达基因。指定组颜色并选择规范化方法。然后执行质量控制。
如果数据根据复制因子状态配对,则复制为真,否则状态为假。将相互作用指定为真,以考虑两个生物因素之间的相互作用。否则分配 false,然后指定统计模型并定义错误发现率的阈值。
执行差异分析,然后确定富集分析的阈值,并对差异表达的基因列表进行富集分析。选择要比较的 DEG 列表。为列表比较提供名称,并对保存输出文件的目录使用相同的名称。
将参数操作设置为并集或交集,以指定要在 DEG 列表上执行的操作,并比较列表。进行共表达分析,然后对共表达簇进行富集分析。最后,生成两个日志文件,其中包含重现分析所需的所有信息。
在比较条件内和条件间时,每个样本的总归一化计数应相似。归一化基因表达计数在条件内和条件间均表现出相似的中位数和方差。为了识别潜在的底层数据结构,生成了PCA图。
观察到处理之间的明显区别,并且没有聚类,表明数据集质量良好。绘制原始 pvalue 直方图以评估建模的质量。原始 p 值的分布是均匀的,正如预期的那样,峰值位于分布的左侧。
右端没有峰表明统计建模似乎是正确的。绘制基因CIG62301.1在每种基因型和条件下的表达谱。以及上下差异表达基因的数量,还绘制了每个测试对比。
共表达分析是在五个DEG列表的并集上进行的。通过对比确定,寻找基因型一或二与其他基因型之间的治疗反应差异。将每个已鉴定的簇的共表达基因打印在单独的文本文件中,并绘制基因的表达谱。
使用DiCoExpress,生物学家将获得统计上合理的基因表达分析。下一步是从这些结果中产生生物学意义。