(图片来源网络,侵删)
GGE 双标图可以理解为在主成分分析时, 分解的是G+GbyE,然后根据PC1和PC2作双标图,称为GGE Biplot双标图经常用于农作物多点试验的数据分析,今天小编给大家介绍怎么用GenStat实现GGE双标图双标图应用领域l 品种——环境两向表l 做基因表达数据l QTL效应——环境两向表l 品种——性状两向表l 双列杂交两向表l 寄主——病原物两向表l 基因型——遗传标记数据l 环境条件——作物性状两向表l 试验地点——气候土壤因素两向表数据来源论文中的原始数据,来源于1993年安大略冬小麦区试试验的数据,18个小麦品种在9个环境中的产量表现第一列是18个小麦品种,第一行是9个不同的环境有四个双标图类型,下面讲解怎么通过GenStat来达到相同的效果?1、Which-Won-Where View/哪个品种哪个环境中是最好的2、Environmental VectorView/环境之间的关系3、DiscriminatingAbility VS Representativeness View/区分力和代表性4、Mean vs StabilityView/高产性和稳产性它可以解决品种生态区划分、品种评价和试验点评价这三大问题GenStat具体实现如下:首先对数据进行整理,数据分为三列内容:品种名、环境和产量三部分内容1、Which-Won-Where View/哪个品种哪个环境中是最好的对应GenStat模型:作图结果如下:结果解读:这张图主要是按照品种与环境的互作来说明各地点产量最高的品种1、 把各个方向上距离最远的点用直线连接起来,比如G8~G18~G7~G12~G13构成了一个五边形,通过中心对五条边做五条垂线,将双标图分为五个扇区,品种在五个扇区都有分布,品种分为两个扇区,E5和E7为一组,其它为一组2、 这张图可以得出:位于五边形顶角的品种是扇区内个环境下产量最高的品种,比如G18在环境E5和E7产量最高,品种G8在另外7个试验点产量最高2、Environmental Vector View/环境之间的关系对应GenStat模型如下:将产量(value)导入到Y-variate框中,将品种(cul)导入到Genotype框里面,将环境(env)导入到Environments框里面,在Options里面勾选Connect environment scores with origin作图如下:结果解读:1、 本图主要是分析各试验点之间在品种评价上的相似性从中心到各个环境做一条线段,线段间的夹角和线段本身的长度都有一定的代表意义2、 两环境线段之间的夹角的余弦值是它们的相关系数,夹角小于90度表示正相关,说明两环境对品种排序相似,大于90度表示负相关,表示两环境对品种排序相反,等于90度说明两环境不相关夹角较小说明试验点是重复设置的,去掉一个不影响对品种的评价3、 环境线段的长度是试验点对品种的区分能力,线段越长,区分能力越强4、 本图可以知道环境E1、E2、E3和E4存在正相关E5和E7比其它点有较强的品种区分能力3、Discriminating Ability VS Representativeness View/区分力和代表性对应GenStat模型:作图结果如下:本图一个显著的特征是它增加了两条直线,其中带箭头的直线为平均环境轴(Average Environment Axis),通过平均环境(箭头前面的圆圈)和中心点的连线结果解读:1、 试验点线段和平均环境轴的角度是其对目标环境的代表性的度量,角度越小,代表性越强如果一个试验点和平均环境轴夹角为钝角,则它不适合作为试验点2、 平均环境轴上箭头所指的方向是对试验点区分力和代表性两方面的评价3、 就区分力来说,E5和E7(线段最长)最好,就代表性而言,E1、E2、E3、E4最好(与平均轴夹角最小)4、 没有区分能力的试验点是无用的5、 有区分力但没有代表性的试验点可以淘汰不稳定的品种,但不能用于优良品种的选择6、 只有既有区分力又有代表性的试验点才能最好的选择高产稳产的品种因此这张图是对试验点的一个综合评价4、Mean vs Stability View/即高产性和稳产性对应GenStat模型:作图结果如下:结果解读:1、 高产稳产功能图也需要环境平均轴(带箭头的直线),和平均环境值(直线上圆圈表示)还有一条通过中心与环境平均轴垂直的直线将品种点和平均环境轴做一条垂线2、 环境平均轴所指的方向是品种在所有环境下的近似平均产量的走向可知G8平均产量株高,后面依次是G4、G10、G18,产量最低的是G12,后面依次是G14、G7、G13品种G17的平均产量接近试验总平均3、 通过中心(原点)与平均轴垂直的线代表各品种与各环境相互作用的倾向性品种与平均环境轴之间的垂线越长,表示品种越不稳定可知G13(线段最长)最不稳定,其次是G8、G17、G7比较稳产的是G12、G15、G16、G6、G4(与平均环境轴的垂线较短)4、 综合品种产量和稳定的指标,可以看出G4是一个比较高产稳产的品种,G8也高产,但是不稳产虽然G12很稳产(它几乎就在平均环境轴上面),但是产量最低GGE双标图存在的问题及其解决方法:双标图GGE是基于传统的固定效应模型,它有一些假定和局限性:1、它要求数据平衡,即不能存在缺失值2、它要求各试验点各区组内条件完全一致在区组较大时(如大于10个区组),假定很难实现3、固定效应模型假定各试验环境的误差同质解决方法:1、用混合线性模型或析因设计(FA),将品种当成随机效应,可以解决以上问题2、先用随机效应模型估计出各品种在各环境下的无偏估计值(BLUP),将BLUP值代替各环境品种的平均值作为基本数据进行GGE分析GenStat软件中GGE的优势:1、GenStat基于REML的混合线性模型可以将品种当成随机效应2、GenStat可以计算品种的BLUP值和BLUE值GenStat其它类型的GGE图:以上内容是关于如何使用Genstat 实现GGE双标图,你学会了么?
0 评论