野次馬エンジニア道

野次馬な気持ちでプログラミングをあれこれと綴ります

分散分析 - 二元配置

前回の一元配置に続いて今日は二元配置

主効果と交互作用

多因子実験のときに、それぞれの因子による単独の効果(main effect)と組み合わせによる交互作用(interaction)を考慮する必要がある。

二元配置(two-way layout)

一元配置と同様に一般平均と効果と誤差に分解するが、

{a} 個の水準 {A_1,A_2,\cdots,A_a} 及び {b} 個の水準 {B_1,B_2,\cdots,B_b}{r} 回繰り返したときに、水準 {A_i} 水準 {B_j}{k} 番目の標本が {y_{ijk}} として得られたときに

{ \displaystyle
y_{ijk} = \mu_{ij} + \varepsilon_{ijk} = \mu + \alpha_i +\beta_j + (\alpha\beta)_{ij} +\varepsilon_{ijk}
}

{ \displaystyle
 i = 1,\cdots,a, \quad j = 1,\cdots, b, \quad  k = 1,\cdots, r, \quad \varepsilon_{ijk} \sim N(0,\sigma^2)
}

それぞれの因子の主効果 {\alpha_i, \beta_j} に加えて交互作用 { (\alpha\beta)_{ij} } が含まれる。

加法性と主効果や交互作用の性質

相互作用がないとき { (\alpha\beta)_{ij} = 0 } { \mu_{ij} = \mu + \alpha_i +\beta_j } となる。ここで

{ \displaystyle
\sum_{i} \alpha_{i} = 0, \sum_{j} \beta_{j} = 0,  \sum_{i}(\alpha\beta)_{ij} = \sum_{j}(\alpha\beta)_{ij} = 0
}

となる。

平方和の分解

総平方和 {S_T} を A間平方和 {S_A} と B間平方和 {S_B} 交互作用平方和 {S_{AxB}} 誤差平方和 {S_e} に分解する。

{ \displaystyle
 y_{ijk} - \overline{y}_{\cdot\cdot\cdot} = (\overline{y}_{ij\cdot} - \overline{y}_{\cdot\cdot\cdot}) + (y_{ijk} - \overline{y}_{ij\cdot})
}

{ \displaystyle
= (\overline{y}_{i\cdot\cdot} - \overline{y}_{\cdot\cdot\cdot}) + (\overline{y}_{\cdot j\cdot} - \overline{y}_{\cdot\cdot\cdot}) + (\overline{y}_{ij\cdot} - \overline{y}_{i\cdot\cdot} - \overline{y}_{\cdot j \cdot } + \overline{y}_{\cdot\cdot\cdot} ) + (y_{ijk} - \overline{y}_{ij\cdot})
}

それぞれが各平方和に対応している。2乗して足し合わせると交差項が0になるので

{ \displaystyle
 S_{T} = \sum_{i}\sum_{j}\sum_{k}( y_{ijk} - \overline{y}_{\cdot\cdot\cdot})^2
}

{ \displaystyle
= ar\sum_{j}(\overline{y}_{\cdot j \cdot} - \overline{y}_{\cdot\cdot\cdot})^2 + br\sum_{i}(\overline{y}_{i \cdot \cdot} - \overline{y}_{\cdot\cdot\cdot})^2 + r\sum_{ij}(\overline{y}_{ij\cdot} - \overline{y}_{i\cdot\cdot} - \overline{y}_{\cdot j\cdot} + \overline{y}_{\cdot\cdot\cdot} )^2 \\
+ \sum_{i}\sum_{j}\sum_{k}(y_{ijk} - \overline{y}_{ij\cdot})^2
}

{S_T = S_A + S_B + S_{AxB} + S_e} の形になる。

分散分析表

解析結果は下記のようになる。

変動要因 変動(平方和) 自由度 分散(平均平方和)
因子A {S_A = ar\sum_{j}(\overline{y}_{\cdot j \cdot} - \overline{y}_{\cdot\cdot\cdot})^2} { \nu_a = a-1 } {V_A=\frac{S_A}{\nu_a}}
因子B {S_B = br\sum_{i}(\overline{y}_{i \cdot \cdot} - \overline{y}_{\cdot\cdot\cdot})^2} { \nu_n =b-1} {V_B=\frac{S_B}{\nu_b}}
交互作用 {S_{AxB} = \\  r\sum_{ij}(\overline{y}_{ij\cdot} - \overline{y}_{i\cdot\cdot} - \overline{y}_{\cdot j\cdot} + \overline{y}_{\cdot\cdot\cdot} )^2} { \nu_{axb}=  \\ (a-1)(b-1)} {V_{AxB}=\frac{S_{AxB}}{\nu_{axb}}}
誤差 {S_e = \sum_{i}\sum_{j}\sum_{k}(y_{ijk} - \overline{y}_{ij\cdot})^2} { \nu_e =ab(r-1) } {V_e=\frac{S_e}{\nu_e}}
合計 {S_T=\sum_{i}\sum_{j}\sum_{k}( y_{ijk} - \overline{y}_{\cdot\cdot\cdot})^2} {\nu_T = n-1} { V_T=\frac{S_T}{\nu_T}}

平方和の比による検定

交互作用がある場合は主効果の差だけで変動が説明できないため下記の順で検定を行う。

  • {H_0: (\alpha\beta)_{ij} = 0 }{F_{AxB} = \frac{V_{AxB}}{V_{e}} }
  • {H_0: \alpha_{i} = 0 }{F_{A} = \frac{V_{A}}{V_{e}} }
  • {H_0: \beta_{j} = 0 }{F_{B} = \frac{V_{B}}{V_{e}} }

繰り返しのない二元配置

繰り返し回数が1回のときにモデルが

{ \displaystyle
y_{ij} = \mu + \alpha_i +\beta_j + (\alpha\beta)_{ij} +\varepsilon_{ij}
}

となるため誤差と交互作用が分離できない。

分散分析表は下記のようになる。

変動要因 変動(平方和) 自由度 分散(平均平方和)
因子A {S_A = a\sum_{j}(\overline{y}_{\cdot j} - \overline{y}_{\cdot\cdot})^2} { \nu_a = a-1 } {V_A=\frac{S_A}{\nu_a}}
因子B {S_B = b\sum_{i}(\overline{y}_{i \cdot} - \overline{y}_{\cdot\cdot})^2} { \nu_n =b-1} {V_B=\frac{S_B}{\nu_b}}
誤差 {S_e = \sum_{i}\sum_{j}(y_{ij} - \overline{y}_{ij})^2} { \nu_e =(a-1)(b-1) } {V_e=\frac{S_e}{\nu_e}}
合計 {S_T=\sum_{i}\sum_{j}( y_{ij} - \overline{y}_{\cdot\cdot})^2} {\nu_T = ab-1} { V_T=\frac{S_T}{\nu_T}}

あらかじめ交互作用がないことが分かっている場合に用いる。