2組の数
があったとき,xi < yj を満たす (i, j) の組の数を U とすると,もしこれらの n + m 個の数の並び順がランダムであれば,U の確率分布はある漸化式から計算できます。さらに,n, m が大きければ,U の分布はほぼ正規分布 N(nm/2, nm(n+m+1)/12) になります。このことを使った検定を,Wilcoxon-Mann-Whitney検定(ウィルコクソン・マン・ホイットニー検定,WMW検定)といいます。
U の値は,n + m 個の中での x1, x2, ..., xn の順位の和から n(n + 1)/2 を引いた値に等しいので,U を使った検定は,順位和を使った検定ということもできます。
この検定は,まずAmerican Cyanamidという会社のWilcoxon(ウィルコクソン)という人が1945年に,1標本の場合(Wilcoxonの符号付き順位検定)と2標本の場合(この方法)の考え方を提案し,1947年にMann(マン)とWhitney(ホイットニー)が U という統計量を導入して統計学的に論じました。呼び方としては,Wilcoxonの順位和検定(Wilcoxon rank-sum test),Mann-Whitneyの U 検定(Mann-Whitney U test),Wilcoxon-Mann-Whitney検定(WMW test),Mann-Whitney-Wilcoxon検定(MWW test)がありますが,どれも同じことです。
Lumley (1996) のデータ (T. Lumley, Biometrics 52, 354-361) をRでWMW検定してみます。
> x = c(1,2,1,1,1,1,1,1,1,1,2,4,1,1) > y = c(3,3,4,3,1,2,3,1,1,5,4) > wilcox.test(x,y) Wilcoxon rank sum test with continuity correction data: x and y W = 32.5, p-value = 0.007741 alternative hypothesis: true location shift is not equal to 0 Warning message: In wilcox.test.default(x, y) : タイがあるため、正確な p 値を計算することができません
ここで W と出ているのは xi > yj となる (i ,j) の数に xi = yj となる (i ,j) の数の半分を加えたものです(さきほどの U の定義と逆になっています)。
さきほどWMW検定は漸化式により正確な p 値が求められると書きましたが,この場合はタイ(等しい値)があるので,漸化式は使えず,正規分布による近似値になってしまったようです。タイがなくても,両群の個数の和が50以上になると,正規分布近似に切り替わるので,50個以上の場合に正確な値を求めたいなら
wilcox.test(x,y,exact=TRUE)
とすればいいのですが,タイが一つでもあれば,このオプションを付けても無駄です。正確な値を求めたければ,exactRankTests
というパッケージを使うのが一つの方法です。
> library(exactRankTests) Package ‘exactRankTests’ is no longer under development. Please consider using package ‘coin’ instead. > wilcox.exact(x,y) Exact Wilcoxon rank sum test data: x and y W = 32.5, p-value = 0.00669 alternative hypothesis: true mu is not equal to 0
メッセージにも出ていますが,exactRankTests パッケージは開発が継続されていないようです。代わりに coin パッケージを使えということですので,やってみましょう。使い方がちょっと違います。
library(coin)
wilcox_test(c(x,y) ~ factor(c(rep("x",length(x)),rep("y",length(y)))),
distribution="exact")
結果は wilcox.exact(x,y) と同じになります。
WMW検定は両群がまったく同じ分布をしているという帰無仮説の検定です。実質的には順位を t 検定しているのとほぼ同じことですので,両群の分散が異なる場合は,順位に直して,等分散を仮定しない t 検定をするという手が考えられます。より最近の方法としてはBrunner-Munzel検定があります。
WMW検定は,xi > yj を満たすペアの個数についての検定だといえばもっともらしく聞こえますが,各群の順位和についての検定だというと,間隔尺度でない順位を合計して何の意味があるのだ!と叱られるかもしれません。実際にはどちらの言い方も数学的に同値です。

WMW検定と,分散が等しいと仮定する t 検定を順位について適用した場合とでは,ほぼ同じことを調べているので,両者の p 値はほぼ一致します(右図)。
この図は次のRのプログラムで描きました:
ni = 100
pt = pw = numeric(ni)
for (i in 1:ni) {
a = sample(20)
b = sample(5:10, 1)
x = a[1:b]
y = a[(b+1):20]
pt[i] = t.test(x, y, var.equal=TRUE)$p.value
pw[i] = wilcox.test(x, y)$p.value
}
par(mgp=c(1.5,0.6,0)) # 数字とラベルをもっと軸に近づける
plot(pt, pw)
abline(0, 1)
Last modified: 2008-12-21 15:13:41