多変量解析で遊んでみる

 実験で多変量解析を扱ったので、それを応用してこっちでも実験的なことをしてみようかと。解析ソフトはMulcelを利用。



@プル23の好きなキャラに関する解析

プル23の好きな女性キャラ10人を対称として分析を行う。女性キャラを各評価項目について評価(-5〜+5)を行い、まとめたデータを以下の表1-1に示す。


表1-1. 女性キャラと各評価項目に関するデータ
data1



この場合、1人分のデータしかないため平均値の算出は行わずに進める。まとめたデータに関してクラスター分析を行う。分析方法は解析ソフトによって異なるため割愛する。
ここでクラスター分析の結果から得られたデンドログラムとそれぞれの女性キャラに関するユークリッド平方距離を以下の図1-1,表1-2に示す。


cluster1
図1-1. 女性キャラに関するクラスター分析の結果



表1-2. 女性キャラに関するユークリッド平方距離
euclid1



図1-1と表1-2の結果から最も類似度の高い組み合わせは芙蓉楓と永江衣玖、最も類似度の低かった組み合わせはレティ・ホワイトロックと暁切歌であるとわかる。またデンドログラムより
非類似度が53.7%で2グループ、32.5%で4グループに分けられていることがわかる。


次にクラスター分析と別に主成分分析を行う。1人分のデータしかないため散布図については割愛する。評価項目に関する相関行列、寄与率、累積寄与率についてまとめたデータを表1-3に示す。


表1-3. 女性キャラに関する相関行列・寄与率・累積寄与率
correlation_matrix1



この結果から、最も関連性の高い評価項目(成分の絶対値が1に最も近い値を表す組み合わせ)は髪型とルックス、逆に最も関連性の低い評価項目は性格と登場作品であると考えられる。
同様に寄与率について考える。Z1,Z2,Z3,Z4,Z5,Z6,Z7の寄与率はそれぞれ47.7%,18.0%,13.6%,10.5%,4.9%,4.2%,1.1%である。同様に累積寄与率について着目する。この累積寄与率によって信頼性が
得られた結果であるか否かが判断できる。今回の場合、Z3までの累積寄与率は79.4%であり、累積寄与率が約80.0%まで到達しているため、Z3(第3主成分)まで使用することが望ましいと考えられる。

 〜あとがき〜
一応この記述はあまり鵜呑みにしない方がいいです。なにせ僕自身が多変量解析に関して専門的に学んでいるわけではないので… まあ、こんな楽しみ方もある、ということを知っていただければ
幸いです。数学を応用して遊ぶことも楽しいものです。もう少し学んでみたいけれどもうちの学部だと多変量解析は詳しくやらないみたいなんですよね。



戻る