Stata勉強-3
一ヶ月程度いじってみてだいぶ感触がつかめてきた気がする。
思わぬ所から自腹を切らずに使える環境も手には入った。
ただ、社会調査系みたいにサンプルが大量にあって、かつ、それぞれのサンプルが複数の変数を持っている様なデータでないと、Stataは強みが発揮できないかもしれない。
そのうちSPSSの使用感も見てみたい。
tabulateの復習+α
tabulateの後に変数を1つ入れるか、2つ入れるかで違う。
1つの時はざっとデータを眺めるときだろうか。
tabulate var1, sort っていうこともできる。
2つの時、つまりクロス表になると、オプションを指定することでちょっとした検定が出来る。
tabulate 説明変数 目的変数, option
option
・row:各行を100としたときの%
・col:各列を100としたときの%
・cell:全回答を100としたときの%
・chi2:chi-squared ※chiで動くけどhelpみたらchi2だった
・exact:fisher's Exact test
・all:Pearson chi2、尤度比、、Cramer's V、gamma、Kendall's tau-b
scatterの復習+α
twoway scatter y x, option
twowayは省略可能だけれども、1つのグラフに2つ以上のデータのグラフを載せたいときに、twoway (scatter y1 x) (scatter y2 x)とかができる。
相関分析
変数が正規分布する時(身長や体重など)
→Pearsonの積率相関係数
変数が正規分布しない時(収入やリッカート尺度など)
→Kendallのtau-B / Spearmanの順位相関
・Pearson
pwcorr 変数リスト,option
option
・sig:優位確立表示
・obs:観測数
・star(num):有意水準を指定
・Kendall
ktau 変数リスト
こちらは変数が3つ以上の時は、kendallのtau-Aを出力してしまうので、
ktau 変数リスト,stats(taub obs p)
と、いれる。順にtau-Bの指定、観測数、p値の出力
変数の尺度(比率、間隔、順序、名義)に注意して使う。
こちらの記事が分かりやすく、数学的背景も簡単にまとめられていると感じた。
http://d.hatena.ne.jp/sleepy_yoshi/20110326/
※分かったとは言っていない。
相関係数に関しては、一般に±0.2未満だと、相関なし、±0.2~±0.4で弱い相関・・・とかあるようだが、このあたりはよく分からない。
効果量のまとめの中で再考予定。