Stata勉強-3

一ヶ月程度いじってみてだいぶ感触がつかめてきた気がする。
思わぬ所から自腹を切らずに使える環境も手には入った。

ただ、社会調査系みたいにサンプルが大量にあって、かつ、それぞれのサンプルが複数の変数を持っている様なデータでないと、Stataは強みが発揮できないかもしれない。

そのうちSPSSの使用感も見てみたい。


tabulateの復習+α
tabulateの後に変数を1つ入れるか、2つ入れるかで違う。
1つの時はざっとデータを眺めるときだろうか。
tabulate var1, sort っていうこともできる。

2つの時、つまりクロス表になると、オプションを指定することでちょっとした検定が出来る。
tabulate 説明変数 目的変数, option
 option
  ・row:各を100としたときの%
  ・col:各を100としたときの%
  ・cell:全回答を100としたときの%
  ・chi2:chi-squared ※chiで動くけどhelpみたらchi2だった
  ・exact:fisher's Exact test
  ・all:Pearson chi2、尤度比、、Cramer's V、gamma、Kendall's tau-b

scatterの復習+α
twoway scatter y x, option
 twowayは省略可能だけれども、1つのグラフに2つ以上のデータのグラフを載せたいときに、twoway (scatter y1 x) (scatter y2 x)とかができる。


相関分析

変数が正規分布する時(身長や体重など)
 →Pearsonの積率相関係数
変数が正規分布しない時(収入やリッカート尺度など)
 →Kendallのtau-B / Spearmanの順位相関

・Pearson
pwcorr 変数リスト,option
 option
  ・sig:優位確立表示
  ・obs:観測数
  ・star(num):有意水準を指定

・Kendall
ktau 変数リスト
 こちらは変数が3つ以上の時は、kendallのtau-Aを出力してしまうので、
ktau 変数リスト,stats(taub obs p)
 と、いれる。順にtau-Bの指定、観測数、p値の出力


変数の尺度(比率、間隔、順序、名義)に注意して使う。

こちらの記事が分かりやすく、数学的背景も簡単にまとめられていると感じた。
http://d.hatena.ne.jp/sleepy_yoshi/20110326/
※分かったとは言っていない。



相関係数に関しては、一般に±0.2未満だと、相関なし、±0.2~±0.4で弱い相関・・・とかあるようだが、このあたりはよく分からない。

効果量のまとめの中で再考予定。