2010/11/14

データのクロス集計と検定

とりあえずデータを読みこませておきます.以下ではデータ名を shimadadata とします.

まずクロス集計は "table(shimadadata[[2]],shimadadata[[15]])" で変数 shimadadata[[2]] と変数 shimadadata[[15]] のクロス集計ができます.[[i]] の i の部分は列(変数)の番号を表し,変更すればもちろん該当する変更後のクロス集計が求められます.ちなみに "addmargins(table(shimadadata[[2]],shimadadata[[15]]))" とすると合計も合わせて求められます.

次にこのクロス集計の独立性の検定は "chisq.test(table(shimadadata[[2]],shimadadata[[15]])" で変数 shimadadata[[2]] と変数 shimadadata[[15]] の独立性の検定ができます.[[i]] の i の部分は列(変数)の番号を表し,変更すればもちろん該当する変更後の独立性の検定が求められます.

他にももっと効率的な方法があると思います.あくまで参考までに.

R での現在のディレクトリの確認

R での現在のディレクトリを表示する関数は GETWD() です.ファイルを読み込むときにたまに知りたくなるのでメモです.

これでいつもの「shimadadata<-read.csv("shimada_data.csv",header=T)」などをすれば読みこめます.