2010/12/19

Rcmdr ってやっぱり便利ですね

Rcmdr は R に GUI をもたらすパッケージですが,久しぶりに使うと便利ですね.メニューからいろいろなものが選らべ,コマンドを忘れた場合や変数をイメージに近い形で選択することが可能です.もちろん CUI で問題ない人は不要と思いますが….

使い方はいろいろなサイトに書かれていますんで,詳しくはそちらを見てもらいたいですが,メモ的に書きますと以下の通りです.

1.R を起動します.
2.メニューの「パッケージ」>「パッケージの読み込み…」を選択します.
3.メニュー画面がでますので,「Rcmdr」を選択し,「OK」をクリックします.

これで Rcmdr が起動します.画面上部のデータセットの部分でアクティブにしたいデータを選んだら,そのデータに対して,いろいろと分析ができます.

本当にこのような便利なツールを使いながらデータ分析の授業ができればと思います.

2010/11/14

データのクロス集計と検定

とりあえずデータを読みこませておきます.以下ではデータ名を shimadadata とします.

まずクロス集計は "table(shimadadata[[2]],shimadadata[[15]])" で変数 shimadadata[[2]] と変数 shimadadata[[15]] のクロス集計ができます.[[i]] の i の部分は列(変数)の番号を表し,変更すればもちろん該当する変更後のクロス集計が求められます.ちなみに "addmargins(table(shimadadata[[2]],shimadadata[[15]]))" とすると合計も合わせて求められます.

次にこのクロス集計の独立性の検定は "chisq.test(table(shimadadata[[2]],shimadadata[[15]])" で変数 shimadadata[[2]] と変数 shimadadata[[15]] の独立性の検定ができます.[[i]] の i の部分は列(変数)の番号を表し,変更すればもちろん該当する変更後の独立性の検定が求められます.

他にももっと効率的な方法があると思います.あくまで参考までに.

R での現在のディレクトリの確認

R での現在のディレクトリを表示する関数は GETWD() です.ファイルを読み込むときにたまに知りたくなるのでメモです.

これでいつもの「shimadadata<-read.csv("shimada_data.csv",header=T)」などをすれば読みこめます.

2010/08/17

R でデータハンドリング

データが大規模で Excel で処理ができない場合,どうしましょう.このときは Access を利用することもありますが,R でもできそうです.

舟尾さんのウェブページ(http://cwoweb2.bai.ne.jp/~jgb11101/)に資料等がありました.参考までに.

2010/07/04

ちょっと最初のメモ

R はフリーの統計ソフトです.これまでも多くのサイトや書籍があります.ここでは,竹内の個人的な観点で,備忘録的に R の使い方を紹介したいと思っています.

R を使う準備

R とは?

R とは S 言語に似ている言語を用いた統計解析を行うためのソフトウェアです.詳しくは,他のサイトや書籍を参考にしてほしいのですが,とりあえずは (1) 無料の統計ソフト (2) 基本的には CUI(キャラクターユーザインタフェース.MS-DOS とか UNIX のコマンドラインのようなインターフェース)の画面,ということを思っていただけたらと思います.

R の準備

R を手元の PC にインストールするには RjpWiki(http://www.okada.jp.org/RWiki/)のサイトを参考にしましょう.このサイトは R の日本語サイトとして非常に強力な情報サイトと思われます.特にインストールに関しては, 「主な内容」のところの「R のインストール」をクリックするとページに移動できます.

2010/05/27

カイ二乗検定

カイ二乗テストです.

まずデータを R に読み込ませます.ここでは data001 という名前にします.
> data001<-matrix(c(7,5,21,38,15,14,22,63,67,46,6,2,31,28,14,9,17,27,84,48),4,5,byrow=T) でクロス集計のデータ(この場合,5 × 4 のデータです)を R に与えます.byrow=T で横に読み込みます(試しに byrow=F とすればこの意味がわかります).c() のデータを matrix 形式で,data001 の名称で読み込ませるという意味になります. このあと > data001
と入力すれば,data001 の状態がわかります.

> chisq.test(data001)

と入力して,ピアソンのカイ二乗検定の結果をえます.カイ二乗値と自由度,p 値を求めることができます.

残差分析等は出力されませんので注意.これについては群馬大の青木先生のところ(http://aoki2.si.gunma-u.ac.jp/R/my-chisq-test.html)に表記あり.また上記についても同志社大学の金先生の資料(http://mjin.doshisha.ac.jp/R/11.pdf)をネット上で見つけることが可能です.