2012/02/02

R のデータの利用


R にも多数のサンプルデータが含まれています.もちろんコマンドでそれらのリストや読み込みができます.ただ慣れていないと忘れてしまいそうですので,こういうときは Rcmdr を使いましょう.

まずさっと使えるデータのリストを確認しましょう.いつもの通り,Rcmdr を起動します.

次に「データ」>「パッケージ内のデータ」>「パッケージ内のデータセットの表示」を選びます.するとデータのリストが別ウィンドーで表示されます.それぞれ含まれるパッケージとデータセット名,および簡単なデータの概要を確認することができます.スクリプトウィンドウを見ますと「data()」と書かれていますので,このコマンドで実行されることもわかります.

実際にデータセットの読み込み(インポート)は,「データ」>「パッケージ内のデータ」>「アタッチされたパッケージからデータセットを読み込む…」を選びます.

“パッケージからデータを読み込む”ダイアログがでますので,該当するパッケージとデータセット名をダブルクリックで選び,「OK」をクリックします.これで読み込まれていますので,確認のために「データセットを表示」をクリックしてデータを見ることができます.

自分でデータを入力することが多いと思いますが,このようなデータで R の練習もありでしょうね.

2012/01/26

R での二項分布の確率表示

R では二項分布に関する関数がいくつかありますが,Rcmdr を使うとメニューから選べます.

「分布」>「離散分布」>「2項分布」には裾の確率を求めたり,確率のリストを求めたり,確率のグラフを書いたりできるメニューがあります.

裾の確率は成功数(出現数?)の下側確率で求めていますので,上側確率を求めるときはオプションで変更できますが,注意しましょう.一つイメージとずれるかもしれません.

上記のことを確認する意味で確率のリストを出して,Excel に貼り付けても確認できます.スペース区切りで出力されるので,Excel では,「データ」リボンの「データツール」のグループの「区切り位置」ボタンで使いやすくなります.

確率を描画する場合は,形がみえる部分(確率が 0 に近いところは非表示)になるため,必要に応じて調整しましょう.

Rcmdr 全般で言えますが,一度メニューから一度出力し,その後,スクリプトウィンドウに書かれたコマンドをいじるとスマートにできると思います.今回は,最初に書かれる「.x <- **:**」の部分をいじれば表示される区間を変えられます.

ちなみに教科書で書かれるような事象(さいころなど)の確率の場合,1/6 のように分数で書きたいのですが,式表現は Rcmdr の入力フォームでは使いづらいので,こういう場合には上記の”書き直し”の方法が使いやすいと思います.グラフの表示文言も書き直せます.