2008/06/15

データの入力と単純計算

Rでデータを入力するのは以下のようにしていけば可能です.もちろんこれ以外に行列で入力やファイルで読み込みなどいろいろできます.ここでは一番単純なことを紹介します.

c(○,○,○,…,○)とするとベクトルでデータ(1 変数のデータ)を表現できます.これを常に入力していけば平均値等も求められます.例えば,平均値だと mean 関数を使いますが, mean(c(154,167,183,143)) となります.これでもよいのですが,統計は基本的に測定に対して数値(データ)が得られますので,変数の値として入力することがお勧めです.変数は適当な名前をつけて,それにこのベクトルでのデータを渡しましょう.渡し方は「変数名<-c(○,○,○,…,○)」となります(日本語も同様に使えます).「身長<-c(154,167,183,143)」とすると「身長」という変数に数値(データ)が渡されます.ここで「身長」と入力するとその数値が表示されます.

もちろん計算するときはこの変数名を使えます.平均値を求める場合は,mean 関数を使って mean(身長),中央値は median 関数を使って,median(身長),その他にも基本統計量では,最大値 max,最小値 min,総和 sum,不偏分散 var,その標準偏差 sd,四分位偏差 IQR,五点要約値(最小値,下側ヒンジ,中央値,上側側ヒンジ,最大値)fivenum,ヒンジを 25%,75% に変えた quantile も使える.Excel は quantile と同じ値.またデータの個数(正確には標本の大きさ)length などを使います.これらの関数を使うと,範囲(レンジ)も max-min をして(単に range で求めると最大値と最小値を出力),また四分位範囲は IQR*2 と求めることが可能です(ただし,四分位点の取り方によって計算が一致しない).ちなみに summary を使うと五点要約(quatile を使ったときの値)と平均値をざっと出してくれます.またパッケージ e1071 を使うと skewness(),kurtosis() で,歪度と尖度も求められます.なお,Windows で,パッケージを読む込むには,[パッケージ] メニューから [パッケージの読み込み] を選び,該当するパッケージを選びます.なお,ave 関数を使うと変数の標本の大きさの平均値が求められる.これで偏差は変数名-ave(変数名) を使い,変数で求められる.

また rank 関数を使うと昇順(小さい順)のそれぞれの順位を表示することが可能です.またタイデータ(同値データの扱いも 5 種類から設定できます).

R を使うと簡単にデータの要約値が求まるので,便利です.

0 件のコメント: