2008/06/21

データを集計しよう

データを集計するのときは,table 関数を使います.

table(変数名) で一変数のデータの度数分布表を作成します.また table(変数名,変数名) で,クロス集計をしてくれます.ちなみに 1 番目の変数が表側,2 番目が表頭にきます.

連続データの場合は,cut(変数名,breaks=seq(150,180,10)) を用いると可能です.たとえば, table(sex,cut(height,breaks=seq(150,180,10))) と書くと階級に分けながらクロス集計もできます.ちなみにこの場合 (○,△] と書かれていますが,これは右端を含んで,左端を含まないことになります.

ヒストグラムだけが必要な場合は,hist を使いましょう.これはグラフのところで紹介します.

0 件のコメント: