R および Rcmdr でのクロス集計および独立性の検定の覚書です.詳しくは書籍等を参照してください.
- Excel を起動,データを入力.この場合,変数名を入力し,欠測値は NA と表記.桁数のカンマは使わない方が Rcmdr での読み込みで無難.
- データの範囲をコピー.
- R および Rcmdr を起動.
- 「データ」>「データのインポート」>「テキストファイルまたはクリップボード,URL から…」を選択.
- 欠測値の記号は「NA」のまま,データファイルの場所は「クリップボード」,フィールドの区切り記号「タブ」で「OK」をクリック.
- 「データ」>「アクティブデータセット内の変数の整理」>「数値変数を因子変換」を選択.
- “変数”で変換したい 1 つまたは複数の変数を選択し,“因子水準”ではコードを言葉に変えたいときは「水準名を指定」を選び,数値のままにする場合は「数値で」を選び,また新しい変数を作る場合は,“新しい変数名または複数の変数に対する接頭文字列”で新しい変数名を入力して「OK」をクリック.複数の変数を選んだ場合は,入力した名称が接頭語になる.この場合,複数の変数であっても同じコードで同じ言葉になるため注意が必要.
- 水準名を指定をえらんだときは,対応する言葉を入力.
- 「統計量」>「分割表」>「2元表」を選択.
- “行の変数”“列の変数”をそれぞれ選び,必要に応じて,“パーセントの計算”,“仮説検定”のオプションにチェックし,「OK」をクリック.※“部分集合の表現”は分からなかった.“パーセントの計算”では,属性を考えたい変数のパーセントを,“仮説検定”では“独立性のカイ2乗検定”と“期待度数の表示”を選ぶことを紹介したい.