R で階層的クラスター分析をする場合は,とりあえず生データの場合は,以下のように距離行列を求めます.
dist(sampledata) とするとユークリッド距離で,dist(sampledata)^2 となると平方ユークリッド距離が求まります.他の距離もあります.
この距離行列を用いて,階層的クラスター分析をする場合は,次のように入力します.距離と一緒に求めることもできます.
hres<-hclust(dist(sampledata[2:4])^2,"ward")
ちなみに最初の hres の部分は結果をこの変数に入れておく意味です.なくても大丈夫ですが,結果を見る際にこうしておくと楽かもしれません.また,上のデータの書き方をすると特定の変数のみ(2 列目から 4 列目のみ)を使って距離を求めることになります.
後ろの引数の "ward" は Ward 法の意味です.もちろん最短距離法,最大距離法,群平均法など有名どころは利用できます.
このあとに以下の方法をするといろいろと結果を得ることができます.
plot(hres):樹形図を表示できます.R のグラフはすべて画像として保存できます(メニューからまたは右クリックで可能).
cutree(hres,k):クラスター数を k としたときの各対象の所属グループ番号を表示.