こんにちは。
✓ 相関解析はどのようなとき使えばよいの?
✓ SPSSでの相関解析の方法がわからない
このような疑問に答えていきます。
僕は医療系の仕事をしながら大学院に通って4年目です。SPSSやRを使ってデータ解析、学会発表や論文投稿も行っています。
相関解析は非常に良く使う解析方法ですので、これから論文を書いたりデータ解析をするといった方は是非覚えて下さい。
✅このような方にオススメ
✓ これからデータ解析を始める卒論生や社会人
✓ 2つのデータ間での関係性を調べたい方
そもそも相関解析とは?相関係数とは?
論文を読んでいたりすると良く目にする相関解析ですが、そもそもどのような時に使うものなのでしょうか?
結論から言ってしまうと「2つの項目の関係性を知りたい」に使用する解析方法です。医療研究では良く用いられます。
例えばリハビリ領域では「転倒の回数と歩く速度」の関連性を調べるために相関解析を用いるなどです。
意味を少し【数学わからなくても可能】
2つのXとYの相関係数を見るとき、数学的には
となります。
分散とはそれぞれのデータの平均からの差
共分散とは2つの項目の分散をかけたもの
標準偏差とは分散を二乗したもの
です。
これ以上の詳細を知りたい方はググってみて下さい。
結果の解釈の仕方
結果は「-1~1」の間におさまります。
「1」が正の相関といい、「Xが増えればYも減る」という関係です。
「-1」が負の相関といい、「Xが増えればYが減る」という関係です。
そして
0~0.3 :ほぼ無相関
0.3~0.5:弱い相関
0.5~0.7 :相関がある
0.7~0.9 :非常に強い相関
と段階分けされています。
2種類の相関解析
相関解析には2種類あります。
2つの項目の双方がパラメトリックな項目であれば「ピアソンの積率相関係数」です。
どちらを使うかの決め方は単純です。
✓2つの項目のうち、1つでもノンパラメトリックな項目があれば「スピアマンの順位相関係数」です。
✓どちらもパラメトリックな項目であれば「ピアソンの積率相関係数」です。
項目がノンパラメトリックかパラメトリックかを判定するにはこちらの記事で紹介されているShapilo-Wilk検定を参考にして下さい。
【SPSS】t検定のやり方
簡単に言うと、
Shapiro-Wilk検定でp<0.05の場合は「ノンパラメトリック」です。
また、順序尺度は「ノンパラメトリック」です。
実際にSPSSで相関係数を計算 実際にSPSSでの相関解析の方法を説明します。 今回もこちらのデモデータを使用します。 デモデータ SPSSへのデータの読み込ませ方がわからない方は以下の記事を参照してくださいね。 SPSSでExcelファイルやCSVファイルを読み込む方法 【まずこれを覚えましょう】 SPSSで行うピアソンの積率相関係数
↑「分析」→「相関」→「2変量」をクリックします。
↑このような画面が出てきます。
↑相関を見たい項目を「変数」の枠に移動します。ここでは「年齢」、「テスト」、「背中角度」、「足の長さ」を移動しました。
次に「相関係数」の欄で検定方法を3つから選択できます。
2つの項目がパラメトリックの場合は「Pearson」1つでもノンパラメトリックな項目を含む場合は「Spearman」です。
子の理解で問題ないです。
今回は「Pearson」で行います。
最後に「有意な相関係数に星印をつける」に✓が入っていることを確認してください。
その後、「OK」を押します。
↑このような画面が出てくれば完了です。
相関係数と有意確率をみて下さい。
結果を保存する
↑「ファイル」→「名前をつけて保存」→をクリックです。
↑保存したいフォルダを選び、ファイル名を付けて「保存」クリックです。
以上、SPSSを使った相関解析の方法でした。
これからも有益な記事を書いていきたいと思います。よろしくお願いします。