こんにちは、
社会人で統計学を勉強し始めたとき、まず悩むのがどの統計ソフトを勉強するかだと思います。
どうせなら転職の可能性も考えて応用の利くソフトを習得したいですよね。
✓社会人はどの統計ソフトを習得すべきか
✓学習の順序を教えてほしい
このような疑問に答えていきます。
僕は医療系の仕事をしながら大学院に通って4年目です。SPSSやRを使ってデータ解析、学会発表や論文投稿も行っています。現在はPythonも勉強中です。
では始めていきます。
✓ 統計学を学習し始めた社会人の方
✓ どこから始めてよいかわからない方
でははじめていきます。
社会人はどの統計ソフトを勉強すべきか?【Python、Rの2択です】
あなたが社会人で統計学を使って仕事に活かしていくとしたら、統計ソフトの導入は避けることができません。
タイトルにも出ていますが、結論をいうとPythonかRの二択になります。
理由はこの通り。
・インストールが無料
・転職の際に評価されやすい言語
・市場価値の高い機械学習への応用が可能
例えばこれはとある企業の採用情報ですが、、
↑「PythonやRによる~」とありますね。
しっかり勉強を積んでいけばデータ解析業界で評価されやすい統計ソフト(プログラミング言語)です。
どのように学習を進めていくか
ここには僕自身がいつも行っている手順をまとめました。
step1 まずインストールする
まずは自分のパソコンにプログラムをインストールすることから始めていきましょう。
Rに関しては以前記事にしているので参考にして下さい。
データ解析初心者向け 統計ソフトの選び方
Pythonに関しては「Python インストール」で検索してみましょう。
こちらも近日中に記事にしていきたいと思います。
step2 メモ帳を作ろう
PCのメモ帳やワードファイルでいいと思うので覚えたことを記録しておくと良いと思います。あとで見返すことができるのと書くことでアウトプットになるので記憶に残りやすくなりますね。僕はPythonの勉強用メモを以下の様に作りました。
↑僕の作っているメモです。こんな感じでコードをまとめていきます。
step3 データの読み込み方を覚えましょう
次にデータの読み込み方を覚えましょう。
実際の解析作業では「データをプログラムに読み込ませる→解析」の流れで行うはずです。まずデータを読み込ませる方法を覚えないとその先に進めません。
RにCSVファイルを読み込ませる方法については過去記事こちらをご参照ください。
Rにexcelで作ったファイルを読み込む方法【CSV形式で読み込みましょう】
今後、PythonにCSVファイルを読み込ませる方法も追加していく予定です。
step4 データの統計解析をやってみましょう
データの読み込みが済んだら「t検定、相関解析、回帰分析」といった基本的な統計解析を実際にやってみると良いと思います。
「でも私数学とか統計学とかわからないし、先に数学を勉強した方がいいんじゃ…」と思いますよね。結論は先に統計ソフトを動かした方がいいです。
勿論数学的知識が必要ないとは思いませんが、僕も統計の理論的背景は浅いままでも論文投稿や学会発表をできていますよ。
統計ソフトやプログラミング言語はまず「手を動かして覚えていきましょう」。
理論は必要な時に適宜勉強する形が挫折しづらいと思います。
「そもそも手元にデータがないよ」と心配な方もいますよね、そんなときはこのようなサイトを見て下さい↓
政府の公開している市町村の人口データがCSVやExcelで公開されています。
解析のためのコードについてはググって調べてみましょう。
解析の流れを知りたい方は
AI academy
のようなアプリで解析の一連の流れを見ることができます。
step5 図表を作ってみよう【データの可視化】
以上の解析まで済んだらだいぶその統計ソフトに慣れてきているはずです。最後に結果の可視化まで実行してみましょう。
✓ t検定やウィルコクソンの順位和検定→棒グラフ
✓ 相関解析→散布図
✓ 回帰分析→回帰直線
などを引いてみましょう。
例えば、、
↑これは棒グラフです。
↑これは散布図に回帰直線を引いたものです。
更に、
✓ 散布図のポイントの形(〇とか△に変更できます)
✓ 塗りつぶしの色
を変更する方法を習得しましょう。
ここまでやれば第3者に伝えることのできるデータ解析が完了します。
まとめ【データを読み込む、解析する、図表を作る】
統計ソフト(プログラミング言語)の使い方を説明しました。
まとめると
✓ データを読み込む
✓ 統計解析をやってみる
✓ 図表を作って可視化する
の流れをやってみると効率よく統計ソフトの使用に慣れることが出来ます。
本日は以上となります。
これからも有益な記事を書いていきます。
よろしくお願いします。