疑問
「会社の業務でデータマイニングをやるようになったんだけど、僕は文系だし、よくわからない。。データマイニングっていう言葉もあいまいだし、どうやって利益につなげていくのかな?」
このような疑問に答えます。
本記事の内容
・データマイニングを行う手順と必要なツールを説明
・それらの学習方法も解説
これを書いている僕は医療職で働きつつ大学院に通って5年目。論文や学会発表ができており、Rを中心に統計ソフトの使用方法についても発信しています。
データマイニングとは?
過去のデータを分析することで、「宝を見つける」という意味でして、簡単にいうとデータを今後の運営に活かすことです。
過去のデータ(顧客情報や商品管理の情報)を解析し、運営に利用することで会社のコスト削減や利益増大に役立てようということですね。
データマイニングを行う前に気を付けたいこと
これからデータ解析をしていかなくてはならない!
何から手をつければいいか、、目が回る~。。
まず、基本的なこととして、あなたはその業界に関する知識、経験がありますか?
業界の知識や経験が少ないと、データの表す意味が理解できません。
仮に派遣で未経験の業種へ出向した場合、まず業務の流れやビジネスモデルなど勉強する必要が
あります。
その上でデータマイニングを行う前に、以下の要素は検討する必要があります。
✓Step1(目的段階) 何を、何のために分析するのか?
→このデータ解析をすることのメリットは誰の?どんなメリットですか?
✓Step2(前処理段階) 必要なデータは揃っているのか?
→対象となるデータの量や質は十分ですか?
✓Step3(解析段階) 解析をする
→解析方法はどうしますか?解析ツールは用意できていますか?
✓ Step4(視覚化・伝え方)
→どのようにして社内の人に伝えますか?
→実際の運営にどう活かしていけそうですか?
データマイニングで使えるツールを紹介
↑に書いたStep2以降では以下のものが必要です。
✓ データマイニングのツール
✓ 統計検定の知識
特に100名を超えるような大規模データになってくると平均や和を出すだけでもExcelでは辛くなってきます。。
回帰分析やt検定、一元配置分散分析などの統計検定を行えるデータマイニングのツールにはこちらがあります。
・ R
・ Python
こちらのうちどちらかを学習することによって、得られたデータの統計検定、データの可視化、機械学習まで行うことが出来ます。
これらのツールは無料で使用でき、書籍やYoutubeなどの学習ツールが充実しています。
RやPythonの学習方法
学習方法は以下にわけて紹介します。
①できれば無料で学びたい
②オンラインスクールで学びたい
データマイニングツール学習用のおススメYou tube、ウェブサイト【学習用】
独学しやすい動画やウェブサイトをこちらに紹介します。
Rについてはこちらがおすすめ。
さいくすチャンネル
リンクはこちら。
Rの導入から、それを使った基本的な統計解析まで体系的にまとまっていると思います。
1つの動画も長くないので取り組みやすいのではないでしょうか。
Python についてはこちらがおすすめ。
はやたす / Pythonチャンネル
リンクはこちら。
Pythonの導入やデータ解析での利用について細かく説明されています。
AIアカデミー
リンクはこちら。
こちらは有料になってしまうのですが(980円/月)、導入から基礎的な統計検定までを一貫して学習するのに適したサイトだと思います。
データマイニングツール学習用のオンラインスクール
Youtubeやウェブサイトよりも更に体系化された教材で、先生から学びたい場合は
オンラインスクールのUdemyがおすすめです。
特徴は以下の通りです。
・講座毎の支払いで単価2000円ほどと低価格です。
・Youtubeよりも体系的かつ実践的にまとまっています。
・もちろん初心者向けコースも豊富にあります(ありすぎて選べないくらい)
・RもPythonも取り扱っています。
↑
これはRの講座です。このような感じで、いっぱい講座があります。
Udemyのリンクはこちらです↓
本日は以上となります。
これからも有益な記事を書いていきます。
よろしくお願いします。