統計学

データサイエンティスト

クラスター解析 k-means法のアルゴリズムを理解してみる

今回はクラスター分析についてまとめてみました。データの行列を与えると、任意の数のクラスター(グループ)に分けてくれるので理解しやすく、使用頻度が高い解析方法ではないでしょうか。クラスター分析の中で最も使われているk-means法を中心に、そ...
データサイエンティスト

サポートベクトルマシン(後編:カーネル関数編)

今回はサポートベクトルマシンのカーネル関数版についてまとめてみました。(前回は線形分離可能なバージョンのアルゴリズムを紹介しました。)サポートベクトルマシン(前編:線形分離可能)まとめ・カーネル関数の線形バージョンを少し変形したものが、カー...
R

サポートベクトルマシン(前編:線形分離可能)

今回はサポートベクトルマシンについてまとめてみました。SPSSやPython, Rによって実装はできるようにはなってきていますが、特に私のように文系出身者にとっては、背景を理解するのはこれまでまとめた回帰分析以上に難解に感じる方々も多いので...
データサイエンティスト

ラッソ回帰の理論をまとめてみた

データ分析や機械学習の関連で、線形回帰・リッジ回帰・ラッソ回帰という言葉をよく聞きます。線形回帰とリッジ・ラッソ回帰の違いは何なの?それぞれのメリット・デメリットを知りたいという自分の疑問に答えるため、まとめてみました。今回も「加藤公一:機...
データ解析

線形回帰とリッジ回帰の理論をまとめてみた

皆様も業務で機械学習を触れることが増えてきたかと思います。AIを使用し、コーディングも容易にできるようになってきました。ただ、このような時こそ処理の内容をわかりやすく説明する「説明力」が重要になっていることを感じます。機械学習についても、そ...
研究

二元配置分散分析の原理【平均平方、残差、F値】

2022.2.26リライトしました。本日はこのような疑問にお答えします。私は医療系大学院に通い、5年目。これまでにSPSSやRを使ってデータ解析、学会発表、論文発表を行えています。そのような僕が今回は二限配置分散分析をその理屈から、実装まで...
データ解析

【文系でも10分で理解できる】一元配置分散分析の原理、計算手順とは?

こんにちは。本日は一元配置分散分析に関する疑問について説明したいと思います。このような疑問に答えます。統計学ってとっつきづらいですよね。ですが、研究論文で使ったり、データサイエンスの勉強をするときにはその原理まで含めて理解したいところ。本日...
R

Rを使った重回帰分析【初心者向け】

本日はRを使った重回帰分析の方法をまとめました。重回帰分析は結果の解釈も複雑なので、どのように解釈していくかもまとめています。本記事を読むことでRでの重回帰分析を行うことが出来るようになります。
SPSS

SPSSでクラシカルウォリス検定・フリードマン検定を行う方法

本日はSPSSでノンパラメトリックな3群以上の比較を行う方法についてまとめました。本記事を見ればクラシカルウォリス検定、フリードマン検定のやり方を学修できます。
R

【R】ロジスティック回帰分析の方法【10分でできる】

本記事ではRを使ってロジスティック回帰分析を行いました。少しとっつきづらいですが本記事を見て写経をしてもらえれば修得できます。10分位でできるのではないでしょうか。