ウェット中心の実験科学者がデータサインエスを勉強し始めると、統計学を理解できていないことに躓きませんか?
本記事では統計学の体系的に学習するためのUdemy講座をご紹介します。こちらの講座を受講することでデータサイエンスを前提とした統計学の基礎を体系的に学習でき、データサイエンスの学習効率が向上することが期待されます。
米国データサイエンティストが教える統計学超入門講座
実際にアメリカでデータサイエンティストとして活躍されているかめれおん氏の統計学講座です。かめれおん氏はご自身のブログやTwitterでもデータサインエス初心者向けの情報を積極的に発信しているので、これから勉強する方には必見です。そして本講座でもデータサイエンスを学ぶ前に統計学を基礎として理解することの重要性を強調されています。生業としている人の言葉なので説得力があります。
私が受講した感想を挙げると
- 講師自身がUdemy用に作成したDocker環境を使うので、作業環境に依存したエラーが起きない。Dockerはインストールから説明してもらえる。
- データサイエンスを志向した観点から各種統計用語や概念がなぜ必要なのか?という点も含めて説明してもらえるため、常に目的を見失わずに学習を進められる。
- 今まで散逸していた統計学の知識が体系的に纏まり、実務でも統計的に物事を考えられるようなった。
- 各説明のあとに必ずPythonで実装するセクションが入るので、ハンズオン作業により理解が深まる。
- 数学的な説明は必要最低限なので、苦手な人でも十分フォローできる。
いいところを上げるとキリがないのです。
全体で16時間のボリュームですが、説明部分は1.5倍速、コーディング部分は1.25倍速が私にはちょうどよかったです。集中して取り組めば1週間で終わらせられる内容です。
以下では学習できる内容について簡単に紹介します。
記述統計
平均、中央値、分散、共分散、相関係数といった統計用語について、それぞれの統計的な意味と計算方法について学べます。似た統計値についてはそれぞれの特徴も含めて学べるので、実際のケースでどの値に注目すべきなのかも理解できるようになります。
分布と標準化
確率分布とは何かを簡単に学習したのち、機械学習分野で頻出の標準化(平均を0, 分散を1にすること)について、意味と意義についてしっかりと学習できます。
推測統計
統計学における母集団と標本という考えから、P値について正しく理解できます。実際のビジネスで活用されている各種統計検定の基礎を学べます。
こんな人におススメの講座です
データサイエンスを学ぶ上で統計学の基礎は絶対に理解しておかなければいけません。統計を曖昧にして進めば進むほど後々苦しくなってきます。下記に当てはまる人には本講座を本当におすすめします。
- データサイエンスに興味があるけど大学で統計学を学んだけどほとんど忘れてしまった人
- すでに機械学習やディープラーニングの勉強に着手しているけど、統計用語が理解できなくて挫折しそうな人
- 統計学が全然わからないけど、ビジネスの提案などで統計的観点を活用したい人
値段が高めなので躊躇するかもしれませんが、Twitter限定で頻繁に割引クーポンコードが配布されています。購入を検討の方は必ずTwitterをチェックしてください!
また、かめれおん氏は本講座にとどまらず、DockerやGitの使い方、機械学習講座も公開されています。興味がある方はそちらもチェックしてください。機械学習講座は受講済みなので、別の記事で紹介する予定です。
終わりに
繰り返しになりますが統計学はデータサイエンスを学ぶ上で必須の学問です。またビジネスシーンにおけるプレゼン・提案でも統計学の知識は必ず活きてきます。
私自身はバックグラウンドが合成化学なので、10年近い研究職ライフの中でも統計学が必要になることはほとんどありませんでした。それゆえデータサイエンスで大量に出てくる統計ワードをその場しのぎ的にネット検索でやり過ごしていましたが、統計学を基礎から勉強する必要性はかなり感じていました。本講座を受講したことで統計学の基礎が整理でき、データ分析や機械学習の勉強効率が格段に上がりました。
1~2週間と短期間でPythonを使って統計学を学べる良い講座なので、気になる方は是非受講してみてみてください!
本記事が皆様のデータサイエンスの勉強のお役に立てれば幸いです。
コメント