この広告は30日以上更新がないブログに表示されております。
新規記事の投稿を行うことで、非表示にすることが可能です。
広告
posted by fanblog
2019年11月04日
【11日目】Udemy講座で学ぶ!実践 Python データサイエンス
楽しく進めることができた。
実際に手を動かしながら、データの解析を行っていくのが楽しい!
前半で習ったことが実際の解析でどう活用するかがわかり、ためになる。
また、データ解析の過程の中で新たに見えてくる発見や、レクチャー以外の疑問が出てきて、習ったことを活用しながら、寄り道的にいろいろ試すのも楽しい。
■セクション9:実践データ解析
・タイタニック
データ解析では有名なデータ。タイタニック号の沈没の際の乗客のデータで生き残った人の推定を機械学習で行ったりするのによく使われるデータである。
始めに問いを立ててそれにこたえる形で講義が進むのがわかりやすく、終わった後に達成感がある。まず、decribeやinfoを使って、データの概要をつかみつつ、層別(hue)を多用しながら、解析を進める。性別、客室グレードなど複数のデータを比較しながら調べたいものに有効だ。
seabornで様々な視覚化を行いながら、詳細を明らかにしていく。countplot, FacetGridなど各図の実際のデータでの使用場面が学べてためになる。
・株式市場
普段から株式の取引をしているわけでないのであまりなじみがなかったが特に問題なし。
最新の株価データを取得して比較やリスク予測などの計算を行う。10日、20日、50日の移動平均線が簡単に描けるのが便利。pairplotで総当たりで相関を見れるのが使えそう。
DataReaderやrolling_meanなど、モジュールのインストール方法やメソッドの場所が最新版と異なるが、すぐにQAを見て簡単に解消が可能。
・選挙とデータ解析
選挙の支持率の推移と寄付金の額の推移を調べる。これまた、ほとんど興味はないが特に問題なし。やれば楽しく進めれる。
解析を進める上で、関係ない情報を排除しながら、注目すべきデータの視覚化を行っていくところが参考になる。
これにて、セクション9完了。
■セクション10:機械学習
・線形回帰
もっとも簡単な機械学習、Bostonの住宅価格のデータを使って学習を行う。sklearnはopencvや、pysparkでも使用したのでスムーズに進めれている。
■次は
セクション10:機械学習を完了させ、受講を完了する。
このコースへのリンク
【世界で5万人が受講】実践 Python データサイエンス
全般ランキング