進捗 54%
進みが全体的に良くないので予定通り終わるか分からなくなってきたが、3連休で挽回したいところ。
新しいPCも来て、スピードアップしたいところだが、新PCのキーボードが打ちにくくスピードがアップできてない。
■セクション7:データ解析の基礎 その3
このセクションではデータをグループとしてまとめて処理したり、データをひとまとめにして、最大、最小値を求めたりのアグリゲーションを学ぶ。
そろそろ、ソースの手入力もそろそろ限界を感じてきたので、urlとか入力のDataFrameなどのを作成する場合は、予め用意されているnotebookをコピペさせてもらうようにして、進めるようにした。
Groupby
データをグループとしてまとめて処理を行う方法。すでに頭がパンク状態であるので、そんなことができるんだ、ふーん、といった感じで進める。きっとそのうち、必要になったらまた勉強するでしょう。
データのアグリゲーション他
実際のデータを用いた解析が始まり、面白くなってきた。
アグリゲーションはsqlの勉強の際もやったcountとかmaxの組み込み関数的な感じだが、自分でもかってに関数を作れる。
describe()の結果が、講義動画と違うが、stack関数を呼ぶと大体同じになる。また、sort関数でエラーが出るが、最新ではsort関数はsort_values関数になっているとのことで、そちらを使えば問題解消。
最後のクロス集計表もサラッと終わらせて、これにてセクション7は完了。
■次は
セクション8:データの可視化を進める。
このコースへのリンク
【世界で5万人が受講】実践 Python データサイエンス
全般ランキング
タグ: pandas
【このカテゴリーの最新記事】
- no image
- no image
- no image
- no image
- no image