失速。疲れか、やたらと週末寝てしまった。
■セクション4:Pandas入門
統計量の一括計算、describe。
ん、これはやった気がする。pysparkのところで多用した気がする。
Pandas, pyspark共にDataFrameがある。位置づけ的には同じ感じだ。
微妙にmethodやできることは違うようだ。
今度調べてみたい。
欠損値の取り扱いに関して。削除したり、指定した値で埋めたりすることができる。この辺りは、実際のデータ解析でもプレ処理のデータクレンジングの際に使いそうだ。地味に面白い。
■次は
セクション4:Pandas入門のつづきを学ぶ。
このコースへのリンク
【世界で5万人が受講】実践 Python データサイエンス
全般ランキング
【このカテゴリーの最新記事】
- no image
- no image
- no image
- no image
- no image