【5日目成果】英語版Udemy講座で学ぶ！SparkとpythonでBig Data解析: Udemyで技術習得！気の向くままにのんびりと

検索

最新記事

(12/12) Udemy安くなっています！(12/14まで)
Pythonでファイナンス分析の勉強（その６）
(05/18) Udemy最大セール中(-5/27)
(05/16) Pythonでファイナンス分析の勉強（その５）
(05/15) Pythonでファイナンス分析の勉強（その４）
(05/10) Pythonでファイナンス分析の勉強（その３）
(05/09) Pythonでファイナンス分析の勉強（その２）

タグクラウド

opencv Python SQL Unity 機械学習

カテゴリーアーカイブ

Udemy
Gitでチーム開発 (6)
SQLを学ぶ (8)
SparkとpythonでBig Data解析 (12)
ブロックチェーンと仮想通貨 (17)
pythonで画像認識 (13)
データサイエンス (14)
c# (30)
AWS (12)
pythonでファイナンス分析 (7)

月別アーカイブ

2021年12月 (1)
2021年05月 (9)
2019年12月 (19)
2019年11月 (30)
2019年10月 (33)
2019年09月 (31)
2019年08月 (3)

プロフィール

peter3qさんの画像

peter3q

エンジニアとして働いている40代の会社員です。仕事でメインに使用している言語はC/C++です。プライベートでは、大学生の息子と中学生の娘がいて、週末、料理をし、毎年、梅シロップを付けています。

プロフィール

RDF Site Summary

広告

posted by fanblog

<< 【4日目成果】英語版Udemy講座で学ぶ！SparkとpythonでBig Data解析 | TOP | 【6日目成果】英語版Udemy講座で学ぶ！SparkとpythonでBig Data解析 >>

2019年09月17日

【5日目成果】英語版Udemy講座で学ぶ！SparkとpythonでBig Data解析

進捗58%(+3%)

Logistic Regressionの学習を進めている。
疲れ気味のため、進捗が少ない。
模擬プロジェクト練習問題に入る前の知識の確認中。
Logistic Regressionの学習中に気が付いた点を2点メモしておく。

１、DataFram.head()と head(1)を実行した結果が微妙に違うのに気が付いた。

・df.head() →Rowオブジェクト
・df.head(1) →Rowオブジェクト1個の配列

先頭データの内容を表示する際にforループする際にはそれぞれ

・df.head()の場合
　・for i in df.head():print(i)

・df.head(1)の場合
　・for i in df.head(1)[0]:print(i)

とする。

２、Pipelineをインポートする際に"pipeline"（全部小文字）が選択肢に出てくるが、
これは使わず"PipeLine"を使うこと。

×：from pyspark.ml import pipeline

〇：from pyspark.ml import Pipeline

10分くらい時間をロスしてしまった。
うーん、紛らわしい。

このコースへのリンク
Spark and Python for Big Data with PySpark

全般ランキング

タグ：機械学習 SPARK Python

【このカテゴリーの最新記事】

posted by peter3q at 23:59| Comment(0) | TrackBack(0) | SparkとpythonでBig Data解析

この記事へのコメント

コメントを書く

この記事へのトラックバックURL
https://fanblogs.jp/tb/9208564
※ブログオーナーが承認したトラックバックのみ表示されます。

この記事へのトラックバック

共有

Build a Mobile Site

スマートフォン版を閲覧 | PC版を閲覧

15
16
17

ホーム
13
14
その他

Share by: