アフィリエイト広告を利用しています

広告

posted by fanblog

2019年09月17日

【5日目成果】 英語版Udemy講座で学ぶ!SparkとpythonでBig Data解析






Logistic Regressionの学習を進めている。
疲れ気味のため、進捗が少ない。
模擬プロジェクト練習問題に入る前の知識の確認中。
Logistic Regressionの学習中に気が付いた点を2点メモしておく。

1、DataFram.head()と head(1)を実行した結果が微妙に違うのに気が付いた。

・df.head() →Rowオブジェクト
・df.head(1) →Rowオブジェクト1個の配列

先頭データの内容を表示する際にforループする際にはそれぞれ

・df.head()の場合
 ・for i in df.head():print(i)

・df.head(1)の場合
 ・for i in df.head(1)[0]:print(i)

とする。

2、Pipelineをインポートする際に"pipeline"(全部小文字)が選択肢に出てくるが、
これは使わず"PipeLine"を使うこと。

×:from pyspark.ml import pipeline

〇:from pyspark.ml import Pipeline

10分くらい時間をロスしてしまった。
うーん、紛らわしい。

このコースへのリンク
Spark and Python for Big Data with PySpark






全般ランキング

この記事へのコメント
コメントを書く

お名前: 必須項目

メールアドレス:


ホームページアドレス:

コメント: 必須項目

※ブログオーナーが承認したコメントのみ表示されます。

この記事へのトラックバックURL
https://fanblogs.jp/tb/9208564
※ブログオーナーが承認したトラックバックのみ表示されます。

この記事へのトラックバック
検索
<< 2021年12月 >>
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31
最新記事
タグクラウド
カテゴリーアーカイブ
月別アーカイブ
プロフィール
peter3qさんの画像
peter3q
エンジニアとして働いている40代の会社員です。 仕事でメインに使用している言語はC/C++です。 プライベートでは、大学生の息子と中学生の娘がいて、 週末、料理をし、毎年、梅シロップを付けています。
×

この広告は30日以上新しい記事の更新がないブログに表示されております。

Mobilize your Site
スマートフォン版を閲覧 | PC版を閲覧
Share by: