One of my favorite things is ...

2019.08.30
XML
カテゴリ: データ分析
​​​​​ ​​​​​​​​ 楽天市場ランキング上位のレディース・ボトムス、「zootie:エアパンツ」の商品レビューの分析をしました。レビュー数は、17,000件を超えていますが、今回はスクレイピング可能な1500件のうち510件のレビューデータを取得しました。

 「購入した回数」では、「リピート」というレビューが189件となっていて、「はじめて」よりも多くなっています。




▼レビューの日付の分布

 レビューの日付の分布を見ると、公開されているレビューは、過去2年間のものであることがわかります。春、夏、秋のレビューが多いようなので、春、夏、秋に向いているパンツであることがうかがえます。









 スクレイピングデータでも、全体のデータと同様に30代~40代がユーザーの中心になっています。




▼「購入した回数」別のレビュー件数:「リピート」の方がやや多くなっています



「購入した回数」が「はじめて」のレビューの「見出し」





「購入した回数」が「リピート」のレビューの「見出し」



 以下は、「ユーザーローカル テキストマイニングツール( https://textmining.userlocal.jp/ )で分析」

▼「購入した回数」が「リピート」(n=189)のレビュー中の単語によるワードクラウド



▼「購入した回数」が「リピート」のレビューでの単語の出現頻度

 名詞で「デニム」「ブラック」といった単語の出現頻度が高いのは、「リピート」で購入した商品のことのようです。

 動詞では、「伸びる」の出現頻度が高くなっています。

 形容詞で出現頻度が高い「やすい」は、「はきやすい」「うごきやすい」などの一部のようです。




▼「購入した回数」が「リピート」のレビューの単語の共起分析

 単語の共起分析では、「履く(はく)」と「やすい」、「動く」と「やすい」、「心地」と「良い」、「ストレッチ」と「きく」、「違う」と「色」と「欲しい」などの共起関係が見られます。




▼「購入した回数」が「リピート」のレビューの単語の2次元マップ




▼「購入した回数」が「リピート」のレビューの単語の「係り受け分析」








▼「購入した回数」が「リピート」のレビューの単語の階層クラスター分析

 「心地」「よい」といった単語と、「生地」「ストレッチ」といった単語が近い関係にあることがわかります。



今回、商品レビューを分析したパンツでは、色違いを複数そろえている人も見られました。「リピート」が多いということは、この商品に対する利用者の満足度の高さを示していると思います。




▼「利用者サイズ」の項目のあるレビューが含まれていたので、Rコードの変更が必要でした

 「ファッション」ジャンルの商品のスクレイピングは、今回が初めてですが、以前のレビューには、「利用者サイズ」という項目がありました。そこで、「利用者サイズ」の項目を設けて、コードを変更しています。

 いずれ、古いレビューは表示されなくなるはずなので、1500件以上のレビューがある場合は、この変更も不要になると思われます。

 試行で書き出したcsvファイルには、<U+00A0>という文字列が見られました。これは、 Unicodeの「 ノーブレークスペース」だそうで、確かにページのソースにその文字列があったので、コードで削るようにしました。



▼【再改訂版コード】:「R言語」による楽天市場の商品レビューのスクレイピングコードの再改訂版:グラフ作成コードなどを追加:「素焼きアーモンド」の商品レビューのデータを取得:意外と多い「はじめて」の購入

▼「R言語」による楽天市場の商品レビューのスクレイピングコードの改訂版です:Excelで項目を切り分ける作業が不要になりました

▼楽天市場の
特定の商品のレビューを「R言語」でスクレイピングするコード:一部の項目の空欄・欠損値(missing values)を「NA」に置き換えてデータフレームを作成:継ぎはぎのコードですが・・・


▼JPRiDEの新モデル・完全ワイヤレスイヤホン「JPRiDE TWS-520」のアマゾン・カスタマーレビューのテキストを分析

▼「JPRiDE」ブランドのワイヤレスイヤホン「JPRiDE 708」の楽天市場のレビューのテキストを分析:ReviewMetaでアマゾンのカスタマーレビューの信頼性の高さを推定できるJPRiDEの製品 ​​

▼雑誌など第3者の高評価をアピールしている「JPRiDE(ジェイピー・ライド)」ブランドのワイヤレスイヤホン「JPA2」の楽天市場のレビューのテキスト分析です


▼JVCケンウッドの高評価イヤホン「HA-FX3X」とソニーの「MDR-EX450」のカスタマーレビューを比較

▼3000円クラスの高評価イヤホン「HA-FX3​のカスタマーレビューのテキスト分析を「User Local」の「AIテキストマイニング」で行ってみました:こんな分析ツールがあったとは、驚きです

▼カスタマーレビュー分析で、Microsoft Power BIの「Word Cloud」とスライサーの組み合わせは便利です:3000円クラスで、高評価のイヤホン「HA-FX3X」のカスタマーレビューのテキスト分析

▼アマゾンのカスタマーレビューを購入の判断材料にする場合、「ReviewMeta」(レビューメータ)によるチェックが役立ちます


​▼先日購入したイヤホン「HA-FX3X」のアマゾン・カスタマーレビュー分析:低音の良さ、コスパなどが高評価の理由のようです​:3000円クラスで、高評価のイヤホンです​
 ​​​​​​ ​​


[商品価格に関しましては、リンクが作成された時点と現時点で情報が変更されている場合がございます。]

Rではじめるデータサイエンス [ Hadley Wickham ]
価格:4320円(税込、送料無料)  (2019/9/14時点)





​​ ​​





お気に入りの記事を「いいね!」で応援しよう

Last updated  2019.11.07 16:55:14
コメント(0) | コメントを書く


【毎日開催】
15記事にいいね!で1ポイント
10秒滞在
いいね! -- / --
おめでとうございます!
ミッションを達成しました。
※「ポイントを獲得する」ボタンを押すと広告が表示されます。
x
X

© Rakuten Group, Inc.
X
Mobilize your Site
スマートフォン版を閲覧 | PC版を閲覧
Share by: