はじめに
ひさしぶりの更新となりました。
なかなかまとまった時間を作ることができず、、、
何に時間が割かれていたかというと、
本日のタイトルにもある「 テキスト解析 」です。詳細は後程。。。
さて、 日経平均株価 は現在も 堅調に推移 しており、
世界的に見ても、 日本株の急上昇 感が目立 ってきています。
今週には トランプ大統領 が東アジア諸国を 訪問 とのことで、
北朝鮮とのリスクも気になるなかです。
決算発表時期とあり、結果によっては上げ下げの激しい展開となっているように感じられます。
テキスト解析
テキスト解析とは
本題に入る前に、テキスト解析と一言でいうとジャンルが広すぎますね。
テキスト解析というと何を思い浮かべるでしょうか?
「文章要約」「翻訳」「文章分解」、、、こんなところの
大まかなジャンルが「テキスト解析」 に分類されている感じです。
では、 今回取り上げるテキスト解析とは何を指すのか?
それは、ずばり「 文章分類 」です。
なんじゃそれは 。 どのように投資につながるんだ 。という話ですよね。
次から順に説明してきます。
文章分類とは
文章分類とパっと言われても、という感じでしょうか。
身近でわかりやすい例 としては、 Yahooニュース の
ジャンル分けではないでしょうか。
経済、エンタメ、、、などのタブ に記事が
分類していますよね。あの 分類を機械的に
行いましょうというのを文章分類と考えていただければ。。。
実際には、手法などによって方向性が異なってきますが、
詳細は各個人で調べていただければと思います。
今回は トピックモデル と呼ばれる手法を用います。
トピックモデル
自然言語処理の基礎的な手法 です。
自然言語処理とは、流行りの言葉で表現すると、
AI(人工知能) です。この言葉なら知っているという方は多いのではないでしょうか。
私は何でもかんでも人工知能というのもどうかなと
感じながら。まあそんなに拘りがあるわけでもないですが。
自然言語処理の手法の中でも、言葉の意味やつながりに
重きを置くのではなく、 統計的に扱う手法 と考えられます。
※言葉の意味を用いる応用手法も数多く存在するので、一概には言えないですが、、、、
今回は数式などは扱わないです。
概念も正直ほかのサイトのほうがわかりやすいので、
その紹介だけでも良いですかね。。。
・ 自然言語処理による文書分類の基礎の基礎、トピックモデルを学ぶ
とりあえず、上記サイトで一通りの概念はわかるはずです。
さらに 踏み込みたい場合 は、 機械学習の決定版 といっても過言ではない、
パターン認識と機械学習 がおすすめです。
パターン認識と機械学習(上) ベイズ理論による統計的予測 [ クリストファー・M.ビショップ ]
価格: 7,020円
(2017/11/5 11:35時点)
感想(0件)
パターン認識と機械学習(下) ベイズ理論による統計的予測 [ クリストファー・M.ビショップ ]
価格: 8,424円
(2017/11/5 11:35時点)
感想(0件)
テキスト解析を投資につなげる
正直、長くなりすぎたため、次に続きます。と書きたいところですが、
書きはじめてしまったので、書き続けます。
トピックモデルとどのように投資に応用するか
おそらく、これが本題であり、皆さんが最も求めている情報と思います。
例えば、 投資情報誌で電気自動車・フィンテック伸びてます。
などと書かれていた場合、 実際に伸びているの?市場の反応は?
と感じたことはないでしょうか?
ここで、トピックモデルを用いた文章分類を用いることで、
本当に伸びているのか?関連のニュースはないのか?といったことができる予定です。
実際には、 カテゴリを指定して関連情報を取得 するのは、
単にトピックモデルを用いるだけではできない ため、
直近のニュースから話題となっているカテゴリ を探ることを行い、
株式投資に役立てていきたいと思います。
手法などは、 長くなりすぎたので次回!
【このカテゴリーの最新記事】
- no image
- no image
- no image
- no image
- no image