傀儡師の館.Python

傀儡師の館.Python

PR

Calendar

Keyword Search

▼キーワード検索

Archives

2024.09
2024.08
2024.07
2024.06
2024.05

Profile

kugutsushi

kugutsushi

Free Space

設定されていません。
2007.06.22
XML
カテゴリ: 考える
ブログの文章を内容によって色分けする を読む。

この記事の中で紹介されている 「emo+beer = busted career」 を見ておもしろいなと思った。ひとつは、Informative, positive, negative, jokes という分類。やはり、ネガティブポジティブだけに分類するのは、そもそも無理があるから、ネガポジ以外をどう扱うかというところで、Informative と jokes を持ってきたところ。だいたいニュースの類と、それをリピートするだけのページは Informative になって、それなりの量になるだろうという自分の著観的な認識と一致するような図になっている。

以前に オートバイテルと blogWatcher、クチコミ分析 で、



と書いたが、積極的にネガポジ以外を明示すると、 「emo+beer = busted career」 のようになるのだろう。

図を見ていて、ふと頭に浮かんだのがデフラグの画面。そして、特定のブログを取り上げたときの、継続的興味対象と単発的興味対象。俺マイニングをするときには、特定の単語の初出年月日、その後の取り上げ方の継続状況をみるとおもしろいのかもしれない。Oxford English Dictionary (OED)を自分のテキストだけで作った感じ、言葉を取り上げて、年代ごとに用法が入っているような。考えてみると、自分の検索やテキストマイニングあるいはコーパスのイメージに与えている OED の影響って大きいのだなと思う。大学時代、初めて OED を使ったときに、なんでこういうものが日本にはないんだろうって思ったのが、この方面に対する興味の始まりだったのかもしれない。






お気に入りの記事を「いいね!」で応援しよう

Last updated  2007.06.23 02:25:45 コメントを書く


【毎日開催】
15記事にいいね!で1ポイント
10秒滞在
いいね! -- / --
おめでとうございます!
ミッションを達成しました。
※「ポイントを獲得する」ボタンを押すと広告が表示されます。
x

© Rakuten Group, Inc.
X
Design a Mobile Site
スマートフォン版を閲覧 | PC版を閲覧
Share by: