傀儡師の館.Python

傀儡師の館.Python

PR

Calendar

Keyword Search

▼キーワード検索

Archives

2024.06
2024.05
2024.04
2024.03
2024.02
2024.01
2023.12
2023.11
2023.10
2023.09

Profile

kugutsushi

kugutsushi

Free Space

設定されていません。
2008.08.26
XML
カテゴリ: ことばの処理
ちょっと今、時間がなくてできないのだが、Yahoo! が日本語係り受け解析のWebサービス APIを公開したのね。 ヤフー、係り受け解析と指定形容詞係り先検索をWebサービスで提供

Yahoo! 日本語係り受け解析Webサービス を使って、 ヤフーの日本語係り受け解析APIとサンプルプログラム「なんちゃって文章要約」 なんて作っている方がいらっしゃる。修飾はバッサリ省いちゃうのね。プログラムは Perl で書かれている。

Python だと inforno の方が Python版Yahooテキスト解析 APIライブラリを日本語係り受け解析に対応させました ってあるので、そのうち使わせていただこう。

ちなみに XREAで好きなバージョンのPythonを使う方法 があるらしいので、これも参考にさせてもらう。



bbfreeze でバイナリ化して動かしてしまえばいいのね。とか書きながら、いつまでたっても XREA の方は放置したままだな。

Yahoo! 指定形容詞係り先検索Webサービス がおもしろくて、「うれしい」「おもしろい」「すごい」「たのしい」「かっこいい」「かわいい」「きれい」「おいしい」の 8つの形容詞が係る単語を返してくれるのね。形容詞の数が限られているから、使い方は限定されるだろうけど、こういうのがサービスとして提供されるというのがおもしろい。ちなみに、「うれしい」の指定だと「うれしい」「嬉しい」「ウレシイ」といった異表記でもちゃんと扱ってくれるらしい。形容詞の数が限定されているから、用途も限られるがお手軽なのでよいかも。もっとも、ローカルでやるなら ctypes で CaboCha を使う みたいにすればいいのだけど、指定形容詞係り先検索Webサービスみたいに、形容詞を指定して係り先を抽出して分析してみるとかやるとおもしろいかな。 日本語係り受け解析器 Cabocha 0.60 pre2 ちょっと使う あたりも参照。

かな漢字変換Webサービス を使った例も見つけた。 Yahoo変換 (sokoide.com/)

そう言えば、 ロイターのセマンティックタグサービスAPI Calaris ってどうなったかな。10月あたりはこのあたりチャレンジしてみるかなぁ。

最近、自然言語系をやっていなかったが 形態素解析辞書UniDic も 7/16 に 1.3.9 がリリースされているので、MeCab版辞書が使えるので試してみようと忘れていた。UniDic の特徴は、

  • 国立国語研究所で規定した「短単位」という揺れがない斉一な単位で設計されています。
  • 語彙素・語形・書字形・発音形の階層構造を持ち,表記の揺れや語形の変異にかかわらず同一の見出しを与えることができます。(詳しくはこちらのページをご覧ください。)
  • アクセントや音変化の情報を付与することができ,音声処理の研究に利用することができます。
  • 詳しくは多様な目的に適した形態素解析システム用電子化辞書の開発(PDF)をご覧ください。

ということらしいので、IPA辞書使うよりよいはずで試そう試そうと思いつつ。。。。なのだ。せっかく税金を投入して公開してくれているものなんだから使わないともったいないよね。読み上げなんかさせる場合も、 GalateaTalk Demo 玄箱galatea再挑戦 なんてやっている方がいらっしゃる。

近代文語UniDic も公開されていて、これも試したいところ。普通に近代文語を形態素解析にかけると、あまり良い結果が得られないけど、これならいけそうね。ただし、「主として近代の論説文を対象としています。現在のところ,文学作品などでは必ずしも良い解析結果が得られません。」らしいけど。

Python の統合開発環境に関して

Aptana Acquires Pydev to add Python Support to Studio で、 Aptana Pydev か。そのうち試してみるかな。NetBeans の nbpython は、まだ完成度低いし(参考: NetBeans が Python/Jython に対応 nbpython M4.2 では ipython の Console が使えるようだ

PyScripter は PyScripter で UnitTest を自動で生成 なんてできるのね。 Python開発統合環境の決定版! PyScripter(for Windows)の紹介 あたりも参照。 PyScripterの日本語化 も進んでいるのね。Windows 環境に限って言えば、これが一番お手軽だろうけど。 Python のスレッドについての資料と Python の統合開発環境 (IDE) なども参照。

でも、いろいろ試す割には、ipython とテキストエディタが多い私。たいしたもの作らないし。統合環境って、人のソースを見るときだけ使うことが多い。けど、このところ、あまりソースも見ないし、作ってない。

その他、あれこれ

最近、次から次へと、ニュース等のヘッドラインが流れてきて、それを見た人間が、どのような印象を持つようになるかに興味があったりする。 「勝手にブログ評論」から脱線 あたりも参照。

行動経済学 - 経済は「感情で動いている」 経済は感情で動く を読み始めた。



ニュースのヘッドラインといえば、見出しに非常に気合いを入れて定評があるらしい カレーを食べて記憶力アップ…アルツハイマー予防に期待 とか読売新聞が記事を出しているけれど、 新聞記事が信用ならないという例 なのだな。読売新聞やっちゃったね。

「カレーを食べて記憶力アップ」は伝言ゲームだった (PSJ渋谷研究所X) や、 カレーに使われるスパイス「ターメリック」には記憶力アップの効果アリ (slashdot) なども参照。 私家版「ニセ科学用語の基礎知識」β1 (PSJ渋谷研究所X) とかもおもしろい。

カレーで記憶力アップなんて、 発掘!あるある大事典 が生き残っていれば飛びつきそうなネタだったか。惜しかったなぁ。あるあるが生き残っていれば、効果があるって実験結果出してくれたろうにw

マスコミって、刺激的なヘッドラインを求めて、間違いを犯し続けるのだなぁと改めて思う今日この頃。断片的な情報を元に頭の中に何かを適当に組み立てて投資行動に移ったとき、いわゆるノイズトレーダーとなるわけだが、ノイズトレードを盛り上げるのもマスコミの目標とするところ。株価が上がろうが下がろうが、とにかく刺激が大きくなるようなヘッドラインを考えているんじゃなかろうか。受ければ間違っていても構わないって?


なかのひと Firefox meter 携帯アクセス解析






お気に入りの記事を「いいね!」で応援しよう

Last updated  2008.08.27 07:54:47
コメント(4) | コメントを書く


【毎日開催】
15記事にいいね!で1ポイント
10秒滞在
いいね! -- / --
おめでとうございます!
ミッションを達成しました。
※「ポイントを獲得する」ボタンを押すと広告が表示されます。
x

© Rakuten Group, Inc.
Mobilize your Site
スマートフォン版を閲覧 | PC版を閲覧
Share by: