傀儡師の館.Python

傀儡師の館.Python

PR

Calendar

Keyword Search

▼キーワード検索

Archives

2024.06
2024.05
2024.04
2024.03
2024.02
2024.01
2023.12
2023.11
2023.10
2023.09

Profile

kugutsushi

kugutsushi

Free Space

設定されていません。
2007.11.27
XML
カテゴリ: ことばの処理
岐阜大学、池田研究室 日本語文節構造解析システムibukiC を公開していた。まだ、version0.10 ということだが、おもしろそう。


   「食べたのが悪かったようです」
は、
  (食べる Φ た Φ Φ Φ Φ 連体)
  (Yの Φ が Φ Φ Φ Φ 連用)
  (悪い Φ た Φ Φ ようだ Φ Φ 文末)
のように解析されます。この要素分割も辞書記述で設定します

辞書記述でいろいろできるということかな。 このあたりに説明がある 。形態素解析の ibukiK、文章構想解析の ibukiC、構文解析の ibukiS となっていて、公開されているのは ibukiC だから、係り受けの木まではできないのか。まあ、でも、こういうものが公開されるとは、良い時代になったものだ。

日本語係り受け解析器 CaboCha/南瓜: Yet Another Japanese Dependency Structure Analyzer の文節の切り方と比べるとどんな具合なのだろうか。ibuki の場合、「機能的・意味的内容から設定した6つの要素部に分割」というところで、おもしろい用途が考えられるかもしれない。

言語処理学会 第10回年次大会 プログラム とか見ると「長単位の機能語を辞書に持たせた文節構造解析システムibukiC」とか、 言語処理学会第12回年次大会(NLP2006)本会議プログラム とか、 言語処理学会第13回年次大会(NLP2007)本会議プログラム とかで発表しているようだが、ネット上の資料はあまり引っかかってこない。

「言語・認識・表現」第12回年次研究会 鳥バンク (Tori-Bank) すげっ で書いた 鳥バンク の「「CREST研究の成果と今後の課題」 池原悟 鳥取大学」とかの発表もあるようだ。

検索していたら、 1文字未知語を核とする未知語候補の抽出 なんてものが見つかった。ibukiC の辞書は貧弱だが、「語「川崎フ」などが未知語として、抽出できていた」らしい。その後、辞書はどうなったのかな。まあ、ダウンロードして見れば分かるか。

しかし、試したいものスタックがどんどん膨れあがってくる。。。。。


なかのひと






お気に入りの記事を「いいね!」で応援しよう

Last updated  2007.11.28 02:28:30
コメントを書く


【毎日開催】
15記事にいいね!で1ポイント
10秒滞在
いいね! -- / --
おめでとうございます!
ミッションを達成しました。
※「ポイントを獲得する」ボタンを押すと広告が表示されます。
x

© Rakuten Group, Inc.
Mobilize your Site
スマートフォン版を閲覧 | PC版を閲覧
Share by: