傀儡師の館.Python

傀儡師の館.Python

PR

×

Calendar

Keyword Search

▼キーワード検索

Archives

2026.05
2026.04
2026.03
2026.02
2026.01
2025.12
2025.11
2025.10
2025.09
2025.08

Profile

kugutsushi

kugutsushi

Free Space

設定されていません。
2003.01.12
XML
カテゴリ: ことばの処理
扇風機みたいに首を振るやつへんなハロゲンヒーターを通販で買った。エアコンよりすぐにあったまるのがいい。マイナスイオンが出るとかいうが、出ても出てなくても分からん。そういう怪しいものが時々欲しくなるので困る(^^;;

tripod に 傀儡師研究室 を作ってみた。プログラムはここでやると面倒なのでまとまったものは研究室の方においてダウロードできるようにしようかなと思って。ただし、中身はまだない。こちらがメインなので(ポップアップ広告がうざいから)、たぶんあっちらに何か置いたらここに書き込むので今のところ見る必要なし。 あっちの日記 は、何かものをおいたときだけ書き込む。

○ 人称書き換えの準備 (Python で人工無能)

あなたとわたしから始めると(2003/01/08 の日記) で、あなたとわたしの書き換えをやってみようということを書いた。でちょっとまたソースを書く前に、簡単な擬似コード(実際には動かないが、プログラムの概念を自然言語なので擬似的に書いたもの)で表すと、次のようになる。

for 一つの形態素解析情報 in 形態素解析結果のリスト:
if ’原形’ ] ==:
「私」を「あなた」に書き換える
elif 形態素解析情報[ ’原形’ ] == ’あなた’ :
「あなた」を「私」に書き換える
else :
なにもしない



また「わたし」「あなた」の関係は中立的だけれども、あなたとわたしの関係自体、あるいは自らの存在の出自が「私」あるいは「あなた」の表現によって語られることになる。なんか、そういうものをまとめて辞書からとってこられるといいのだが・・・。

MeCab の解析結果をちょっと見てみよう。

お前は誰だ。
お前 名詞,代名詞,一般,*,*,*,お前,オマエ,オマエ
は 助詞,係助詞,*,*,*,*,は,ハ,ワ
誰 名詞,代名詞,一般,*,*,*,誰,ダレ,ダレ
だ 助動詞,*,*,*,特殊・ダ,基本形,だ,ダ,ダ
。 記号,句点,*,*,*,*,。,。,。
EOS
私は誰だ。
私 名詞,代名詞,一般,*,*,*,私,ワタシ,ワタシ
は 助詞,係助詞,*,*,*,*,は,ハ,ワ
誰 名詞,代名詞,一般,*,*,*,誰,ダレ,ダレ
だ 助動詞,*,*,*,特殊・ダ,基本形,だ,ダ,ダ
。 記号,句点,*,*,*,*,。,。,。
EOS
あたしは誰。
あたし 名詞,普通名詞,*,*,あたし,あたし
は 助詞,副助詞,*,*,は,は
誰 名詞,普通名詞,*,*,誰,た
。 特殊,句点,*,*,。,。
EOS


一応、名詞-代名詞という枠組みがあるものの、人称代名詞という分類もないし、ましてや、一人称、二人称なんて分類もあるはずがない。しょうがないので、やっぱりこれは、シソーラス辞書として持たせる必要があるな。それにしても「私」は名詞-代名詞で、「あたし」は名詞-普通名詞であるところがなんともいえないなぁ。「は」も助詞-係助詞が、助詞-副助詞になったりしてるな。あ、そっか、「だ」が最後にないからか。


あたしは誰だ。
あたし 名詞,代名詞,一般,*,*,*,あたし,アタシ,アタシ
は 助詞,係助詞,*,*,*,*,は,ハ,ワ
誰 名詞,代名詞,一般,*,*,*,誰,ダレ,ダレ
だ 助動詞,*,*,*,特殊・ダ,基本形,だ,ダ,ダ
。 記号,句点,*,*,*,*,。,。,。
EOS


ふーむ。けっこう微妙なのだな。

ちなみに、JUMAN 辞書を使ったら、「私」の読みが「あたい」になっているな(^^;;。「誰」も普通名詞になっていて、やはりこのあたりも違うのだな。「だ」も助動詞ととるか、判定詞ととるかで違っている。ん、JUMAN辞書で「アタシは誰」とやったら、文字化けしてしまったな。未知語が化けてるのかな。dicrc も shift_jis にしてみたらなぜか化けなくなった。「`語」とかなるけど。まあいいや。


私は誰だ。
私 名詞,普通名詞,*,*,私,あたい
は 助詞,副助詞,*,*,は,は
誰 名詞,普通名詞,*,*,誰,た
だ 判定詞,*,判定詞,基本形,だ, だ
。 特殊,句点,*,*,。,。
EOS




hitodic = {’私’:[’わたし’,’私’,’わたくし’,’あたし’,’アタシ’,’僕’,’我’、’俺’、’僕’、’あたし’、’アタシ’、’あたい’、’手前’、’朕’], ’あなた’:[’お前’, ’君’, ’あんた’, ’そち’, ’わらわ’, ’オイラ’, ’ワテ’,’ワシ’]}

ただし、「僕ちゃん」みたいのは「僕」+「ちゃん」で解析されてしまう(というか、これはそれでしょうがないが)、妾(わらわ)なんかは、普通名詞で解析されるから、ちょっと本来同じ枠組みでできないのだが、まあ、とりあえず、このあたりはおいおいやっていけばいいか。

とにかく、’私’の辞書のリストにある単語がきたら、それは「私」なので、人工無能の中に入るとそれが「あなた」に置き換わる。「あなた」は人口無能自体のことを指すので、出力されるときには「私」に置き換わる。まあ、それだけでも最悪いいだろう。英語だと I と You の置き換えだけだから楽なのだけど (変化形はあるものの)、日本語はよけいなところで苦労するな。で、とにかく、次はこのリストを使って人称の変換をする。





お気に入りの記事を「いいね!」で応援しよう

Last updated  2006.09.12 20:26:24
コメントを書く


【毎日開催】
15記事にいいね!で1ポイント
10秒滞在
いいね! -- / --
おめでとうございます!
ミッションを達成しました。
※「ポイントを獲得する」ボタンを押すと広告が表示されます。
x
X

© Rakuten Group, Inc.
X
Design a Mobile Site
スマートフォン版を閲覧 | PC版を閲覧
Share by: