PR
Calendar
Keyword Search
Category
Free Space
mecab-ipadic-NEologd は形態素解析エンジン MeCab と共に使う単語分かち書き辞書で、週2回以上更新更新され、新語・固有表現に強く、語彙数が多く、しかもオープンソース・ソフトウェアである という特徴があります。
mecab-ipadic-NEologd には以下のような4つの特徴があります。
- IPADIC では複数の形態素に分割されてしまう固有表現を採録
- 毎週 2 回以上更新
- Web上の言語資源を活用して更新時に新しい固有表現を随時追加
- ライセンスが Apache License, Version 2.0
を実行すると、「正規化したい文字列0-90-9A-ZA-Za-za-zドドーン」となる。よさそうなので、使ってみることにした。
import neologdn
s = neologdn.normalize("正規化したい文字列0-90-9A-ZA-Za-za-zドドーーーーン")
print(s)
koreworomajinihenkanshitene となる。MeCab 使ってやってもいいんだろうけど、とりあえず、これでいく。
import amasakasu
from amasakasu import kana2romaji
s = "コレヲローマジニヘンカンシテネ"
s = kana2romaji(s)
print(s)
Arduino のシミュレーターの記事を読んで 2017.08.26
NanoPi NEO の自作ネットワーク監視装置 1 2017.08.24
NanoPi NEO に LEDアレイと LCD を付けて… 2017.08.22