広告

posted by fanblog

2023年04月19日

utf8とutf8mb4



どちらにしても文字を登録できるので、

その違いを深く考えたことはなかった。


偶然、utf8では保存できないが、utf8mb4では保存できる漢字があることを知り、

その違いを調べてみた。



 utf8mb4 → 1〜4バイトまで対応


これを知らずにMysqlを使っていたことが恥ずかしい。

utf8のデータベースに保存できなかったのは「?」(口へんに七)。

「叱」のUnicodeは「U+53F1」(口へんにヒ)JIS規格の第1水準
「?」のUnicodeは「U+20B9F」(口へんに七)JIS規格の第3水準

しかるを漢字変換すると「叱」(口へんにヒ)が表示されるので、
「?」(口へんに七)を使用しなくければ良いだけのように思うが
「?」(口へんに七)を使わないとまずい場合もあるらしい。

試してみると、utf8mb4のデータベースには「?」(口へんに七)を保存できた。

同様の文字は他にもあるそうだ。
 補填のてん 「?」
 剥離のはく 「?」
 頬 ほお  「?」






【このカテゴリーの最新記事】

posted by db-engineer at 00:00 | Comment(0) | Mysql

この記事へのコメント
コメントを書く

お名前:

メールアドレス:


ホームページアドレス:

コメント:

※ブログオーナーが承認したコメントのみ表示されます。

Mobilize your Site
スマートフォン版を閲覧 | PC版を閲覧
Share by: