国際化ドメインの仕組み
ご存知の通り、インターネットの世界は ASCII コード、7ビットのデータを基本として成り立っています。
しかし、日本語は16ビットのコードで表されていますので、
そのままのデータをインターネット上に流しても元のまま目的地に到達する保証がないんですね。
「えぇ~? だって、メールはちゃんと届くじゃん・・・」
そうですね。でも、メールの中身をテキストエディタなどで見たことありますか?
何だかよく分らない文字が並んでいますよ。添付画像のデータなんか ASCII 文字の集合でしかありませんし・・・
そう、これはインターネット上に流しても大丈夫なように、あるルールにしたがって 7ビット にコード化したものなんです。
送り側が使用したルールが分れば受け側で元の日本語や画像データに復元できますよね。
ここで大事なのは双方がそのルールを知っていることです。メールの分野ではそのルールは標準化されてますので、
ほぼ問題なく日本語の遣り取りが可能になりました。
簡単に言ってしまえば、ドメインでも同じように 7ビット にコード化してしまえば良いわけですが、
様々な問題があってなかなか標準化には至りませんでした。が、こんにち、その指針も決定され、
いよいよ各所の対応を待つ状況となった次第です。(詳細は後述のページに記載していきます)
コード化の方法に採用されたのは Punycode (プニーコード) と呼ばれる方法で、
国際化文字の標準である Unicode (ユニコード) を現状のドメインで使用可能な
ASCII 文字の中のたった37文字で表現していきます。
例えば、当サイトのドメインは 日本語ドメイン取得.com ですが、これを実際にインターネットを流れるコードに変換すると
xn--eckwd4c7cy36u3zowmk0qcl32k.com
というドメイン名になります。直接これをブラウザに打ち込んでもアクセスできますが、
こんな不規則な文字の並びじゃとてもじゃないけど覚えられませんよね・・・
|