もっと活用したい! 日本語ドメイン

Internet Explorer 7 も正式リリースされ、主なブラウザは全て日本語ドメインへ対応してきました。 当サイトでは、日本語ドメインの一層の普及を目指し、実際に日本語ドメインで運営するのはもちろんのこと、 様々な運用実験を試みていきます。

日本語ドメイン取得.com

Nameprep, Stringprep (文字列前処理)

Nameprep は、 国際化ドメイン名を一意の ASCII 文字列への変換および逆変換を実現するために、 Stringprep として与える変換表での処理方法を示したものである。具体的に、 使用するのは Unicode 3.2 であるとか、 正規化様式には KC (normalization form) を使用するという枠組みなどが規定されている。

Unicode では、何故に正規化という作業が必要なのか、その理由を簡単に挙げてみよう。

日本語ではあまり馴染みはないが、Unicode ではウムラウトなど発音記号が前進を伴わない文字として定義されている。 このようなコードを複数使う場合、全く同じ文字を表現する異なったデータの並びが存在することになる。

文書として読む分には何の問題もないだろう。しかし、コンピュータの世界では、 しばしば2つの文字列を比較しなければならない場面に遭遇する。こういった状況では、 異なったコードの並びは別の文字列として判定されてしまうのである。この問題を解決するには、 コードの並びを規則に従って統一しなければならない。これが正規化といわれるものである。

また、【タヌキ】⇔【夕ヌキ】、【が】⇔【か゛】⇔【か゜】 を見比べて欲しい。 ここでは並んでいるので区別することが出来るだろう。見た目が類似してしまう問題は ASCII にも存在する。 「タヌキ」 側の問題への対処は、その文字列の意味合いとして全く別物なので難しいだろう。しかし、 「が」の問題はどうだろうか? 意味合いとしても統一されるべきものといえる。同様に、 全角の英数字と ASCII 文字を別ものとして扱った場合、類似した文字列が増えるだけである。

このようなコードの変換方法や、未割り当てや使用禁止といったコードを具体的に定義したのが Stringprep である。Nameprep では、この Stringprep に挙げられた内容を全て実装しなければならないと規定されている。 これが定められたことによって地域や言語によらず、一意な変換が可能になったといえる。 もちろん Nameprep と同様に Stringprep もドメインを変換するためだけに定められたものであり、 通常の文字列を処理するために使用するべきではないと明言されている。このことは、 全ての空白文字が禁止されていることからも判る。

日本語ドメインとは
取得するには
日本語ドメインの運用
国際化ドメインの仕組み
文字コードについて

ツール一覧

システム
サブドメイン形式 多機能
短縮 URL システム
サポート掲示板

トップページ
ブログ
topics archive