人気ブログランキング | 話題のタグを見る
【波型】 波ダッシュのナゾ
以下の2つの文章に、どんな違いがあるでしょうか。



 1.2009年7月~9月の、私の体重はおおよそ75キロだった。

 2.2009年10月〜12月の、私の体重はおおよそ80キロだった。






はい。体重が増えてますね。まあこれは事実で、どうにかせなあかんなー、と思っている所存ですが、そんな話ではなく、もう少し真面目な話題を。

 実はもう一つ違いがあります。「から」を示す波の形について、1は先に山が上がっているのに対し、2では先に下がっています。これね、1回気にしだすととても気になります。特にWindowsユーザは2の波ダッシュが綺麗に表示されないのでいらいらするのです。あ、この「~」は「にょろ」ではなく、「波ダッシュ」という名前がついています。

 で、先に言っておくと、違和感に気付けるのはWindowsユーザーだけだと思います。多分、macな人は体重の違いしか違いがないので、この先は読み飛ばしていただいても結構です。

 パソコンは、もともと英文字しか扱えない世界でした。大文字、小文字で52文字、いろいろな記号を入れても2の7乗にあたる128種類でコトが済んだのです。その後、1文字を表すのに1バイトという領域を確保することになりましたが、これは2の8乗、256種類の表現が可能になります。
 しかし、日本語を使用しようと思ったら、当然256個では足りません。このため、表現の領域を2バイトに拡張し、6万個分を確保しました。厳密に言うと、使えない領域もあるため、6万個全部というわけではないのですが、それでも日本語を表現するには十分な領域です。このほか、中国や韓国でも多くの文字の種類があります。ここら辺をいっぺんに括ってCJK(Chinese-Japan-Korea)文字と呼ばれますが、中国と日本の漢字には微妙な違いがあったりします。
 一気に話を飛ばしますが、インターネットの普及などで、これら世界中にある全ての文字を一つのコードで表現しないと大変なことになる、という事態に陥ったため、新たな文字コードの体型、Unicodeというものが生み出されました。これは日本と中国で本当に微妙な違いがある漢字も別々のものとして扱うことができるくらいの種類を確保できるようになりました。

 んで、そのUnicodeが、今回の波ダッシュの違いの原因を作り出している張本人です。日本では、JISという規格で漢字の一覧表が作られましたが、Unicodeを決めるのは海外の部隊。んで、どうしてそうなったのかわかりませんが日本語の縦書きの波ダッシュを90度回転させて、波ダッシュを「〜」(まず下がってから上に上がる)と定義したそうです。確かに、縦書きの場合は上が左に膨らんで、下が右に膨らむので、その縦書きを回転させて横バージョンにしたら、そうにしかならないのですが・・・因みに、Unicodeでは、「~」は全角チルダ、と呼ばれます。外国語の発音記号などに使われる「~」(チルダ)を日本語用に表現したもの、とでも言えばいいでしょうか。
 んで、私も愛用しているWindowsでは、波ダッシュをどう扱うか、としたときに、「下始まりはないだろう」ということで、波ダッシュも全角チルダも「~」にすると決めてしまったんだそうです(当初はそうでなかったそうですが)。結局これが事実上のスタンダードとなったのですが、これは別の問題も生み出しました。

 先ほどWindowsでは「波ダッシュも全角チルダも同じ記号を使う」と書きましたが、Unicodeでは本来別に定義されています。なので、Unicodeを使って何かをするプログラムの場合、Windowsで入力された「~」は、波ダッシュなのか、チルダなのか、わからないのです。要は、Windowsは波ダッシュも全角チルダも全角チルダとしてしまうのです。
 Linuxをはじめとしたmacなどでは、これを厳密に区別します(そもそもUnicodeで扱ってる)から、波ダッシュは波ダッシュとして扱います。とはいえ、この波の形が下始まりではおかしい、ということで、表示は「~」となっています。波ダッシュとチルダのコードは別々に扱いますが、表示はどちらも「~」となります。若干ややこしくなってきましたが、ここで誤解が生まれるのです。
 Windowsでは、Unicodeで波ダッシュとなっているコードは、Unicodeの定義どおり「〜」と表示するようになっているのです(Vistaのメイリオフォントからは、どちらも「~」だそうですが、むりくり感がありますねぇ)。
 ちなみに、キーボードで入力しているのは、大抵波ダッシュです。

多少わかりやすくしてみると、
・Windowsの人
 波ダッシュを入力 → Unicodeの全角チルダへ
 全角チルダを入力 → Unicodeの全角チルダへ
 Unicodeの全角チルダ → 「~」を表示
 Unicodeの波ダッシュ → 「〜」を表示

・macの人
 波ダッシュを入力 → Unicodeの波ダッシュへ
 全角チルダを入力 → Unicodeの全角チルダへ
 Unicodeの全角チルダ → 「~」を表示
 Unicodeの波ダッシュ → 「~」を表示



 だから、Windowsの人が誰かのブログを読んだりする時に、「〜」なのか「~」なのかで、その人が使っているOSがおおよそわかります。Windowsの人が見て、「〜」になっているブログは、mac使いが書いた、ということなのです。と、いうことでGACKTはmac使いだということですね。たまたま、このブログの別の記事から見ていたときに、そういえば、と気づいて書いたことですが、いつの間にかこんなに長文になってしまいました。


 それにしても、「〜」って、書き辛いのに、どうしてこんな文字が定義されてしまったのか。
 ナゾです。
by hidemite | 2010-01-27 20:48 | PC
<< 【雪】 東京の道が久しぶりに白かった 【携帯】 ウィルコム、大丈夫か... >>