ユニコードで楔形文字

 世界中の文字を単一のコード体系にまとめてしまおう、というのがユニコードです。

幻想動物の事典でも、HTMLのコードはShift-JISなのですが(HTML作成ソフトWordsworthの関係で)、それではどう考えても世界中の(というか、文字のある地域の)幻獣たちの表記をすることはできませんからHTMLユニコードを使ってラテン系特殊文字ヘブライ文字、JIS外の漢字などを一部表記していたりします。とはいえ当然のことながら問題点は色々あるわけで、たとえば私の環境ではユニコード対応フォントがいくつかインストールされているのですけど(Arial Unicode MS, Code2000&Code2001, TITUS Cyber Basicなど)、幻想動物の事典を見る人の環境にそれらのフォントが存在しないことは当然考えられます。自宅から見るぶんには自分でインストールすればいいのですが(できないって人は環境を変えましょう)、学校や職場やネットカフェから閲覧する場合は簡単にフォントをインストールするわけにもいきません(ログを見る限り、co.jpやac.jpは大して多くないが)。だから「/」で区切って普通の文字に簡略化した表記もしていますが、根本的な解決ではありません。画像で表示というのも考えられますが、面倒。それでも、ややねじくれた方法ではありますが(HTML自体はUTF-8じゃないから)ユニコードによって比較的簡単に多言語(というより多文字体系だよな)を再現できるのは、とくにこの事典のように多言語で「文章」を打ち込むのではなく、禁則処理などに悩まされることのほとんどない「単語」を打ち込むだけの場合、かなりのアドバンテージになると思うのです。

 で、何気にユニコードって予定では既知のかなりの文字体系を収録する予定らしいです。ROADMAPSに詳細があります。BMP(Basic Multilingual Plane: 基本多言語面)は普通のローマ字やギリシア文字、ひらがな、ハングル、CJK統合漢字があるところなんですが、今後そこにアヴェスター文字やパフラヴィー文字、コプト文字などが追加される模様(どれも完璧に読めないですが……)。
 SMP(Supplementary Multilingual Plane: 補足多言語面)はもっと面白くて、何気にエジプトのヒエログリフとか楔形文字とか予定されてたりします。また、インダス文字、ロンゴロンゴ文字、マヤ神聖文字、トンパ文字まで予定されてるらしい。ちなみにファイストス円盤文字、神代文字クリンゴン文字などは入らないらしいです。詳しいことはRoadmapsのページとfaireal参照。

 で、SMPのうちすでに古代イタリア文字、線文字B、ゴート文字などが実装されているのですが、そのフォントがCode2001。この中に、あのウガリット楔形文字も含まれてます。
 ためしにリタヌを表記してみますと……


 資料がない!


 楔形文字そのままの資料なんて持ってないよ!


 しかたない、リタヌはLTNらしいから、他言語の文字の名称から類推して表記してみよう。
 Lが頭文字なのはUgritic letter Lamdaしかないからこれだろう。Tは複数あるがレヴィアタンのタと同じだとすればthと表記するのと同じだからUgaritic letter Thannaか。Nは一つしかないから、Ugaritic letter Nun。
 結果↓

𐎍𐎘𐎐


 なぜかうちの環境では表示されないのであった。。。


 ただBabelMapでは表示されるので、見える人にはウガリット文字が見えるはずです(あとで確認してみたところ、Internet Explorerではダメ、MozillaではOKでした)。


 ちなみに、矢島文夫『ギルガメシュ叙事詩』にはアッカド楔形文字の見本が少しあります。「提案されている」楔形文字のコードがこのまま使われるなら、たとえばアブーブは次のようになります(探すの面倒だった……)。
 
⻠⼘⼘

abubu ※当然ながら、現在公開されてるいかなるフォントでも表示はできません。将来対応フォントが出てきたら表示されるとは思います。画像は左のやつ
でも、本当は『ギルガメシュ叙事詩』にある見本すべてをユニコードにしてみようと思ったんですが、微妙に字形が違ったり、存在しなかったりであきらめました。ユニコードってとくに異体字とかそういうのには弱いですよね。

 これらの古代文字の実装が何年後になるかはわかんないですけど、やっぱ世界中のアレコレを集めて一堂にまとめるのって面白いですよね。