事典項目数とファイル数

 現在この事典の項目数は9519。となると、この事典のhtmlを保存しているフォルダには9519以上のファイルがあることになります。実際にはftpのバッチファイルとか背景画像ファイルとかインデックスhtmlファイルとか色々入っているので、まだまだ多いはず。そして結果。

 9,451 個のオブジェクト


 実際の問題として、この事典では個別項目のhtmlファイル名が「monster3一部の英数字に簡略化された表記.html」となっています。でもこれには問題があって、たとえばフィンランドにアホという妖怪がいるとして、その表記がAhoだとします。また、インドにアーホというラークシャサがいるとして、その表記がĀho/Ahoだとします。これをそのまま素直にデータベースソフトWordsworthでhtml化させると、どちらもhtmlだとmonster3Aho.htmlとmonster3Aho.htmlになってしまいます。Wordsworthは少しばかり機能がシンプルなので、重複するファイル名の存在を気にしません。つまり、どちらかが上書きされてしまい、インドのラークシャサの情報を知ろうと思ってアーホをクリックするとフィンランドの興味の全然ないどこの骨とも知れぬ妖怪の解説に出会ってしまうわけです。
 それぞれ一つ一つ入力していけば気づいたのかもしれませんが、そもそも1つ1つのhtmlファイルにわけようと思ったのが、たぶんすでに9000くらい入力したあとであり、そのような状況から機械的にファイル名として「簡略化された表記」を流用してしまったため、このような問題が起きているわけです。これまでも気づいたものはそのたびに直したり放置したりしているのですが、上記のファイル数の差から考えると、いまだに100組以上の「同姓同名」な幻獣たちが私の目を通り過ぎていくか、私の手を通り過ぎていっているようなのです。
 また、まったく異なる地域ではこういう重複は純粋に技術的なものに過ぎないんですが、2年も3年も前に名前だけ入力しておいて、忘れたころになって別の資料でカタカナ表記にわずかな違いがあるだけで別の項目にしてしまうこともこのような問題を引き起こすことになるです。そういった場合、おまけとして文化・地域の区分が違ったりすると(両方の地域にまたがって知られているというわけで)「どっちに統合すべきか」とか「どっちかを異称として扱うべきか」はたと悩んでしまうことも多いです。