事典の重複項目をなくす

 昨日朝、事典の項目数とファイル数というのを書いたんですが、今日一念発起、データベースのファイルをcsvに変換してExcelで取り込み、その上で重複をフィルタしてその他を削除、フィルタをoffにして重複項目をあぶりだし、修正する、という作業を行いました(実質手作業。マクロとか、プログラミングとか苦手なのです)。
 おかげで項目数は9500台から9400台にまで減ってしまいましたが、見落としのないかぎり、上書きされてしまうファイルはおそらく、なくなったと思います。

 csvに出力すると、大事な「更新日時」のデータがすべてリセットされてしまうので、あまりやりたくなかったのです。でも、これまでも何度もリセットせざるをえない状況に陥っていたので、あきらめは早かった。

 もうひとつ問題が。
 Wordsworthでは「関連項目」に項目名を使用するのですが、単純な名前だったり同姓同名だったりすると、まったく関係のないほうにまで関連リンクが貼られてしまいます。名前のあとにカッコ書きで地域名や簡単な説明をつけているのは、上下の項目を見ればわかると思いますが、そのようなミスを防ぐため。それでも、気づかない重複項目名がまだまだ多いし、Wordsworthはリンク先のない関連項目もそのまま残してしまうので、修正したところでさらにリンク先のデータから旧関連項目名を削除せねばならず、面倒だったりします。重複項目名の処理のめどはたっているのですが、旧関連項目名を削除する方策が思いつきません。実はリンク先が存在しないのは2種類あって、ひとつは項目の旧名、でもうひとつは追加する予定の項目名なのですが、この両方を区別することができないのです。
 やっぱ手作業になるのか……。