https://d1021.hatenadiary.com
http://d1021.hatenablog.com

「くずし字」は平安時代から明治時代の初めごろまで広く使われていましたが、今の文字と形が大きく異なっていたり複数の文字が連続して書かれたりしていることから、正確に解読できる人には限りがあります。

このため「人文学オープンデータ共同利用センター」などは、AIを使ってくずし字を瞬時に今の文字に置き換えるシステムを開発し、そのうえで新たな発想を加えてさらに精度を高めようと国際コンペを行いました。

コンペでは、センターのシステムをもとに新たな手法を開発することで、数千枚の画像に書かれたくずし字をどれだけ正確に認識できるかが競われ、国内外の企業や研究者などおよそ300チームが参加しました。

人文学オープンデータ共同利用センターによりますと、国内には現在もくずし字で書かれた過去の資料が数億点規模で残されていると言われていますが、人が読める量には限りがあり、解読されていない資料が数多く残されていることが課題となっています。