※本記事は先日「新潟医療福祉大学 講師 佐藤皓也様」にインタビューをした際の内容を掲載しております。
「Ambient Intelligenceによって新たな世界を実現する」をビジョンに掲げ、画像解析に関する様々なAIサービスを展開する株式会社モルフォAIソリューションズ。
その中でも「FROG AI-OCR」は、旧字旧仮名を含んだ明治期から昭和期までの複雑な資料のテキスト化をすることが可能であり、歴史的な旧文書の研究や、電子図書館(デジタルアーカイブ)化、読書バリアフリー法対応などの支援をしています。
今回のインタビューでは、新潟医療福祉大学 講師 佐藤皓也様に「FROG AI-OCRを活用した武道史研究」の詳細について伺いました。
インタビューイー 佐藤 皓也 様(Sato Koya) 所属: ・新潟医療福祉大学 健康科学部 健康スポーツ学科 講師 学位: ・博士(スポーツ科学)(2020年1月 早稲田大学) ・修士(教育学)(2015年3月 埼玉大学) 研究分野: ・スポーツ史 ・武道史 ・デジタル人文学 ・旧制中学・高校 ・武道・古武道 論文: 旧制第一高等学校撃剣部の活動:無検証試合の提唱 佐藤皓也 武道学研究(早期公開),2023年11月 デジタル技術を用いた武道史研究:『嶽水會雑誌』の計量テキスト分析 佐藤皓也, 小林勝法 スポーツ科学研究 20 1-15 2023年3月 科研費: 近代日本における学生武道の実相:質的および量的解析手法を用いた武道史研究 日本学術振興会: 科学研究費助成事業 若手研究 2023年4月-2026年3月 佐藤 皓也(研究代表者) |
佐藤先生のこれまでの取り組みと研究内容について
【石崎】
本日はよろしくお願いいたします。改めて佐藤先生の取り組みをご紹介いただけますでしょうか。
【佐藤先生】
私は、これまで「剣道」を事例に武道史を探求してきました。現在は、その中でも学生剣道史に注目しています。
基本的に歴史研究は、古い資料を収集したあとで史実を認識し、解釈を加えるかたちで研究を進めることが一般的です。
しかし、資料が残っていない場合もあるため、史実に関連のある人物を訪問し、当時の考え方などを伺うこともあります。
学生剣道史には不明瞭な部分があり、その時代の歴史研究を行うことで、当時の実践や考え方は現在に繋がっているということが分かりました。
【石崎】
ありがとうございます。武道史研究の中でも、以前から「学生武道」について研究されてきたということですが、現在はどんな分野に着目していますでしょうか。
【佐藤先生】
現在も引き続き、「近代日本の学生剣道史」を探求するとともに、歴史の質的・量的な併用分析について着目しています。
前回は旧制第三高等学校(現在の京都大学)の研究をしていましたが、最近では旧制第一高等学校(現在の東京大学)の研究を進め、その比較なども行っております。
旧制第一高等学校については、競技スポーツというよりは修行という考え方がみられました。例えば、旧制第三高等学校には頻出しなかった「刀」や「武士道」、「寒稽古」などといったキーワードが旧制第一高等学校では頻出しました。また、頻出語以外において、旧制第一高等学校には「無検証」といったキーワードがあります。「無検証」とは試合者が自ら勝敗を判定する自己審判制のことです。このキーワードを辿ってみると、旧制第一高等学校は審判を要する競技スポーツの試合とは異なる取り組みを実践し、普及しようとした過程がみられ、そうした考え方は現代における「剣道の理念」に繋がることがわかりました。
旧制第一高等学校において、こうした取り組みを実施できた要因は指導者の影響が強いのですが、学校周辺の状況も影響したと考えています。
旧制第三高等学校の近くには大日本武徳会武道専門学校という修行性の強い学校がありました。旧制第三高等学校は、大日本武徳会武道専門学校と比べて自分たちの実践はほど遠いと感じてしまい、競技化に揺れ動いたと推測しています。一方、旧制第一高等学校は近くに大日本武徳会武道専門学校のような学校がないため修行性を志向できたとも考えることができるのです。
次は、旧制第一高等学校と旧制第三高等学校を比較し、明治時代から昭和初期までの大きな流れを量的に明らかにしたいと考えています。この成果は近代における武道史研究基盤の一つになるとともに、他種目・他分野との量的な比較を可能にするものと予想しています。
研究方法については、古い資料の読み込みに加えて、近代文献のテキスト化ソフト(FROG AI-OCR)と量的分析手法(樋口耕一氏らの計量テキスト分析)を用いています。
今回の旧制第一高等学校のように、頻出ワードではないものの重要な単語は必ず存在します。そのため、研究者は資料を丁寧に読み込むことも必要です。一方で、大量のデータを抽出して分析する分野においては、AIが必須になってきています。
「FROG AI-OCR」をどう活用しているか
【石崎】
以前から、佐藤先生には「FROG AI-OCR」にて剣道史研究の量的分析を実施いただいていますが、最近の利用状況についてお伺いできますでしょうか。
【佐藤先生】
私は引き続き、「FROG AI-OCR」と計量テキスト分析(PCを使った統計的なテキスト分析技術)を使って研究しています。
計量テキスト分析は文字データを必要とします。当時、私が分析しようとした古い文献の文字は大量にあり、文字を手入力でデータ化しなければなりませんでした。時間や依頼コスト等を考慮すると現実的ではなかったため、自動で文字を抽出でき、しかも旧字旧仮名をデータ化できるOCR技術を探していました。
実際いろいろ試してみましたが、従来のOCR処理では厳しかったですね。
そんな中、研究の種になるものはないかと探していたところ、他にはない旧字旧仮名をデータ化できるOCR技術「FROG AI-OCR」を見つけたという流れです。
現在、投稿中の論文では、10万文字を超える文字資料データの研究ができました。これは人手だけでは極めて困難な分析であり、まさにAIを活用したからこそ可能となった研究成果といえます。
【石崎】
歴史研究の分析にAIを上手く利用した例というわけですね。
継続的に「FROG AI-OCR」をご利用いただいておりますが、率直な意見として、ご利用の感触はいかがですか?
【佐藤先生】
当初は、正直50%くらいの文字をデータ化できれば嬉しいと思っていたら、ほとんどできてしまったため、非常に驚きました。
もちろん100%ではないため、自分の目で最終確認は必要ですが、今まで自分の手でやってきた作業を考えると、大変な発見でした。
最近ではAIで出力した後の修正作業について、以前提案させていただいた校正会社の利用による研究サポートを実際に運用化していただいため、校正作業が大幅に効率化しました。また、プログラムの不具合も発生しておらず、当初よりも運営の対応が改善されている印象です。精度に関しても、どんどん誤字などが少なくなっており、精度も日々改善していることを感じています。
【石崎】
嬉しいお言葉ですね。ありがとうございます。
逆に、改良点などはありますか?
【佐藤先生】
AIで分析しているため、一度にたくさんの資料をアップロードすると、処理時間が重いときがあります。
しかし、授業や会議、部活などPCから離れている時間を利用すれば、その時間で分析してくれるため、今のところ不便さは感じていません。
今後一度に複数のデータを処理できると、更に嬉しいですね。
また、武道史研究に限らず、「手書き文字文書」のニーズはあると考えています。活字の精度は申し分ないため、手書きの分析もできるようになると、江戸時代など更に時代をさかのぼった研究も促進されると考えています。
【石崎】
アップロードやダウンロード時間の短縮については、近々でアップデート対応予定となっております。もう少々お時間いただければと思います。また、手書き文字対応についても、現代語に関しては先日リリースしましたので、ぜひご利用ください。
今後の研究で実現したいこと
【石崎】
最後に、今後の研究で実現したいことについて、お伺い出来ますか?
【佐藤先生】
今回の「FROG AI-OCR」を活用した論文の分野と同内容の深堀もできますし、他種目・他分野への横展開もできると考えています。
具体的には、日中戦争以降(1937~1945年・第二次世界大戦までの間)や海外における武道文化の研究も考えております。資料が一部無いため、日本各地や国外から入手する必要があると考えています。様々な文献を分析しなければならないことから、「FROG AI-OCR」は長期的にお世話になるかもしれません。
また、将来的には、「武道」概念の解明や、スポーツ・武道の歴史と文化に関する分析データ(図やグラフ)をプラットフォーム化できればと考えています。
【石崎】
貴重なお時間をいただきありがとうございました。
今回の様に、AI-OCRという最新の技術が歴史と文化にも影響する可能性があることを実感しました。
弊社では、AI技術はもちろんですが、その前段にあたってお客様が対峙する課題の本質と、その解決に繋がるAIソリューションの設計部分にも特に強みを持っております。弊社ではAIを活用した研究を今後も支援させていただければと思います。
改めて、本日はありがとうございました。
Comments