07_business_edited.jpg

AI-OCR Product

最新AI技術・画像処理技術を取り入れたOCRプログラム

FROG AI-OCR

明治期~昭和期までの複雑な資料のテキスト化が可能!

​地域旧文書等の電子図書館・デジタルアーカイブ化、読書バリアフリー法対応へ!

image.jpg
trial-2_edited.png
NDL_edited.jpg

<国立国会図書館次世代システム開発研究室様コメント>

今回の成果である日本語のOCR処理プログラム「NDLOCR」は、NDLラボ公式GitHubアカウント(https://github.com/ndl-lab )からオープンソースで令和4年4月25日に公開しました。NDLOCRは、学習用データを用意することで追加の学習が可能なOCRで、今後国立国会図書館がデジタル化する資料の全文テキストデータ作成に使用します。プログラムのほかに、開発に用いた機械学習用データセット(著作権保護期間が満了したデジタル化資料から作成した分のみ)も近々に公開予定です。日本語OCR全体の精度向上に資することになれば、と考えておりますので、関心のある多くの方々にご活用いただきたいと思っております。

​※2022年4月28日リリースより抜粋

かすかなグロー
OCR_2_edited.jpg

FROG AI-OCRとは

複雑な資料のテキスト化を可能にする文字認識技術

既存のOCRができなかった明治期~昭和期までの複雑な資料のテキスト化が可能
※詳しい説明はこちら

AIOCR説明.png

AIでテキスト化が素早く正確に!!

FROG AI-OCRは、最先端のAI技術と画像処理技術で

「テキスト化」を自動にするソリューションです

1860年代以降の書籍・雑誌において市販OCRより高い90%以上の精度で認識可能
特に明治期~昭和初期の近代書籍・雑誌においては、市販OCRの約2倍(約40%→90%以上)の読み取り精度

精度.png
09_contact.jpg

CONTACT

デモ・面談のお問い合わせはこちらから

06_strength.jpg

STRENGTH

08_technology.jpg

TECHNOLOGY