国内
公開日: 2022.09.08
LINEが昭和前期以前の資料にも対応可能なOCRモデルを開発 国立国会図書館のデジタル化資料2億2300万枚のテキストデータ化を完了
▼ ニュースのポイント
①LINE AIカンパニーが国立国会図書館のOCRテキストデータ化プロジェクトにて、プロジェクト用のOCRモデルを開発。
②同プロジェクトでは、デジタル化資料の多くが昭和前期以前の資料。
③開発したモデルにて、国立国会図書館のデジタル化資料247万点をテキストデータ化した。

同社は2021年、国立国会図書館が保有するデジタル化資料のOCRテキストデータ化プロジェクトに同社の「CLOVA OCR」が採用され、同プロジェクトを受託した。
「CLOVA OCR」は、書類や画像に記載された文字をテキストデータに変換するサービスで、文書解析と認識に関する国際会議ICDARの4分野で世界No.1を獲得している。
そこで同社のAI-OCRモデル研究開発チームでは、「CLOVA OCR」の技術をベースに、同プロジェクト用の新たなOCRモデルを開発した。
この結果、昭和前期以前の資料特有の、字間・行間が不揃いな書籍、書籍内の汚れや透けて見えている文字、右読みの文章なども認識できるようになり、全文テキストデータ化を完了できたとしている。
(画像はプレスリリースより)
▼外部リンク
LINE AIカンパニー プレスリリース
https://prtimes.jp/main/html/rd/p/000003977.000001594.html
▼ 会社概要
LINEでは2019年からカンパニー制を導入。LINE AIカンパニーは、AIアシスタント「Clova」、音声操作だけで目的地設定などが可能な「LINEカーナビ」、企業向けの「LINE BRAIN」などを展開している。
社名:LINE株式会社 AIカンパニー
代表取締役:砂金 信一郎
所在地:東京都新宿区四谷一丁目6番1号 四谷タワー23階
①LINE AIカンパニーが国立国会図書館のOCRテキストデータ化プロジェクトにて、プロジェクト用のOCRモデルを開発。
②同プロジェクトでは、デジタル化資料の多くが昭和前期以前の資料。
③開発したモデルにて、国立国会図書館のデジタル化資料247万点をテキストデータ化した。
複雑な昭和前期以前の資料をデジタル化
LINE AIカンパニーは9月7日、新たなOCRモデルの開発により、国立国会図書館のデジタル化資料247万点、2億2300万枚を超す全文のテキストデータ化を完了したと発表した。
同社は2021年、国立国会図書館が保有するデジタル化資料のOCRテキストデータ化プロジェクトに同社の「CLOVA OCR」が採用され、同プロジェクトを受託した。
「CLOVA OCR」は、書類や画像に記載された文字をテキストデータに変換するサービスで、文書解析と認識に関する国際会議ICDARの4分野で世界No.1を獲得している。
「CLOVA OCR」をベースに新たなOCRモデルを開発
今回のプロジェクトでは、デジタル化資料の多くがレイアウトなどが複雑な昭和前期以前の資料であったため、既存のOCRでは精度や処理速度が課題とされていた。そこで同社のAI-OCRモデル研究開発チームでは、「CLOVA OCR」の技術をベースに、同プロジェクト用の新たなOCRモデルを開発した。
この結果、昭和前期以前の資料特有の、字間・行間が不揃いな書籍、書籍内の汚れや透けて見えている文字、右読みの文章なども認識できるようになり、全文テキストデータ化を完了できたとしている。
(画像はプレスリリースより)
▼外部リンク
LINE AIカンパニー プレスリリース
https://prtimes.jp/main/html/rd/p/000003977.000001594.html
▼ 会社概要
LINEでは2019年からカンパニー制を導入。LINE AIカンパニーは、AIアシスタント「Clova」、音声操作だけで目的地設定などが可能な「LINEカーナビ」、企業向けの「LINE BRAIN」などを展開している。
社名:LINE株式会社 AIカンパニー
代表取締役:砂金 信一郎
所在地:東京都新宿区四谷一丁目6番1号 四谷タワー23階
関連記事
-
国内
2023.06.29
amptalkは自社の「アンプトーク」がMicrosoft Teamsのチャットと連携を発表 ユーザーが多いビジネスツールと連携
-
国内
2023.06.29
LX DESIGNが「複業先生(R)」の授業案自動生成機能(β版)を提供 外部人材と学校をつなぎ効率的な授業を
-
国内
2023.06.28
フツパーが製造業向けの大規模画像言語モデルの開発に着手 製造現場におけるデータ処理や業務の自動化に特化した汎用型AIを開発
-
国内
2023.06.27
ポーラ化成工業が熱中症リスク判定AIカメラの社会実証試験を開始 建設現場での熱中症に対する有用性を検証
-
国内
2023.06.26
TechMagicがキユーピーと資本業務提携、最先端技術などを活用して「未来型食品工場」の早期具現化へ
-
国内
2023.06.23
Specteeが災害時の浸水情報を三次元表示するシステムの実証結果を公開、建物の浸水深の把握が可能に