Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
[B! OCR] pattierのブックマーク
[go: Go Back, main page]

タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

OCRに関するpattierのブックマーク (2)

  • 国立国会図書館のOCRライブラリが凄くよかった件(Windows向け) - Qiita

    はじめに 日語OCR, 有料の業務用ソフトには色々と高性能なものがあるんですが、無料の場合の選択肢は意外に限られてます。最近ではGeminiなどにOCRさせることも試みてますが、縦書きに弱いのが欠点。加えて、私がやっているような著作権が切れた戦前ののデジタル化の場合、認識率の低い旧字体が多いのが悩みの種。 そこで最近知ったのが、国立国会図書館が公開しているOCRライブラリ、NDLOCRです。国会図書館のデジタル資料(国立国会図書館デジタルコレクション)から全文テキストデータを作成するために開発されたとのこと。 NDLOCRは、現在ver2.1がGithubに公開されています。古いが多い国会図書館の資料向けに作られているだけあって、旧字体でも高い精度で認識してくれます。今回は、このライブラリを試してみました。基Githubサイトに書いてある通りなんですが、いくつか注意すべき点をメモ

    国立国会図書館のOCRライブラリが凄くよかった件(Windows向け) - Qiita
    pattier
    pattier 2025/03/27
  • 日本語に特化したAI OCR「YomiToku」の紹介 - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? OCR(Optical Character Recognition)というのは、手書きや印刷された文字を読み取り、デジタルデータに変換する技術です。スキャナーや、スマホアプリなどで使ってみた経験がある方も多いかと思います。 OCRはさまざまな場面で利用されていますが、たとえば既存の紙データのデジタル化であったり、ビジネス上やり取りされる帳票を使ったシステムの自動処理などで活用されています。 YomiTokuもそんなOCRソフトウェアの一つです。日語に特化しており、複雑な表組みなども読み取れるのが特徴です。 今回は、YomiTokuの簡

    日本語に特化したAI OCR「YomiToku」の紹介 - Qiita
    pattier
    pattier 2025/02/25
  • 1