とにかく動かすPAD – OCR編

Power Automate Desktop(PAD)でOCRを扱う方法をメモしていきます。

下のファイルを対象とします。

◎OCRを使ってテキストを抽出
OCRエンジンの種類=WindowsOCRエンジン
OCRソース=ディスク上の画像
画像ファイルパス=C:\xxxxx\dazai.png
WindowsOCRの言語=日本語

◎メッセージを表示
表示するメッセージ=%OcrText%

OCRエンジンはWindowsOCRとTesseractから選べます。
WindowsOCRであればデフォルト状態で使えます。
言語はデフォルト状態だと日本語が使えます。
乗数は1にしておきます。

結果は下の通りです。

恥 の 多 い 生 涯 を 送 っ て 来 ま し た 。 自 分 に は 、 人 間 の 生 活 と い
う も の が 、 見 当 っ か な い の で す 。 自 分 一 よ 東 北 の 田 舎 に 生 れ ま
し た の で 、 汽 車 を は じ め て 見 た の は 、 よ ほ ど 大 き く な っ て か
ら で し た 。

意外と精度が高いです。
よく見ると文字の間に半角スペースが入っています。これはPower Automateで除去できるでしょう。

試しに画像の高さの乗数を2にしてみます。

恥 の 多 い 生 涯 を 送 っ て 来 ま し た 。 自 分 に は 、 人 間 の 生 活 と い
う も の が 、 見 当 っ か な い の で す 。 自 分 は 東 北 の 田 舎 に 生 れ ま
し た の で 、 汽 車 を は じ め て 見 た の は 、 よ ほ ど 大 き く な っ て か
ら で し た 。

少し改善されました。
3にすると悪化します。
なお幅の乗数を2にすると全く正しく認識されません。

コメント

タイトルとURLをコピーしました