とにかく動かすPower Automate - OCR編

Pocket

Power AutomateでOCRを扱う方法をメモしていきます。

下のファイルを対象とします。

◎OCRを使ってテキストを抽出
OCRエンジンの種類=WindowsOCRエンジン
OCRソース=ディスク上の画像
画像ファイルパス=C:\xxxxx\dazai.png
WindowsOCRの言語=日本語

◎メッセージを表示
表示するメッセージ=%OcrText%

OCRエンジンはWindowsOCRとTesseractから選べます。
WindowsOCRであればデフォルト状態で使えます。
言語はデフォルト状態だと日本語が使えます。
乗数は1にしておきます。

結果は下の通りです。

恥 の 多 い 生 涯 を 送 っ て 来 ま し た 。 自 分 に は 、 人 間 の 生 活 と い
う も の が 、 見 当 っ か な い の で す 。 自 分 一 よ 東 北 の 田 舎 に 生 れ ま
し た の で 、 汽 車 を は じ め て 見 た の は 、 よ ほ ど 大 き く な っ て か
ら で し た 。

意外と精度が高いです。
よく見ると文字の間に半角スペースが入っています。これはPower Automateで除去できるでしょう。

試しに画像の高さの乗数を2にしてみます。

恥 の 多 い 生 涯 を 送 っ て 来 ま し た 。 自 分 に は 、 人 間 の 生 活 と い
う も の が 、 見 当 っ か な い の で す 。 自 分 は 東 北 の 田 舎 に 生 れ ま
し た の で 、 汽 車 を は じ め て 見 た の は 、 よ ほ ど 大 き く な っ て か
ら で し た 。

少し改善されました。
3にすると悪化します。
なお幅の乗数を2にすると全く正しく認識されません。

[ 2022年12月29日 | カテゴリー: マイクロソフト | タグ: , ]

« | »

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

送信してください。


タグ

カテゴリー

最近の投稿

最近のコメント

固定ページ

アーカイブ

stabucky

写真

メタ情報