とにかく動かすPAD – PDF編

Power Automate Desktop(PAD)でPDFを扱う方法をメモしていきます。

テキストを抽出

test.pdfというPDFファイルを使います。
内容は次の通りで、テキストが埋め込まれた状態です。

◎PDFからテキストを抽出
PDFファイル=C:\xxxxx\test.pdf

◎メッセージを表示
表示するメッセージ=%ExtractedPDFText%

結果は次の通りです。

姓(漢字) 名(漢字) 都道府県 年月日(ハイフン)
三浦 八郎 岩手県 2021/8/8
諏訪 愛 岐阜県 2018/11/10
清水 秀子 ⾧野県 2006/2/23
比嘉 英恵 岡山県 2014/1/18

テーブルを抽出

◎PDFからテーブルを抽出する
PDFファイル=C:\xxxxx\test.pdf

◎メッセージを表示
表示するメッセージ=%ExtractedPDFTables[0].DataTable[3][1]%

結果は次の通りです。

英恵

ExtractedPDFTablesは配列です。
表が複数あれば全て取得します。
今回は表が一つなので
ExtractedPDFTables[0]
とします。
ExtractedPDFTables[0].DataTable
とするとデータテーブルとして扱います。
ExtractedPDFTables[0].DataTable[3][1]
とすると0から数えて3行目、0から数えて1列目を取得します。

コメント

タイトルとURLをコピーしました