とにかく動かすPAD – PDF編

Power Automate Desktop（PAD）でPDFを扱う方法をメモしていきます。

テキストを抽出
テーブルを抽出

テキストを抽出

test.pdfというPDFファイルを使います。
内容は次の通りで、テキストが埋め込まれた状態です。

◎PDFからテキストを抽出
PDFファイル＝C:\xxxxx\test.pdf

◎メッセージを表示
表示するメッセージ＝%ExtractedPDFText%

結果は次の通りです。

姓(漢字) 名(漢字) 都道府県年月日(ハイフン)
三浦八郎岩手県 2021/8/8
諏訪愛岐阜県 2018/11/10
清水秀子⾧野県 2006/2/23
比嘉英恵岡山県 2014/1/18

テーブルを抽出

◎PDFからテーブルを抽出する
PDFファイル＝C:\xxxxx\test.pdf

◎メッセージを表示
表示するメッセージ＝%ExtractedPDFTables[0].DataTable[3][1]%

結果は次の通りです。

英恵

ExtractedPDFTablesは配列です。
表が複数あれば全て取得します。
今回は表が一つなので
ExtractedPDFTables[0]
とします。
ExtractedPDFTables[0].DataTable
とするとデータテーブルとして扱います。
ExtractedPDFTables[0].DataTable[3][1]
とすると0から数えて3行目、0から数えて1列目を取得します。