Power Automate Desktop(PAD)でPDFを扱う方法をメモしていきます。
テキストを抽出
test.pdfというPDFファイルを使います。
内容は次の通りで、テキストが埋め込まれた状態です。
◎PDFからテキストを抽出
PDFファイル=C:\xxxxx\test.pdf
◎メッセージを表示
表示するメッセージ=%ExtractedPDFText%
PDFファイル=C:\xxxxx\test.pdf
◎メッセージを表示
表示するメッセージ=%ExtractedPDFText%
結果は次の通りです。
姓(漢字) 名(漢字) 都道府県 年月日(ハイフン)
三浦 八郎 岩手県 2021/8/8
諏訪 愛 岐阜県 2018/11/10
清水 秀子 ⾧野県 2006/2/23
比嘉 英恵 岡山県 2014/1/18
テーブルを抽出
◎PDFからテーブルを抽出する
PDFファイル=C:\xxxxx\test.pdf
◎メッセージを表示
表示するメッセージ=%ExtractedPDFTables[0].DataTable[3][1]%
PDFファイル=C:\xxxxx\test.pdf
◎メッセージを表示
表示するメッセージ=%ExtractedPDFTables[0].DataTable[3][1]%
結果は次の通りです。
英恵
ExtractedPDFTablesは配列です。
表が複数あれば全て取得します。
今回は表が一つなので
ExtractedPDFTables[0]
とします。
ExtractedPDFTables[0].DataTable
とするとデータテーブルとして扱います。
ExtractedPDFTables[0].DataTable[3][1]
とすると0から数えて3行目、0から数えて1列目を取得します。
コメント