毎月、同じレイアウトのPDFファイルをExcelに転記するなど、「繰り返し、PDFからExcelへのデータ抽出業務」がある場合、Power Query(パワークエリ)が便利だったので備忘のメモ。
具体的には、
- 行政が毎月更新、公開しているPDF形式(透明テキストPDFの状態)の一覧データがある。
- 分析のためにPDFファイルから必要箇所を毎月データ抽出し、Excelで編集する。
という業務で、今回Power Queryを利用。 Excelのバージョンは、Microsoft® Excel® for Microsoft 365 MSOで実施。
もともと、変換ソフトなどでPDFファイルを読み込み、テキストの書き出し、Excelの表に貼り付けといった作業をしていました。 その後、Power QueryでPDFインポートが出来ることを知ってからは、次の方法で実施。
Power Queryのインポートでいけるなら、必要箇所の抽出、Excelへの転記が「データ更新」のクリック1つでできます。 「繰り返し、PDFからExcelへのデータ抽出業務」があるなら、次の相対パスを活用することでフォルダ内のファイル変更だけデータ更新でき、作業の効率化が図れました。