Power Queryには画像からデータ取得する機能があり、「ファイルからの画像」と「クリップボードからの画像」の2種類があります。紙印刷された表を入手、パソコンに入力するような業務で活用すると便利な機能です。
内容:
動作確認のExcelは「Microsoft® Excel® for Microsoft 365 MSO」(バージョン2410)です。
アウトプットイメージ
下図左側のような画像データの表からテキストデータを抽出し、Excelのシートに取り込みできます。取り込み後は、必要に応じて修正やレイアウト調整をします。
実施手順
以降、「クリップボードからの画像」を取得する事例の手順です。
「ファイルからの画像」も同様です。
(1)画像のコピー(クリップボードに一時保存)
画像をコピーする(以下は、ペイントの画面でコピーをした事例)。Web上の画像データを直接コピーでも、もちろん可能。
(2)PowerQueryで「クリップボードからの画像」を選択
「データ」タブで、「データの取得」-「その他のデータソースから」-「画像から」-「クリップボードからの画像」をクリックする。
(3)テキストデータの変換結果の確認と修正
前手順の結果、次のように画像と変換結果が表示される。
このまま「データ挿入」も可能だが「確認」でデータを確認と修正をする。
上記画面で「確認」を押すと、推奨される確認箇所が画像と変換結果の対比で表示される。
データ位置をクリックしての確認も可能で、対比した表示で誤変換等を確認、修正もしやすい。
(4)「データを挿入」
「データを挿入」で、Excelシートにデータが挿入される。
あとは、必要に応じて修正やレイアウト調整する。
数値データは「NUMBERVALUE関数」を利用すると全角や余分なスペースを削除可能。
補足説明
- 「ファイルからの画像」でデータ取得する場合もPowerQueryにある「更新」ボタンでの再更新はできない仕様でした。
更新機能は、画像の場合はデータ確認の段階が必要なため必要となる場面は少ない印象です。 - 今回、手書き文字について実務で利用できる認識精度になりませんでした。
以上、Power Queryで画像からテキストデータを抽出する事例でした。