Power Query(パワークエリ)の使い方には少しコツがあります。Power Queryを利用するときのヒントとテクニックについての備忘録。
後日のメンテナンスや、作業の効率化を考慮すると、次をしておくと良さそうです。
なお、PowerQueryを利用開始した段階でのポイントは、【Power Queryの初歩】簡単な事例説明(使いながら覚える最初のポイント)にまとめています。
内容:
- 列の「移動」は、処理の最後の方にする。
- ステップのプロパティで、「名前の変更」と「説明」を利用する
- データが多い時は、フィルターや不要な列削除で、データ量を減らす
- 参考:Power Query を使用するときのベスト プラクティス
列の「移動」は、処理の最後の方にする。
並び替えをすると、全ての列名と順序のステップができる。
しかし、このステップの前で列を削除しても、このステップの列名は自動更新されないため、エラー修正が必要となる。必要な列が確定してから、列の「移動」をした方が効率的です。言い換えると、列を削除すると後のステップで修正が必要になる可能性があるということ。
例)列の移動ステップ
= Table.ReorderColumns(変更された型,{"日付", "年代", "顧客ID", "住所", "商品ID"})
このステップの前で、"年代"の列削除すると、当該ステップでは”年代”がなくてエラーとなり、修正が必要。
ステップのプロパティで、「名前の変更」と「説明」を利用する
Power Query の [適用したステップ]ではステップの名前が自動的に作成されますが、後日見ると何のステップかわかりづらい。
必要に応じて、ステップの名前を変更したり、プロパティで説明を追加しておく。
データが多い時は、フィルターや不要な列削除で、データ量を減らす
ステップの設定変更に時間を要するので、ステップの早い段階で不要なデータを削除しておく。ただし、列削除は、後のステップへの影響も大きいので、不要が確定してから削除する。
参考:Power Query を使用するときのベスト プラクティス
上述の「Power Queryを利用するときのヒントとテクニック」はPower Query を使用するときのベスト プラクティス - Power Query | Microsoft Learn0を参考にしました。
次のような、前述以外のポイントもあります。
1.適切なコネクタを選択する
2.フィルター処理を早期に行う
3.負荷が大きい操作を最後に行う
4.データのサブセットを一時的に処理する
5.正しいデータ型を使用する
6.データを調査する
7.作業を文書化する
8.モジュール方式のアプローチを採用する
9.グループを作成する
10.長く使用できるクエリ
11.パラメーターを使用する
12.再利用可能な関数を作成する
以上、Power Queryを利用するときのヒントとテクニックについての備忘録でした。