shikumika’s diary

日々の事務作業で手間なことを簡単にできる仕組み(自動化、方法など)、困ったことの解決方法を調べた備忘録

【Excel】「データ」タブの重複削除とPowerQueryで重複削除の違い

Excelで重複しているデータを削除するとき、「データ」タブの重複削除とPower Queryでの重複削除では、残すデータの仕様に違いがあります。

具体的には、Excelの「データ」タブの重複削除は、リスト内で最初に出現する値が保持されるとなっています。

support.microsoft.com

 

一方、Power Queryの「重複削除」では、一連の重複の最初のインスタンスが選択されるという保証はないとなっており、リスト内で最初に出現する値が保持されるとは限らないようです。

learn.microsoft.com

この回避策として、 (Table.Buffer を使用して) データをバッファリングすることを推奨されています。

learn.microsoft.com

Table.Bufferは、テーブルバッファーを使用せずにステップ構築後、対象のステップをTable.Bufferで囲みます。

例:

修正前:  = Table.Distinct(フィルターされた行, {"Data.Column1"})

修正後:  = Table.Distinct(Table.Buffer(フィルターされた行), {"Data.Column1"})

Table.Bufferの説明は次のとおりです。

learn.microsoft.com

以上、ExcelとPower Queryでの重複削除の違いがあるので注意が必要でした。