PythonのPandasのexplodeメソッドについて

2025年8月26日

Pandasの explode メソッド について詳しく解説します。

これは、DataFrameやSeriesに含まれる リスト形式の要素を行に展開する ときに使う便利なメソッドです。

特に、データが「ネストされたリスト」や「複数の値を1セルに持つような構造」になっているときに役立ちます。

基本の動作

explode は、指定した列（または複数列）の リスト・タプル・セット を 行ごとに展開 します。

他の列は繰り返されるので、表形式の整形に使いやすいです。

import pandas as pd

df = pd.DataFrame({
    "id": [1, 2, 3],
    "values": [[10, 20, 30], [40, 50], [60]]
})

print(df)

explode を使うと

df_exploded = df.explode("values")
print(df_exploded)

values 列が行に展開され、それに対応する id が繰り返されています。

Pandas 1.3.0 以降では、複数列を同時に展開できます。

リストの「長さ」が一致している必要があります。

df = pd.DataFrame({
    "id": [1, 2],
    "A": [[10, 20], [30, 40]],
    "B": [["x", "y"], ["z", "w"]]
})

print(df.explode(["A", "B"]))

スカラーやNaNはそのまま残る
- リストじゃない値は展開されず、そのまま保持されます。
- NaN もそのまま残ります。
インデックスは維持される
- 展開後も元のインデックスが維持されるので、必要なら reset_index(drop=True) で振り直します。
df_exploded.reset_index(drop=True, inplace=True)
リストの長さが揃っていない場合（複数列explode時）はエラーになります。
片方がスカラ値、片方がリスト、のようなケースでは不整合が生じます。