Pandasのhead
メソッドは、DataFrameやSeriesの先頭から指定した行数を簡単に取り出すための便利なメソッドです。
データの確認や分析の最初のステップでよく使われます。
以下で詳しく解説します。
目次
基本構文
DataFrame.head(n=5)
Series.head(n=5)
※このコード単体では、出力はできません。
n
: 取得する行数を指定します(デフォルトは5
)。- 戻り値 : 先頭から
n
行分のデータを含む 新しいDataFrameまたはSeries。
使用例
DataFrameでの例
import pandas as pd
data = {
"名前": ["田中", "佐藤", "鈴木", "高橋", "伊藤", "渡辺", "山本"],
"年齢": [25, 30, 28, 35, 40, 22, 29],
"職業": ["エンジニア", "デザイナー", "営業", "研究者", "マネージャー", "学生", "公務員"]
}
df = pd.DataFrame(data)
print(df.head())
任意の行数を指定
print(df.head(3))
→ 先頭3行だけ表示。
特徴と使いどころ
- データ確認の最初のステップ
- 大きなCSVを読み込んだとき、全行を表示すると膨大になってしまうため、
head()
で一部だけ確認するのが一般的。
- 大きなCSVを読み込んだとき、全行を表示すると膨大になってしまうため、
- デフォルトは5行
- 引数を省略すると、よく使われる「5行」だけを表示するため手軽。
- 戻り値は新しいオブジェクト
df
そのものは変更されず、先頭部分を切り出した新しいDataFrameが返る。
- Seriesにも使える
s = pd.Series([10, 20, 30, 40, 50]) print(s.head(3))
→0 10, 1 20, 2 30
の3行だけ表示。
関連メソッド
tail(n)
: 末尾からn
行を取得。sample(n)
: ランダムにn
行を取得。iloc
/loc
: 行番号やラベルで柔軟にデータを取得。
実践的な使い方
- CSVを読み込んだ直後の確認
df = pd.read_csv("data.csv") print(df.head())
→ データの構造やカラム名が正しく読み込まれたか確認。 - 大規模データの確認
- 数百万行ある場合でも、先頭5〜10行を見るだけで構造をつかめる。
- デバッグ時の一部確認
- フィルタリングや前処理を行ったあとに、結果が正しいかを
head()
で軽くチェック。
- フィルタリングや前処理を行ったあとに、結果が正しいかを
まとめ
head()
はデータの「お試し表示」に最適。- デフォルトで5行、任意の行数も指定可能。
- DataFrameだけでなくSeriesでも使える。
tail()
やsample()
と組み合わせれば、データの全体像を効率よく把握できる。
以上、PythonのPandasのheadメソッドについてでした。
最後までお読みいただき、ありがとうございました。