Python Excel操作逆引き集 | 読み込み時に先頭行をスキップする

Python

2025.12.032026.03.19

なぜ「先頭行をスキップする」がこんなに大事なのか
基本形：skiprows=range(n) の意味をちゃんと理解する
1. 最小コードと挙動
2. header と組み合わせたときのイメージ
典型パターン別のテンプレート
skiprows と一緒にやっておきたい「型の整え方」
1. 日付と数値を同時に整える
実践テンプレート
1. テンプレ1：タイトル3行＋空行1行＋表、という帳票を読む
2. テンプレ2：先頭2行が説明、3行目からヘッダーなしデータ
つまずきポイントを先に潰しておく
1. 「何行スキップすればいいか」がわからない
2. header と組み合わせを間違える
小さな練習問題
1. 練習1：先頭3行がタイトル＋説明、4行目がヘッダーの sales.xlsx を正しく読む
2. 練習2：先頭2行がゴミ、3行目からヘッダーなしデータの raw.xlsx を整形する
最後に

なぜ「先頭行をスキップする」がこんなに大事なのか

現場のExcelは、いきなり表が始まってくれません。
会社ロゴ、レポートタイトル、出力日、担当者名、空行…そのあとにようやく「本当のデータ」が出てきます。

でも pandas.read_excel は、何も指定しないと「一番上の行をヘッダー（列名）だ」と勝手に解釈します。
その結果、タイトル行が列名になったり、データが1行ずれて入ったりして、後で必ず苦しむことになります。

そこで使うのが skiprows、特に skiprows=range(n) です。
「先頭から n 行は全部いらない。そこから下が本当の表だ」と、はっきり宣言するためのスイッチです。

基本形：skiprows=range(n) の意味をちゃんと理解する

最小コードと挙動

import pandas as pd

df = pd.read_excel(
    "report.xlsx",
    skiprows=range(3)  # 0,1,2行目（1〜3行目）をスキップ
)

print(df.head())

import pandas as pd

df = pd.read_excel(
    "report.xlsx",
    skiprows=range(3)  # 0,1,2行目（1〜3行目）をスキップ
)

print(df.head())

Python

skiprows=range(3) は、「0行目・1行目・2行目を読み飛ばす」という意味です。
Excelの見た目で言うと、「1〜3行目を無視して、4行目から読み始める」と考えてください。

ここで重要なのは、range(n) が「0 から n-1 まで」を表す、というPythonの基本ルールです。
range(5) なら 0〜4 行目（1〜5行目）をスキップします。

header と組み合わせたときのイメージ

例えば、こんな構造のシートを想像してください。

1行目: 「売上レポート 2025年」
2行目: 「出力日: 2025/01/01」
3行目: 空行
4行目: 「日付, 商品名, 数量, 金額」
5行目以降: データ

この場合、「4行目をヘッダー（列名）として使い、5行目からデータ」としたいわけです。
そのときのコードはこうなります。

df = pd.read_excel(
    "report.xlsx",
    skiprows=range(3),  # 1〜3行目を飛ばす
    header=0            # 残った先頭行（元の4行目）をヘッダーにする
)

df = pd.read_excel(
    "report.xlsx",
    skiprows=range(3),  # 1〜3行目を飛ばす
    header=0            # 残った先頭行（元の4行目）をヘッダーにする
)

Python

skiprows で「どこからが表か」を合わせ、header で「その行を列名として使う」と指定する。
この2つの組み合わせが、実務Excelを読むときの超重要ポイントです。

典型パターン別のテンプレート

タイトルと説明行をまとめて飛ばす

よくあるパターンは、「タイトル1行＋説明2行＋空行1行＋表」という構造です。

import pandas as pd

df = pd.read_excel(
    "sales.xlsx",
    skiprows=range(4),  # 1〜4行目を飛ばす
    header=0            # 5行目をヘッダーとして使う
)

print(df.head())
print(df.columns)

import pandas as pd

df = pd.read_excel(
    "sales.xlsx",
    skiprows=range(4),  # 1〜4行目を飛ばす
    header=0            # 5行目をヘッダーとして使う
)

print(df.head())
print(df.columns)

Python

このとき、df.columns を必ず確認してください。
「想定している列名がちゃんと入っているか」「データの1行目が正しく表示されているか」を目で見るのが、トラブルを防ぐ一番の近道です。

ヘッダー行すらなく、全部データとして扱いたい場合

先頭からいきなりデータが並んでいて、列名は自分で付けたい、というパターンもあります。
さらに、その前にゴミ行がある場合はこうします。

import pandas as pd

df = pd.read_excel(
    "no_header_report.xlsx",
    skiprows=range(2),                      # 1〜2行目はゴミ
    header=None,                            # ヘッダー行はない
    names=["date", "item", "qty", "amount"] # 自分で列名を付ける
)

print(df.head())

import pandas as pd

df = pd.read_excel(
    "no_header_report.xlsx",
    skiprows=range(2),                      # 1〜2行目はゴミ
    header=None,                            # ヘッダー行はない
    names=["date", "item", "qty", "amount"] # 自分で列名を付ける
)

print(df.head())

Python

ここでは、

skiprows=range(2) で「3行目からが本当のデータ」と宣言
header=None で「その3行目も含めて全部データ」と宣言
names=[...] で「列名はこれを使う」と指定

という三段構えになっています。
「ヘッダーがないのか」「ヘッダーはあるが無視したいのか」で header=None と header=0 を使い分けるのがポイントです。

先頭 n 行だけでなく、途中の行も飛ばしたい場合

skiprows は、range(n) だけでなく、リストでも指定できます。
例えば「1〜3行目と、10行目だけ飛ばしたい」ならこうです。

df = pd.read_excel(
    "report.xlsx",
    skiprows=[0, 1, 2, 9],  # 0〜2行目と9行目をスキップ
    header=0
)

df = pd.read_excel(
    "report.xlsx",
    skiprows=[0, 1, 2, 9],  # 0〜2行目と9行目をスキップ
    header=0
)

Python

ただし、まずは「先頭のゴミをまとめて飛ばす」パターンをしっかり押さえてから、
こういう細かい指定に進む方が理解がスムーズです。

skiprows と一緒にやっておきたい「型の整え方」

日付と数値を同時に整える

先頭行をスキップして表の位置を合わせたら、次は型を整えます。

import pandas as pd

df = pd.read_excel(
    "sales.xlsx",
    skiprows=range(4),
    header=0,
    usecols=["日付", "数量", "金額"],
    names=["date", "qty", "amount"],
    parse_dates=["date"]
)

df["qty"] = pd.to_numeric(df["qty"], errors="coerce")
df["amount"] = pd.to_numeric(df["amount"], errors="coerce")

print(df.head())
print(df.info())

import pandas as pd

df = pd.read_excel(
    "sales.xlsx",
    skiprows=range(4),
    header=0,
    usecols=["日付", "数量", "金額"],
    names=["date", "qty", "amount"],
    parse_dates=["date"]
)

df["qty"] = pd.to_numeric(df["qty"], errors="coerce")
df["amount"] = pd.to_numeric(df["amount"], errors="coerce")

print(df.head())
print(df.info())

Python

ここでやっていることは、

skiprows で「表の開始位置」を合わせる
header と names で「列名」を整える
parse_dates と to_numeric で「型」を整える

という、読み込みの三本柱です。
skiprows はその最初の一歩で、「どこからが表か」を正しく指定できるかどうかが、後のすべてを決めます。

実践テンプレート

テンプレ1：タイトル3行＋空行1行＋表、という帳票を読む

import pandas as pd

df = pd.read_excel(
    "monthly_report.xlsx",
    skiprows=range(4),                      # 1〜4行目を飛ばす
    header=0,                               # 5行目をヘッダーに
    usecols=["日付", "商品名", "数量", "金額"],
    names=["date", "item", "qty", "amount"],
    parse_dates=["date"]
)

df["qty"] = pd.to_numeric(df["qty"], errors="coerce")
df["amount"] = pd.to_numeric(df["amount"], errors="coerce")

monthly = (
    df.assign(month=df["date"].dt.to_period("M"))
      .groupby("month", as_index=False)["amount"].sum()
)

print(monthly)

import pandas as pd

df = pd.read_excel(
    "monthly_report.xlsx",
    skiprows=range(4),                      # 1〜4行目を飛ばす
    header=0,                               # 5行目をヘッダーに
    usecols=["日付", "商品名", "数量", "金額"],
    names=["date", "item", "qty", "amount"],
    parse_dates=["date"]
)

df["qty"] = pd.to_numeric(df["qty"], errors="coerce")
df["amount"] = pd.to_numeric(df["amount"], errors="coerce")

monthly = (
    df.assign(month=df["date"].dt.to_period("M"))
      .groupby("month", as_index=False)["amount"].sum()
)

print(monthly)

Python

このテンプレートは、「先頭にゴミがあるけど、表自体はきれい」という帳票にそのまま使えます。
skiprows=range(4) の「4」が、あなたのファイルでは何行になるかを確認して、そこだけ変えればOKです。

テンプレ2：先頭2行が説明、3行目からヘッダーなしデータ

import pandas as pd

df = pd.read_excel(
    "raw_data.xlsx",
    skiprows=range(2),                      # 1〜2行目を飛ばす
    header=None,                            # ヘッダーなし
    usecols=[0, 1, 3],                      # 0:日付,1:商品,3:金額
    names=["date", "item", "amount"],
    parse_dates=["date"]
)

df["amount"] = pd.to_numeric(df["amount"], errors="coerce")

print(df.head())

import pandas as pd

df = pd.read_excel(
    "raw_data.xlsx",
    skiprows=range(2),                      # 1〜2行目を飛ばす
    header=None,                            # ヘッダーなし
    usecols=[0, 1, 3],                      # 0:日付,1:商品,3:金額
    names=["date", "item", "amount"],
    parse_dates=["date"]
)

df["amount"] = pd.to_numeric(df["amount"], errors="coerce")

print(df.head())

Python

このパターンは、「ヘッダーもないし、先頭に説明行もある」という、かなり荒れたExcelに対して有効です。
skiprows と header=None と usecols と names を組み合わせることで、「自分の都合のいい形」に持ってきています。

つまずきポイントを先に潰しておく

「何行スキップすればいいか」がわからない

これは、実際にExcelを開いて「表が始まる行番号」を目で確認するのが一番早いです。
例えば「5行目から表が始まる」なら、0〜3行目をスキップしたいので skiprows=range(4) です。

Excelの行番号（1始まり）と、Pythonの行インデックス（0始まり）を頭の中で対応させてください。

1行目 → 0
2行目 → 1
3行目 → 2
…
n行目 → n-1

なので、「n行目から読みたい」なら skiprows=range(n-1) ではなく、range(n-1) ではなく「range(n-1)?」と一瞬迷うのではなく、
「n行目を含めて、それより上を全部飛ばす」なら range(n-1) ではなく range(n-1)…とややこしく感じたら、素直に「飛ばしたい行の0始まりインデックス」を書き出してみるといいです。
実務では、まずは skiprows=3 のように単純な数値で試し、うまくいかなければ range(3) に変える、というステップでも構いません。

（厳密には skiprows=3 と skiprows=range(3) は挙動が少し違うケースもありますが、先頭連続行を飛ばす用途ではほぼ同じと考えて大丈夫です。）