Python

スポンサーリンク
Python

Python Excel操作 逆引き集 | 書き込みでシートにテーブル形式を作る

何をしたいテクニックなのかゴールはこうです。「pandas の DataFrame を Excel に書き出すとき、ただの“罫線付きの表”ではなく、Excel の“テーブル機能(フィルタ付きのあれ)”...
Python

Python Excel操作 逆引き集 | 書き込み時に列書式を適用する

何をしたいテクニックなのかゴールはこうです。「pandas の DataFrame を Excel に書き出すとき、特定の列に“見た目の書式”をきちんと適用したい」たとえば、金額は「カンマ区切り・右寄...
Python

Python Excel操作 逆引き集 | DataFrameの列幅を自動調整して書き出す(xlsxwriter + 計算)

何をやりたいテクニックなのかゴールはこうです。「pandas の DataFrame を Excel に書き出すとき、列幅を“中身にちょうどいい幅”に自動調整したい」xlsxwriter をエンジンに...
Python

Python Excel操作 逆引き集 | 書き込み時のエンジン指定(xlsxwriter/openpyxl)

「エンジンを指定する」ってそもそも何をしているのかpandas が Excel に書き出すとき、実際に .xlsx ファイルを作っているのは「pandasそのもの」ではなく、openpyxl や Xl...
Python

Python Excel操作 逆引き集 | 書き込み開始セルを指定

何をするオプションなのかを一言でいうとstartrow= と startcol= は、「DataFrame を Excel に書き出すとき、どのセルから書き始めるか」を指定するためのオプションです。行...
Python

Python Excel操作 逆引き集 | 書き込み時にヘッダーを出力しない

まず「ヘッダーを出さない」とは何を意味するか通常 DataFrame.to_excel() を呼ぶと、1行目に「列名(カラム名)」が書き出されます。これが ヘッダー行 です。header=False ...
Python

Python Excel操作 逆引き集 | 書き込み時にインデックスを出力しない

そもそも「インデックス」って何者かpandas の DataFrame には、左端に「0, 1, 2, …」と並ぶ“行番号”のようなものがあります。これが インデックス(index) です。Pytho...
Python

Python Excel操作 逆引き集 | 既存ファイルにシート追加で書き出す

何をしたい機能なのかをまず言葉でつかむやりたいことはこうです。「すでに存在する Excel ファイル(既存ブック)に、新しいシートを“追加”して書き込みたい。既存のシートはそのまま残したい。」そのため...
Python

Python Excel操作 逆引き集 | 複数シートを書き出す

まずゴールのイメージをはっきりさせるやりたいことはシンプルです。「複数の DataFrame を、1つの Excel ファイルの別々のシートに書き出したい」。pandas では、そのためにpandas...
Python

Python Excel操作 逆引き集 | ExcelへDataFrameを書き出す

ゴールのイメージを先に共有するここまで「Excel → DataFrame」の話をしてきましたが、現場ではその逆、「DataFrame → Excel」に書き出したい場面もめちゃくちゃ多いです。Dat...
Python

Python Excel操作 逆引き集 | 読み込み時にカラムの変換関数を使う

「読み込んでから直す」じゃなく「読み込む瞬間に直す」Excelの生データって、だいたいこういう“ちょっとイヤな感じ”が混ざっています。前後にスペースが付いた文字列(" A001 ")全角・半角が混ざっ...
Python

Python Excel操作 逆引き集 | 読み込み時に列名をリネームして取り込む

「読み込んだあとに rename」ではなく「最初からいい名前で読む」Excelの列名って、だいたいこうですよね。「日付(売上)」「売上金額(税込)」「Unnamed: 3」「No.」人間には意味がわか...
Python

Python Excel操作 逆引き集 | 空白列を削除しつつ読み込む

「最初からいらない列は読まない」という発想を持つ現場のExcelには、なぜか「空白の列」「名前が付いていない列」「スペースだけの列」が平気で混ざっています。それをそのまま read_excel で読む...
Python

Python Excel操作 逆引き集 | Excelから複数のヘッダー行を持つ読み込み

「ヘッダーが1行とは限らない」という発想を持つ現場のExcelって、きれいに1行だけ列名が並んでいるとは限らないですよね。例えばこんな表、見覚えありませんか?2025年1月2025年1月2025年2月...
Python

Python Excel操作 逆引き集 | xls(旧形式)ファイルを読む

xls(旧形式)を読むときにまず知っておくべきこと.xls は Excel 97〜2003 の旧形式で、現在の .xlsx とは内部構造がまったく違います。そのため、pandas が .xls を読む...
Python

Python Excel操作 逆引き集 | エンジン指定(openpyxl/xlrd)

「エンジンを指定する」とは何をしているのかpandas.read_excel 自体は「Excelを読む関数」ですが、実際に .xlsx や .xls の中身を開いて解析しているのは、openpyxl ...
Python

Python Excel操作 逆引き集 | チャンクで読み込む(大ファイル)

「一気に全部読まない」という武器を持つ行数が何十万、何百万あるExcelを、read_excel で一気に読み込もうとすると、メモリがパンパンになって固まる——これはよくあるパターンです。そこで出てく...
Python

Python Excel操作 逆引き集 | 既存のExcelをDataFrameの辞書で読み込む

「Excel全体を一気に読む」という発想を持つふつうの read_excel("file.xlsx") は、デフォルトで「最初のシートだけ」を DataFrame にします。でも、実務の Excel ...
Python

Python Excel操作 逆引き集 | コメント行(#など)を無視して読み込む

まず大事な前提:「comment='#' は read_excel では使えない」ここが一番重要なポイントです。comment='#' という引数は pandas.read_csv にはありますが、p...
Python

Python Excel操作 逆引き集 | NA文字を指定して欠損扱いにする

「これは空欄と同じだよ」と教えてあげる発想Excelの現場データには、本当は「値がない」だけなのに、いろんな書き方が混ざります。NA-なし未入力人間は「これは空欄みたいなものだな」とすぐわかりますが、...
Python

Python Excel操作 逆引き集 | インデックス列として読み込む

「インデックスとして読む」とは何をしているのかpandas の DataFrame には「行番号」を表すインデックスがあります。何も指定しないと 0,1,2,3,… という単なる連番ですが、「日付」や...
Python

Python Excel操作 逆引き集 | 日付列を自動でパースする

なぜ「日付を自動でパースする」がそんなに大事なのかExcelから読み込んだ日付を文字列のまま扱うと、「月ごとに集計したい」「期間で絞り込みたい」ときに、毎回 to_datetime を書くことになりま...
Python

Python Excel操作 逆引き集 | 読み込み時にデータ型を指定する

「型を決めてから読む」という発想を持つExcelは何でも受け入れてくれるので、同じ列に数字・文字・空白が混ざっていることがよくあります。そのまま read_excel に任せると、pandasが「たぶ...
Python

Python Excel操作 逆引き集 | 部分行だけ読み込む(nrows)

「全部の行はいらない」という発想を持つExcelをそのまま read_excel すると、シートの全行がDataFrameに入ります。でも、実務や検証では「とりあえず先頭だけ見たい」「巨大ファイルなの...
Python

Python Excel操作 逆引き集 | 読み込み時に先頭行をスキップする

なぜ「先頭行をスキップする」がこんなに大事なのか現場のExcelは、いきなり表が始まってくれません。会社ロゴ、レポートタイトル、出力日、担当者名、空行…そのあとにようやく「本当のデータ」が出てきます。...
Python

Python Excel操作 逆引き集 | 読み込み時に特定列だけ選ぶ

「全部の列はいらない」がデフォルトだと思ってほしいExcelをそのまま read_excel すると、シートの全列がDataFrameに入ります。でも、実務で「全部の列を本当に使う」ことはほとんどあり...
Python

Python Excel操作 逆引き集 | 読み込み時に列名がない場合の処理

「列名がないExcel」をどう読むかという発想現場のExcelには、最初の行に列名が書かれていないものが普通にあります。例えば、いきなりこういう表から始まるパターンです。| 2025/01/01 | ...
Python

Python Excel操作 逆引き集 | 特定シートだけ読み込む

なぜ「特定シートだけ読む」を意識すべきかExcelファイルは、1つのファイルの中に複数のシートを持てます。でも、実務で「全部のシートを毎回読む」ことはほとんどありません。欲しいのはたいてい「このシート...
Python

Python Excel操作 逆引き集 | Excelファイルを複数シート読み込む

複数シート読み込みの全体像をつかむpandas.read_excel("file.xlsx", sheet_name=None) は、「Excelファイルの全シートを、一気に読み込んで、dict(辞書...
Python

Python Excel操作 逆引き集 | Excelファイルを読み込む

pandas.read_excel とは何かpandas.read_excel は、「Excelファイル → DataFrame」に変換するための入り口です。一度 DataFrame にしてしまえば、...
スポンサーリンク