スポンサーリンク
Python

Python | ファイル・OS 操作:pandas の欠損値処理

概要(pandas の欠損値処理は「検出→方針決定→削除/補完→型整備」の順で進める)欠損値は NaN(Not a Number)や None で表現されます。集計・可視化・機械学習で誤差やエラーの原...
Python

Python | ファイル・OS 操作:pandas.plot

概要(pandas.plotは「DataFrameを即グラフ化」する最短ルート)pandasのplotは、DataFrameやSeriesから折れ線・棒・散布図などを1行で描ける可視化機能です。内部で...
Python

Python | ファイル・OS 操作:pandas.groupby

概要(groupbyは「カテゴリごとにまとめて計算」するための核機能)pandas.groupbyは、列(カテゴリ)でデータをグループ化して、合計・平均・件数などの集計を一気に行う仕組みです。SQLの...
Python

Python | ファイル・OS 操作:pandas の列操作

概要(pandas の列操作は「列名で考える」が合言葉)pandas の列操作は「列名を軸」に発想すると迷いません。列の選択・追加・更新・削除・並べ替え・型変換・文字列処理・条件列の作成まで、ほぼ1〜...
Python

Python | ファイル・OS 操作:pandas.DataFrame.to_excel

概要(to_excelは「DataFrameをExcelに保存」する最短ルート)pandas.DataFrame.to_excelは、表(DataFrame)を.xlsxへ書き出す標準メソッドです。基...
Python

Python | ファイル・OS 操作:pandas.DataFrame の基本

概要(DataFrameは「行と列の表」をコードで扱うための基本型)pandas.DataFrameは、Excelのような表(行・列)をPythonで扱うための中心データ構造です。列名(カラム)と行ラ...
Python

Python | ファイル・OS 操作:pandas.read_csv

概要(pandas.read_csvは「CSVをDataFrameに変換」する最短ルート)pandas.read_csvは、CSV(テキスト表)を一発でDataFrameへ読み込む関数です。初心者がま...
Python

Python | ファイル・OS 操作:Excel 書き込み(openpyxl)

概要(openpyxlで「Excelを書き出す」基本と落ちない勘所)openpyxlは.xlsxのExcelをPythonから生成・追記・整形できるライブラリです。初心者がまず掴むべき流れは「Work...
Python

Python | ファイル・OS 操作:Excel 読み込み(openpyxl)

概要(openpyxlで「Excelを安全に読み取る」基本と勘所)openpyxlは.xlsx形式のExcelをPythonで読み書きできる定番ライブラリです。読み込みでは「どのシートを読むか」「セル...
Python

Python | ファイル・OS 操作:JSON の ensure_ascii

概要(ensure_ascii は「ASCIIだけにするか、日本語をそのまま出すか」を決めるスイッチ)json.dumps/json.dump の ensure_ascii は、非ASCII文字(日本...
Python

Python | ファイル・OS 操作:CSV DictWriter

概要(DictWriterは「列名で書ける」CSV出力の定番)csv.DictWriterは、辞書(dict)をそのままCSVの行として書き込める標準機能です。列順やヘッダーを明示できるため、インデッ...
Python

Python | ファイル・OS 操作:CSV DictReader

概要(DictReaderは「列名でアクセスできる」CSV読み込みの定番)csv.DictReaderは、CSVの各行を「ヘッダーをキーにした辞書」として読み込める標準機能です。列名で参照できるので、...
Python

Python | ファイル・OS 操作:tarfile

概要(tarfile は「フォルダを丸ごと束ねて圧縮・展開」できる標準機能)tarfile は .tar、.tar.gz、.tar.bz2、.tar.xz などのアーカイブを作成・追記・一覧・解凍でき...
Python

Python | ファイル・OS 操作:ZIP 圧縮 zipfile

概要(zipfile は「作る・入れる・取り出す」をひとまとめにする標準機能)zipfile は ZIP アーカイブの作成・追加・一覧取得・解凍を行う標準ライブラリです。外部インストール不要で、ファイ...
Python

Python | ファイル・OS 操作:shutil.rmtree

概要(shutil.rmtree は「ディレクトリ丸ごと削除」を一発で行う強力な関数)shutil.rmtree は、ディレクトリとその中身(ファイル・サブディレクトリ)を再帰的にすべて削除します。空...
Python

Python | ファイル・OS 操作:shutil.move

概要(shutil.move は「移動・リネーム」を1行で安全にやる標準関数)shutil.move は、ファイル/ディレクトリを別の場所へ移動したり、名前を変更(リネーム)するための標準ライブラリの...
Python

Python | ファイル・OS 操作:glob

概要(glob は「パターンに合うファイルを一気に列挙」する標準手段)glob は、ワイルドカードを使って「条件に合うファイルやフォルダ」をまとめて取得する仕組みです。拡張子が .csv のファイルだ...
Python

Python | ファイル・OS 操作:mkdir(parents=True)

概要(mkdir(parents=True) は「途中の親も含めて安全に作る」ための一手)pathlib の Path.mkdir はディレクトリを作るメソッドです。parents=True を付ける...
Python

Python | ファイル・OS 操作:pathlib の結合

概要(pathlib の結合は「/ 演算子」で直感的に安全に書く)pathlib はファイルパスをオブジェクトとして扱う標準ライブラリです。結合は os.path.join を忘れて「/ 演算子」か ...
Python

Python | データ構造強化:速度計測(timeit)

概要(timeit は「公平に何度も走らせて平均速度を測る」ための標準ツール)timeit は、コードの実行時間を正確に測るための標準モジュールです。1回だけの計測はノイズに弱いので「複数回・同じ条件...
Python

Python | データ構造強化:不変性とバグ

概要(不変性は「勝手に変わらない」ことでバグの連鎖を止める安全装置)不変性(immutable)は「作った後に中身が変わらない」性質です。勝手に変わらないという保証は、参照共有や関数の副作用でデータが...
Python

Python | データ構造強化:mutable / immutable

概要(mutable と immutable は「変更できるかどうか」を決める重要な性質)Python のオブジェクトは、作成後に中身を変更できるもの(mutable)と、変更できないもの(immut...
Python

Python | データ構造強化:データ構造の選択基準

概要(「何をしたいか」から逆算してデータ構造を選ぶ)データ構造は「どんな操作を、どれくらいの規模で、どんな制約の下で行うか」で選びます。最重要ポイントは、必要な操作(検索・追加・削除・並べ替え・集計)...
Python

Python | データ構造強化:any / all 条件判定

概要(any / all は「ひとつでも満たす」「全部満たす」を一瞬で判定する心臓部)any と all は、並んだ条件の集合から「ひとつでも満たすか(any)」「全部満たすか(all)」を短く判定す...
Python

Python | データ構造強化:内包表記で条件付き

概要(内包表記の「条件付き」は“選ぶ・変換する”を1行で完結させる技)内包表記に条件を組み込むと、要素を選び(フィルタ)ながら、必要に応じて変換(if-else)までを1行で書けます。for+appe...
Python

Python | データ構造強化:スタック

概要(スタックは「最後に入れたものが最初に出る」LIFOの基本構造)スタックは LIFO(Last-In, First-Out)で要素を管理するデータ構造です。直前の操作を元に戻す「Undo」、括弧の...
Python

Python | データ構造強化:キュー

概要(キューは「先に入れたものが先に出る」安全な順序制御の基本構造)キューは、FIFO(First-In, First-Out)で要素を管理するデータ構造です。タスクの順序制御、イベントの順序処理、ス...
Python

Python | データ構造強化:辞書内のリスト操作

概要(辞書の値にリストを持たせて「グループ化・順次追加」を安全に扱う)辞書の中にリストを入れると、「キーごとに複数の要素」を自然に管理できます。たとえばカテゴリごとの商品一覧、ユーザーごとの履歴、タグ...
Python

Python | データ構造強化:タプルのアンパック

概要(タプルのアンパックは「並んだ値を並んだ変数へ一度に割り当てる」)タプルのアンパックは、複数の値を一度に複数の変数へ代入する文法です。インデックスを使わず「意味のある名前」に直で割り当てられるので...
Python

Python | データ構造強化:二次元リストのループ

概要(二次元リストのループは「外側=行、内側=列」を丁寧にまわすのが基本)二次元リストは「リストの中にリスト」を持つ入れ子構造です。ループは外側で行(row)を、内側で列(value)を走査するのが基...
スポンサーリンク