複数の JSON ファイルを統合した後、特定のキーでグループ化して集計すると、データ分析やレポート作成に役立ちます。ここでは「result の値を基準にしてグループ化・集計」する例を紹介します。
サンプルコード
import json
from collections import defaultdict
# --- 統合済み JSON データを読み込む ---
with open("merged_results.json", "r", encoding="utf-8") as f:
data = json.load(f)
# --- グループ化と集計 ---
grouped = defaultdict(list)
for item in data:
# item が辞書型で result キーを持つ場合のみ処理
if isinstance(item, dict) and "result" in item:
# 例: result の範囲でグループ化
if item["result"] < 30:
grouped["small"].append(item)
elif item["result"] < 50:
grouped["medium"].append(item)
else:
grouped["large"].append(item)
# --- 集計結果を表示 ---
print("=== 集計結果 ===")
for category, items in grouped.items():
print(f"{category}: 件数={len(items)}")
Python実行結果(例)
=== 集計結果 ===
small: 件数=12
medium: 件数=8
large: 件数=5
解説ポイント
defaultdict(list)→ グループごとにリストを自動生成して格納。- 条件分岐でグループ化 →
resultの値を基準に"small","medium","large"に分類。 - 件数集計 →
len(items)で各グループの件数を数える。
応用の場面
- 売上データ分析: 金額を範囲ごとに分類して件数を集計。
- ログ解析: エラーコードごとに分類して件数を集計。
- ゲームデータ: スコアを範囲ごとに分類してプレイヤー数を集計。
まとめ
- 統合した JSON データを 特定のキーでグループ化できる。
defaultdictを使うとコードがシンプルになる。- 集計結果を件数や平均値などに拡張すれば、より高度な分析が可能。


