Java | Java 詳細・モダン文法：JVM・パフォーマンス – ヒープ / スタック

ヒープとスタックを「机」と「倉庫」でイメージする
スタックとは何か：メソッド呼び出しの「作業机」
ヒープとは何か：new したものが住む「オブジェクト倉庫」
1. 何がヒープに置かれるのか
2. ヒープと GC（ガーベジコレクション）
スタックとヒープを一つのコードで追いかけてみる
パフォーマンスの観点から見たヒープ / スタック
1. スタックは「軽いが有限」
2. ヒープは「大きいが GC コストがある」
まとめ：ヒープ / スタックを自分の言葉で説明するなら

ヒープとスタックを「机」と「倉庫」でイメージする

まずはイメージからいきましょう。
スタックは「今やっている作業のための机」。
ヒープは「作ったモノを置いておく大きな倉庫」。

机（スタック）の上には、今呼び出しているメソッドのローカル変数や一時的な値が並びます。
倉庫（ヒープ）には、new したオブジェクトや配列がどんどん置かれていきます。

この二つの役割の違いが分かると、
「なぜ再帰しすぎると StackOverflowError になるのか」
「なぜ GC が必要なのか」
といった話が一気に腑に落ちます。

スタックとは何か：メソッド呼び出しの「作業机」

スレッドごとに一つずつある

スタックは「スレッドごと」に一つずつ用意されます。
スレッドが増えれば、その分スタックも増えます。

メソッドを呼び出すたびに、そのメソッド専用の「スタックフレーム」という小さな箱が、スタックの上に積み上がります。
メソッドが終わると、そのフレームはポンと取り除かれます。

つまりスタックは、「今動いているメソッドたちの“呼び出し履歴”と“ローカル変数”が積み重なっている場所」です。

何がスタックに置かれるのか

スタックフレームの中には、主に次のようなものが入ります（言葉でイメージしてください）。

メソッドの引数。
メソッド内のローカル変数。
計算途中の一時的な値。
戻り先の情報。

プリミティブ型（int, long, double など）のローカル変数は、その値がそのままスタックに置かれます。
参照型（String, List など）のローカル変数は、「ヒープ上のオブジェクトへの参照（住所）」だけがスタックに置かれます。

オブジェクトの“中身”はスタックには来ません。
スタックにあるのは、あくまで「どのオブジェクトを指しているか」という情報だけです。

スタックオーバーフローはなぜ起きるのか

スタックにはサイズの上限があります。
再帰呼び出しを深くしすぎると、フレームが積み上がりすぎて、スタックがいっぱいになります。

public class StackOverflowSample {
    static void recurse(int n) {
        System.out.println(n);
        recurse(n + 1); // 終わらない再帰
    }

    public static void main(String[] args) {
        recurse(0);
    }
}

public class StackOverflowSample {
    static void recurse(int n) {
        System.out.println(n);
        recurse(n + 1); // 終わらない再帰
    }

    public static void main(String[] args) {
        recurse(0);
    }
}

Java

このコードでは、recurse が呼ばれるたびに新しいスタックフレームが積まれます。
戻ることなく呼び続けるので、いつかスタックの上限を超え、StackOverflowError が発生します。

「スタックはメソッド呼び出しのための有限の積み重ねスペース」
というイメージを持っておくと、このエラーの意味がよく分かります。

ヒープとは何か：new したものが住む「オブジェクト倉庫」

何がヒープに置かれるのか

ヒープには、new したオブジェクトや配列が置かれます。

String s = new String("hello");
int[] arr = new int[3];
List<String> list = new ArrayList<>();

String s = new String("hello");
int[] arr = new int[3];
List<String> list = new ArrayList<>();

Java

ここで作られた String の実体、int[] の実体、ArrayList の実体は、すべてヒープに置かれます。
変数 s, arr, list はスタックにあり、それぞれ「ヒープ上のどのオブジェクトを指しているか」という参照を持っています。

つまり、ヒープは「参照型の実体が住む場所」です。

ヒープと GC（ガーベジコレクション）

ヒープに置かれたオブジェクトは、プログラマが手動で解放する必要はありません。
どこからも参照されなくなったタイミングで、GC が自動的に回収してくれます。

例えば、次のようなコードを考えます。

void sample() {
    String s = new String("hello");
    // ここで s を使う
}
// ここで sample が終わる

void sample() {
    String s = new String("hello");
    // ここで s を使う
}
// ここで sample が終わる

Java

sample が終わると、スタック上の s は消えます。
それに伴って、ヒープ上の "hello" オブジェクトは「どこからも参照されていない」状態になります。
次に GC が走ったとき、このオブジェクトは回収対象になります。

この「参照が残っている限り GC されない」という性質が、メモリリークの原因にもなります。
もう使わないオブジェクトを、static フィールドや長寿命のコレクションで持ち続けていると、GC はそれを回収できません。

スタックとヒープを一つのコードで追いかけてみる

例コード

public class HeapStackExample {
    public static void main(String[] args) {
        int a = 10;
        String s = new String("hello");
        int[] arr = new int[2];
        arr[0] = a;
        process(s, arr);
    }

    static void process(String msg, int[] values) {
        int len = values.length;
        System.out.println(msg + " : " + len);
    }
}

public class HeapStackExample {
    public static void main(String[] args) {
        int a = 10;
        String s = new String("hello");
        int[] arr = new int[2];
        arr[0] = a;
        process(s, arr);
    }

    static void process(String msg, int[] values) {
        int len = values.length;
        System.out.println(msg + " : " + len);
    }
}