Java バッチの前処理・本処理・後処理を CsvImportJob で実装する

概要

バッチ処理の設計で最も基本的かつ重要なのは、前処理・本処理・後処理の責務を明確に分離することです。前処理で入力ファイルの存在確認や形式チェックを済ませておけば、本処理で初歩的なエラーに悩まされることはありません。後処理で処理件数やエラー件数のサマリを出力すれば、運用担当者が実行結果を即座に判断できます。近年開発されるシステムでは Spring Batch のようなフレームワークを採用するケースが増えていますが、金融・製造・物流の基幹系や、長年稼働してきたレガシー環境では JP1・Hinemos・TWS などのジョブマネージャによるスケジューリングが前提になっていることが多く、「コマンドラインで起動できる JAR を用意して終了コードで正否を返す」というシンプルな構成が今も広く使われています。この構成では、終了コード・リラン/リカバリ設計・HA クラスタでの二重起動防止・監視システムへのログ連携が、フレームワークが提供してくれない分だけ自前で考慮する必要があります。BatchJob インターフェースを CSV 取込ジョブとして実装し、入力ファイルの存在確認（前処理）、1行ずつの読込とバリデーション（本処理）、処理結果のサマリ出力と System.exit（後処理）を具体的なコードで示した。

使いどころ

取引先から受領した CSV ファイルを日次バッチで取り込み、バリデーション結果をログに出力する

JP1 や cron に登録したバッチジョブが終了コードで成否を返し、ジョブマネージャのアラート通知と連動させる

HA クラスタ（active-standby 構成）上で実行するバッチが、フェイルオーバー後の二重起動を防ぎつつリランを安全に行う

コード例

CsvImportJob の実装（ジョブマネージャ連携・リラン対応）

import java.io.BufferedReader;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileWriter;
import java.io.InputStreamReader;
import java.util.ArrayList;
import java.util.List;
import java.util.logging.Level;
import java.util.logging.Logger;

/**
 * CSV 取込バッチ — ジョブマネージャ連携版
 *
 * 終了コード:
 *   0 ... 正常終了（全件処理成功）
 *   1 ... 警告終了（スキップあり・後続ジョブは続行）
 *   2 ... 異常終了（処理中断・後続ジョブを止める）
 *
 * リラン設計:
 *   - チェックポイントファイル（.done）が存在する場合はスキップ
 *   - 多重起動防止: ロックファイル（.lock）を起動時に作成・終了時に削除
 */
public class CsvImportJob {
    private static final Logger LOGGER = Logger.getLogger(CsvImportJob.class.getName());
    private static final int EXPECTED_COLUMNS = 4;
    private static final int MAX_ERRORS = 100;

    private final File inputFile;
    private final File lockFile;
    private final File doneFile;
    private BufferedReader reader;
    private int totalCount;
    private int successCount;
    private final List<String> errors = new ArrayList<String>();

    public CsvImportJob(File inputFile) {
        this.inputFile = inputFile;
        this.lockFile  = new File(inputFile.getParent(), inputFile.getName() + ".lock");
        this.doneFile  = new File(inputFile.getParent(), inputFile.getName() + ".done");
    }

    /** 前処理: ファイル確認・多重起動防止・リラン判定 */
    public void initialize() throws Exception {
        // リラン判定: 前回正常終了していればスキップ
        if (doneFile.exists()) {
            LOGGER.info("[SKIP] 処理済みファイルを検出: " + doneFile.getName() + " — リラン対象外");
            System.exit(0);
        }
        // 多重起動防止: ロックファイルが存在すれば起動しない
        if (lockFile.exists()) {
            LOGGER.severe("[ERROR] 多重起動を検出: " + lockFile.getName() + " が存在します");
            System.exit(2);
        }
        // ロックファイル作成（PID と起動時刻を記録）
        try (FileWriter fw = new FileWriter(lockFile)) {
            fw.write("pid=" + ProcessHandle.current().pid()
                + " started=" + System.currentTimeMillis());
        }
        if (!inputFile.exists()) {
            LOGGER.severe("[ERROR] 入力ファイルが見つかりません: " + inputFile);
            lockFile.delete();
            System.exit(2);
        }
        reader = new BufferedReader(
            new InputStreamReader(new FileInputStream(inputFile), "UTF-8"));
        String header = reader.readLine();
        if (header == null) {
            LOGGER.severe("[ERROR] 入力ファイルが空: " + inputFile.getName());
            lockFile.delete();
            System.exit(2);
        }
        LOGGER.info("[START] ジョブ開始 file=" + inputFile.getName());
    }

    /** 本処理: 1行ずつ読み込んでバリデーション */
    public int execute() throws Exception {
        String line;
        int lineNum = 1;
        while ((line = reader.readLine()) != null) {
            lineNum++;
            totalCount++;
            if (line.trim().isEmpty()) continue;
            String[] cols = line.split(",", -1);
            if (cols.length != EXPECTED_COLUMNS) {
                errors.add("行" + lineNum + ": カラム数不一致(" + cols.length + ")");
                if (errors.size() >= MAX_ERRORS) {
                    LOGGER.warning("[WARN] エラー上限(" + MAX_ERRORS + "件)到達 — 中断");
                    return 2;
                }
                continue;
            }
            if (cols[0].trim().isEmpty() || cols[1].trim().isEmpty()) {
                errors.add("行" + lineNum + ": 必須項目が空");
                continue;
            }
            successCount++;
        }
        return errors.isEmpty() ? 0 : 1;
    }

    /** 後処理: サマリ出力・ロック解除・完了フラグ書き込み */
    public void terminate(int exitCode) {
        if (reader != null) { try { reader.close(); } catch (Exception e) { /* ignore */ } }

        // 監視システムが拾えるキーワードを含むサマリログ
        // ジョブ名・総件数・成功件数・エラー件数・終了コードを必ず含める
        String status = exitCode == 0 ? "SUCCESS" : exitCode == 1 ? "WARNING" : "ERROR";
        LOGGER.info(String.format("[%s] job=CsvImportJob total=%d success=%d error=%d exitCode=%d",
            status, totalCount, successCount, errors.size(), exitCode));
        for (String err : errors) { LOGGER.warning("[DETAIL] " + err); }

        // 正常/警告終了時は完了フラグを書き込み、次回リランをスキップ
        if (exitCode < 2) {
            try (FileWriter fw = new FileWriter(doneFile)) {
                fw.write("completed=" + System.currentTimeMillis()
                    + " success=" + successCount + " errors=" + errors.size());
            } catch (Exception e) {
                LOGGER.warning("[WARN] 完了フラグの書き込み失敗: " + e.getMessage());
            }
        }
        // ロックファイル削除（異常終了時も必ず削除）
        lockFile.delete();
    }

    /**
     * エントリポイント — ジョブマネージャから呼ばれる想定
     *
     * 起動例（JP1 / cron）:
     *   java -Xmx512m -cp batch.jar CsvImportJob /data/import/sales_20240501.csv
     *
     * HA クラスタ注意:
     *   active-standby 切替後は同じファイルで二重起動が起こりうる。
     *   ロックファイルと .done ファイルを共有ストレージ上に置くこと。
     */
    public static void main(String[] args) {
        if (args.length < 1) {
            System.err.println("使い方: java CsvImportJob <CSVパス>");
            System.exit(2);
            return;
        }
        CsvImportJob job = new CsvImportJob(new File(args[0]));
        int exitCode = 2;
        try {
            job.initialize();
            exitCode = job.execute();
        } catch (Exception e) {
            LOGGER.log(Level.SEVERE, "[ERROR] 予期しない例外 job=CsvImportJob", e);
        } finally {
            job.terminate(exitCode);
        }
        // ジョブマネージャに終了コードを返す — return ではなく必ず System.exit() を使う
        System.exit(exitCode);
    }
}

Java 8 / 17 / 21 の完全なサンプルコードは GitHub リポジトリで確認できます。

Version Coverage

Files.lines() で読込がシンプルになる。var でローカル変数の型宣言を省略できる。

Java 17

// Java 17: Files.lines() でストリーム処理
try (var lines = Files.lines(path, StandardCharsets.UTF_8)) {
    lines.skip(1).map(line -> line.split(",", -1))
         .filter(cols -> cols.length == expected)
         .forEach(this::processRecord);
}

Library Comparison

Pure Java（BufferedReader + split）引用符なしの単純な CSV で外部依存を入れられない場合。ジョブマネージャから呼ばれる軽量バッチ。RFC 4180 準拠が必要な場合は自前実装の工数が増える。

OpenCSV引用符囲み、エスケープ、Bean バインドが必要な場合。外部依存が増える。単純な CSV には過剰。

Apache Commons CSVRFC 4180 準拠の厳密なパースが必要な場合。Commons 系の依存が増える。

注意点

CSV のカラム区切りにカンマを使う場合、値にカンマが含まれるケースを考慮すること

BufferedReader は finally で必ず閉じること。terminate() で閉じる設計にする場合、execute() が例外で中断しても漏れなく解放されることを確認する

バリデーションエラーが大量に出る場合、全行をメモリに溜めるとヒープを圧迫する。エラー上限を設けること

入力ファイルの文字コードが Shift_JIS の場合、InputStreamReader で明示的にエンコーディングを指定する

実務では前処理・本処理・後処理の責務が曖昧なバッチが多く、本処理の冒頭で入力ファイルの存在確認をしていたり、ループ内でサマリ集計していたりする。責務の分離を最初に決めておくだけで保守コストが大きく下がる

ジョブマネージャに登録するバッチは System.exit() で終了コードを明示的に返すこと。正常終了 0、警告（スキップあり）1、異常終了 2 のように体系化しておくと、ジョブネットの後続条件設定が安定する。return で抜けた場合の終了コードは 0 になるため、例外で終了したケースが見逃されやすい

リラン（再実行）を安全に行うには冪等性の設計が必要。すでに取り込んだレコードを再度 INSERT するとデータが重複する。処理済みフラグをファイルや DB で管理するか、UPSERT（INSERT OR UPDATE）で対処すること。どこまで処理したかをチェックポイントファイルに残しておくと、中断後のリスタートが正確になる

HA クラスタで active-standby 切替後に同じジョブが二重起動されることがある。ロックファイル（起動時に作成・終了時に削除）か DB の排他フラグで多重起動を防ぐこと。ロックファイルが異常終了後に残り続けるケースも想定し、タイムスタンプと PID を記録して古いロックを検出できる仕組みを持たせること

監視システム（Zabbix・Datadog・SIEM 等）でバッチの異常を検知するには、ログに一定のキーワードパターンが必要になる。ERROR や FATAL のプレフィックスを統一し、ジョブ名・処理件数・終了コードを必ず含めること。標準出力への println だけでは監視エージェントに拾われないことがある

バッチの実行時間に業務上の制限（例：夜間ウィンドウ 23:00〜05:00 の 6 時間以内）がある場合、事前にデータ件数 × 1レコードあたりの処理時間を見積もること。想定ヒープサイズは「同時保持するデータ行数 × 1行あたりのオブジェクトサイズ」で粗く計算し、-Xmx で上限を明示すること。メモリ不足は OutOfMemoryError として現れるが、実行時間超過はジョブマネージャのタイムアウト強制終了となりログが残らないこともある

FAQ

ヘッダー行の有無はどう判定すればよいですか。

設定値で「ヘッダーあり/なし」を指定する方法が安全です。自動判定は誤判定のリスクがあります。

ジョブマネージャに登録するとき終了コードはどう設計しますか。

0=正常終了、1=警告（スキップあり・後続は実行）、2=異常終了（後続を止める）の3値が最低限必要です。ジョブマネージャのジョブネット設定と事前に合わせておくことが重要です。return で抜けると終了コードが 0 になるため、必ず System.exit() で返してください。

バッチ失敗後のリランはどう設計すればよいですか。

処理済みレコードを再実行しても結果が変わらない冪等設計が基本です。DB への INSERT は UPSERT に変えるか、処理済みフラグをテーブルで管理します。中断ポイントをチェックポイントファイルに残せば、全件ではなく途中からのリスタートも可能になります。

実行時間の見積もりはどう行いますか。

テスト環境で実データに近いデータ量を使った計測が最も信頼できます。概算は「件数 × 1件あたりの処理時間（ms）」で出し、業務ウィンドウの 70〜80% 以内に収まるか確認します。I/O が支配的な場合はストレージ速度の差が大きく効くため、本番相当の環境での計測を推奨します。

Java バッチの前処理・本処理・後処理を CsvImportJob で実装する

概要

使いどころ

コード例

注意点

FAQ

関連書籍