Claude Code に Code Review を導入
本日、Code Review を発表します。これは、すべての PR にエージェントチームを派遣し、ざっと目を通しただけでは見逃してしまうバグを検出する機能で、スピードではなく深さを重視して構築されています。Anthropic ではほぼすべての PR に対してこのシステムを実行しています。Team および Enterprise 向けにリサーチプレビューとして提供を開始します。
レビューのボトルネックへの対応
Anthropic のエンジニア一人あたりのコード出力は、過去 1 年間で 200% 増加しました。コードレビューがボトルネックになっており、お客様からも毎週同じ声が聞こえてきます。開発者のリソースは限られており、多くの PR は深く読み込まれることなく、ざっと目を通されるだけになっていると。
私たちには、すべての PR で信頼できるレビュアーが必要でした。Code Review はその成果です。人間のレビュアーが見逃しがちなバグを検出する、深いマルチエージェントレビューです。既存のオープンソースの Claude Code GitHub Action よりも徹底的な(そしてより高コストな)オプションであり、GitHub Action は引き続きオープンソースとして利用可能です。
Anthropic ではほぼすべての PR で Code Review を実行しています。以前は、実質的なレビューコメントが付く PR は 16% でした。今では 54% です。PR を承認することはしません——それは引き続き人間の判断です——しかし、レビュアーが実際にリリースされるものをカバーできるよう、ギャップを埋めてくれます。
仕組み
PR がオープンされると、Code Review はエージェントチームを派遣します。エージェントは並行してバグを探し、バグを検証して偽陽性をフィルタリングし、重要度でバグをランク付けします。結果は、PR に単一のシグナルの高い概要コメントとして投稿され、特定のバグにはインラインコメントが付きます。
レビューは PR の規模に応じてスケールします。大規模または複雑な変更にはより多くのエージェントとより深い読み込みが行われ、軽微なものには軽量なパスが実行されます。テストに基づくと、平均的なレビューには約 20 分かかります。
Code Review の実際の動作
Code Review を数ヶ月間社内で運用してきました。大規模な PR(1,000 行以上の変更)では 84% に発見事項があり、平均 7.5 件の問題が報告されます。50 行未満の小規模な PR では 31% に下がり、平均 0.5 件です。エンジニアは検出された内容にほぼ同意しており、不正確と判定される発見事項は 1% 未満です。
ある事例では、本番サービスへの 1 行の変更が、一見すると定型的で、通常ならすぐに承認されるようなタイプの差分でした。しかし Code Review はこれを重大 (critical) としてフラグを立てました。この変更はサービスの認証を壊すものでした——差分をざっと見るだけでは見逃しやすいが、指摘されれば明白な障害モードです。マージ前に修正され、そのエンジニアは後に、自分では気づけなかっただろうと述べました。
早期アクセスのお客様でも同様のパターンが見られています。TrueNAS のオープンソースミドルウェアにおける ZFS 暗号化のリファクタリングで、Code Review は隣接するコード内の既存のバグを検出しました。すべての同期時に暗号化キーキャッシュを暗黙的に消去してしまう型の不一致です。これは PR がたまたま触れたコード内の潜在的な問題であり、変更セットをスキャンする人間のレビュアーがすぐに探しに行くようなものではありませんでした。
コストとコントロール
Code Review は深さを重視して最適化されており、Claude Code GitHub Action のような軽量なソリューションよりもコストが高くなります。レビューはトークン使用量に基づいて課金され、一般的に平均 15 - 25 ドルで、PR の規模と複雑さに応じてスケールします。
管理者にはコストと利用を制御する多くの方法があります:
- 月次組織キャップ: すべてのレビューの合計月間支出を定義
- リポジトリレベルの制御: 選択したリポジトリのみでレビューを有効化
- 分析ダッシュボード: レビューされた PR 数、承認率、レビュー総コストを追跡
始め方
Code Review は、Team および Enterprise プラン向けにリサーチプレビュー(ベータ版)として今すぐ利用可能です。
- 管理者向け: Claude Code の設定で Code Review を有効化し、GitHub App をインストールして、レビューを実行するリポジトリを選択してください。
- 開発者向け: 有効化されると、新しい PR に対してレビューが自動的に実行されます。設定は不要です。
詳細はドキュメントをご覧ください。