［開発者向け］企業のAIコーディングが期待外れに終わる理由──問題はモデルではなく「コンテキスト設計」にあり

2025-12-26

はじめに

　VentureBeatが2025年12月13日に公開した記事では、企業におけるAIコーディングのパイロット導入が期待外れに終わる理由を分析しています。LinkedInでジェネレーティブAIを推進するDhyey Mavani氏は、問題の本質はモデルの性能ではなく「コンテキスト」──すなわち、変更されるコードを取り巻く構造、履歴、意図──にあると指摘しています。本稿では、この記事をもとに、エージェント型AIコーディングの課題と、企業が取り組むべき「コンテキストエンジニアリング」について解説します。

参考記事

タイトル: Why most enterprise AI coding pilots underperform (Hint: It’s not the model)
著者: Dhyey Mavani
発行元: VentureBeat
発行日: 2025年12月13日
URL: https://venturebeat.com/ai/why-most-enterprise-ai-coding-pilots-underperform-hint-its-not-the-model

要点

企業のAIコーディング導入が期待外れに終わる主因は、モデルではなく「コンテキスト」の欠如である
エージェント型AIは、設計、テスト、実行、検証を横断して推論する能力を持つが、既存ワークフローに導入しただけでは生産性が低下する研究結果がある
成功する企業は、コンテキストをエンジニアリング対象として扱い、エージェントの作業メモリ、仕様、ワークフローを構造化している
McKinseyの2025年レポートによれば、生産性向上は既存プロセスへのAI追加ではなく、プロセス自体の再設計から生まれる
今後12〜24ヶ月で勝者となるのは、コンテキストを資産として設計し、ワークフローを製品として扱う企業である

詳細解説

支援型から自律型エージェントへの進化

　VentureBeatによれば、ソフトウェア開発におけるジェネレーティブAIは、単なる自動補完を超えて進化しています。現在の最前線は「エージェント型コーディング」──複数ステップにわたって変更を計画・実行し、フィードバックに基づいて反復するAIシステムです。

　研究レベルでは、エージェント的な振る舞いとは、孤立したコード断片を生成するのではなく、設計、テスト、実行、検証を横断して推論する能力を指すと定義され始めています。動的アクション再サンプリング（dynamic action re-sampling）に関する研究では、エージェントが自身の決定を分岐、再考、修正できるようにすることで、大規模で相互依存したコードベースにおける成果が大幅に向上することが示されました。

　プラットフォームレベルでは、GitHubが専用のエージェントオーケストレーション環境である「Copilot Agent」と「Agent HQ」を構築しており、実際の企業パイプライン内でのマルチエージェント協調をサポートしています。エージェント型AIは、複数のAIシステムが協調して作業を進める仕組みを指し、単一のAIツールよりも複雑なタスクに対応できる可能性があります。

　しかし、VentureBeatによれば、初期の現場結果は注意を促すものです。今年実施されたランダム化比較研究では、ワークフローを変更せずにAI支援を導入した開発者は、検証、手直し、意図の混乱により、タスク完了が遅くなったと報告されています。この教訓は明確です。オーケストレーション（調整・統制）なしの自律性は、効率性をもたらさないということです。

コンテキストエンジニアリングが真の鍵

　VentureBeatの記事では、著者が観察したすべての失敗事例において、失敗の原因はコンテキストにあったと指摘されています。エージェントがコードベースの構造化された理解──具体的には、関連モジュール、依存関係グラフ、テストハーネス、アーキテクチャ規約、変更履歴──を欠いている場合、正しく見えるが現実から切り離された出力を生成することが多いとのことです。情報が多すぎるとエージェントは圧倒され、少なすぎると推測を強いられます。

　ここで言う「コンテキスト」とは、AIがコードを理解し適切な変更を行うために必要な、周辺情報や背景知識のことです。例えば、あるクラスがどのような役割を持ち、どのモジュールに依存し、過去にどのような変更が加えられたかといった情報が含まれます。

　VentureBeatによれば、目標はモデルにより多くのトークンを与えることではなく、何をいつ、どのような形式でエージェントに見せるべきかを決定することです。

　有意義な成果を上げているチームは、コンテキストをエンジニアリング対象として扱っています。彼らは、エージェントの作業メモリ──ターン間で何を保持し、何を破棄し、何を要約し、何をインライン化せずにリンクするか──をスナップショット、圧縮、バージョン管理するツールを作成しています。また、プロンプトセッションではなく、熟慮ステップを設計しています。仕様を、一時的なチャット履歴ではなく、レビュー可能、テスト可能、所有可能な第一級の成果物としています。このシフトは、一部の研究者が「仕様が新しい真実の源になる」と表現する広範なトレンドと一致しています。

　つまり、成功する企業は、AIエージェントに提供する情報を戦略的に設計し、管理しているということです。これにより、エージェントはより正確で実用的なコードを生成できるようになります。

ワークフローもツールと共に変革が必要

　しかし、コンテキストだけでは不十分です。VentureBeatによれば、企業はこれらのエージェントを中心としたワークフローを再設計する必要があります。

　McKinseyの2025年レポート「One Year of Agentic AI」では、生産性向上は既存プロセスにAIを重ねることからではなく、プロセス自体を再考することから生まれると指摘されています。チームが単にエージェントを変更されていないワークフローに投入すると、摩擦を招きます。エンジニアは、AIが書いたコードを検証するのに、自分で書くよりも多くの時間を費やすことになります。エージェントは、すでに構造化されているもの──十分にテストされ、モジュール化され、明確な所有権とドキュメントを持つコードベース──しか増幅できません。これらの基盤がなければ、自律性は混沌になります。

　これは、日本企業においても重要な示唆を持ちます。AIツールを導入する前に、既存の開発プロセスやコードベースの品質を見直す必要があると考えられます。

セキュリティとガバナンスの新しい課題

　セキュリティとガバナンスも、VentureBeatによれば、考え方の転換を求めています。AI生成コードは新しい形態のリスクを導入します。未検証の依存関係、微妙なライセンス違反、ピアレビューを逃れる文書化されていないモジュールなどです。

　成熟したチームは、エージェント活動をCI/CDパイプライン（継続的インテグレーション/継続的デリバリー）に直接統合し始めています。エージェントを、人間の開発者と同じ静的分析、監査ログ、承認ゲートを通過しなければならない自律的な貢献者として扱っています。

　CI/CDパイプラインとは、コードの変更を自動的にビルド、テスト、デプロイする仕組みであり、ソフトウェア開発の効率化と品質向上に不可欠な要素です。AIエージェントの出力もこのパイプラインに組み込むことで、人間が書いたコードと同等の品質管理が可能になります。

　GitHubの公式ドキュメントもこの軌道を強調しており、Copilot Agentsをエンジニアの代替ではなく、安全でレビュー可能なワークフロー内のオーケストレーションされた参加者として位置付けています。目標は、AIに「すべてを書かせる」ことではなく、AIが行動するときは、定義されたガードレール内で行動することを保証することです。

企業の意思決定者が今注目すべきこと

　VentureBeatによれば、技術リーダーにとって、今後の道筋は誇大宣伝ではなく準備から始まります。

　テストが疎なモノリシックなシステムでは、純利益を得ることはほとんどありません。エージェントは、テストが権威を持ち、反復的な改良を推進できる環境で繁栄します。これはまさに、Anthropicがコーディングエージェントに対して指摘するループです。

　限定されたドメイン（テスト生成、レガシーモダナイゼーション、孤立したリファクタリング）でパイロットを実施し、各デプロイメントを明示的な指標（欠陥逃亡率、PRサイクルタイム、変更失敗率、解消されたセキュリティ所見）を持つ実験として扱うことが推奨されています。

　使用量が増えるにつれて、エージェントをデータインフラとして扱うべきです。VentureBeatによれば、すべての計画、コンテキストスナップショット、アクションログ、テスト実行は、エンジニアリング意図の検索可能なメモリに構成され、持続的な競争優位性となるデータです。

　内部的には、エージェント型コーディングは、ツールの問題というよりデータの問題です。すべてのコンテキストスナップショット、テスト反復、コード修正は、保存、インデックス化、再利用されなければならない構造化データの形式になります。これらのエージェントが普及するにつれて、企業は全く新しいデータ層を管理することになります。それは、何が構築されたかだけでなく、どのように推論されたかを捉えるものです。このシフトにより、エンジニアリングログは意図、意思決定、検証の知識グラフに変わります。やがて、このコンテキスト記憶を検索し再生できる組織は、コードを静的なテキストとして扱い続ける組織を凌駕すると考えられます。

　VentureBeatによれば、来年は、エージェント型コーディングが企業開発の礎石となるか、またもや膨らんだ約束に終わるかを決定する年になると思われます。その違いは、コンテキストエンジニアリングにかかっています。チームがエージェントが依存する情報基盤をどれだけ賢く設計するかです。勝者は、自律性を魔法ではなく、規律あるシステム設計──明確なワークフロー、測定可能なフィードバック、厳格なガバナンス──の延長として見る者と指摘しています。

まとめ

　VentureBeatの記事は、企業のAIコーディング導入の成否が、モデルの性能ではなく「コンテキストエンジニアリング」にかかっていることを明確に示しています。プラットフォームはオーケストレーションとガードレールに収束しており、研究は推論時のコンテキスト制御を改善し続けています。今後12〜24ヶ月で勝者となるのは、最も派手なモデルを持つチームではなく、コンテキストを資産としてエンジニアリングし、ワークフローを製品として扱うチームと考えられます。