AI論文– category –
-
AI論文
[論文解説]報酬ハッキングが引き起こす創発的ミスアライメント:Anthropicの最新研究が示すAI安全性の新たな課題
はじめに AI開発において、強化学習(RL)は言語モデルを人間の意図に沿うように訓練する重要な手法として広く用いられています。しかし、2025年11月にAnthropicが発表した論文「Natural Emergent Misalignment from Reward Hacking in Production RL」は... -
AI論文
[論文解説]GPT-5.1-Codex-Maxシステムカード解説
はじめに 本稿では、OpenAIが発表した最新のフロンティアエージェント的コーディングモデル「GPT-5.1-Codex-Max」のシステムカードの内容を解説します。 GPT-5.1-Codex-Maxは、ソフトウェアエンジニアリング、数学、研究、医学など、エージェント的な... -
AI論文
[論文解説]Google「Gemini 3 Pro」モデルカード解説
はじめに 本稿では、Google DeepMindが発表した次世代の基盤モデル「Gemini 3 Pro」のモデルカードに基づき、その革新的な特徴と性能、そして安全対策について解説いたします。 Gemini 3 Proは、テキスト、画像、音声、動画、コードといった多様な情報... -
AI論文
[論文解説]Anthropic:AIが自律的に実行した初の国家級サイバー諜報活動の全貌
はじめに AI技術の急速な進展は、私たちの生活を豊かにする一方で、その悪用による新たな脅威を生み出しています。 本稿では、AI開発企業であるAnthropicが、彼らの開発したAIモデルの悪用を防ぐために高度な安全・セキュリティ対策を講じているにもか... -
AI論文
[論文解説]巨大AIを解析可能に:重みスパース化で実現するトランスフォーマーの回路解釈性
はじめに 近年、大規模言語モデル(LLM)をはじめとするニューラルネットワークの能力は急速に向上していますが、その内部で実際にどのようなアルゴリズムが実行されているのかについては、ほとんど理解されていません。 メカニズム的解釈性(Mechanis... -
AI論文
[AIツール利用者向け]OpenAI「GPT-5.1」発表:より温かく会話的なChatGPTへ進化
はじめに OpenAIが2025年11月12日、GPT-5シリーズの最新版となる「GPT-5.1」を発表しました。本稿では、この発表内容をもとに、GPT-5.1 InstantとGPT-5.1 Thinkingの新機能、パーソナライゼーション機能の強化、および今後の展開について解説します。 参... -
AI論文
[論文解説]異種データを操り、複雑な問いに答えるデータサイエンスエージェント DS-STARの計画・検証フレームワーク
はじめに データサイエンスは、生のデータから実用的な洞察を引き出し、データ駆動型の意思決定を支える上で不可欠な分野です。企業はデータから抽出される洞察に基づいて重要な方向性を決定しており、その重要性は高まっています。しかし、現実世界のデ... -
AI論文
[論文解説]脳の記憶メカニズムを再現するNested LearningとHOPEアーキテクチャ
はじめに 近年、大規模言語モデル(LLM)をはじめとする深層学習モデルは目覚ましい進歩を遂げていますが、その能力向上は主に、より強力なニューラルアーキテクチャの開発と、それを効果的に訓練するための最適化アルゴリズムの設計に依存してき... -
AI論文
[論文解説]Anthropicによる大規模言語モデルの内省能力に関する研究
はじめに 大規模言語モデル(LLM)は、自分の思考プロセスや意図について語ることができます。しかし、本当に自分の内部状態を認識しているのでしょうか、それとも単に訓練データから学んだパターンを模倣しているだけなのでしょうか。本稿では、Anthrop... -
AI論文
[論文解説]宇宙をデータセンターに:Googleが挑むAI計算資源の無限スケーラビリティ
はじめに 近年、Transformerモデルの開発と、それに続く生成的AIやマルチモーダルAIの台頭により、計算リソース(コンピュート容量)の需要が爆発的に増加しています。Googleでは、AIの効率化(例:Geminiのクエリエネルギー消費量を1年間で33倍削減)に...