AI論文– category –
-
AI論文
[論文解説] SAPO: 分散型AIが「知の共有」で強化学習を加速する「Sharing is Caring: Efficient LM Post-Training with Collective RL Experience Sharing」
はじめに 近年、大規模言語モデル(LLM)の目覚ましい進化は、私たちの生活やビジネスに大きな影響を与えています。しかし、これらのモデルの真の能力を引き出すためには、事前学習(pre-training)だけでなく、その後の学習後訓練(post-training)が非... -
AI論文
[論文解説]高効率オープンモデルK2-Thinkの論文「K2-Think: A Parameter-Efficient Reasoning System」を解説
はじめに 近年、大規模言語モデル(LLM)の進化は目覚ましく、特に推論能力においては、人間が解くのが難しいような数学の問題、複雑なプログラミング、高度な科学的推論といった分野で驚くべき性能を発揮しています。しかし、これらの最先端モデルは、... -
AI論文
[論文解説]OpenAIによる論文「なぜ言語モデルはハルシネーションを起こすのか」を解説
はじめに 近年、ChatGPTに代表される大規模言語モデル(LLM)は、私たちの生活や仕事に大きな変化をもたらしています。質問応答、文章生成、要約など、その応用範囲は多岐にわたります。しかし、LLMを使っていると、あたかも事実であるかのように、もっ... -
AI論文
[論文解説]OpenAIによるオープンウェイトLLMの悪用リスクに関する研究
はじめに 2025年8月にOpenAIがChatGPTの重みを公開しました。オープンソースやオープンウェイトでLLMが公開されることは、技術の民主化を促進する一方で、その悪用リスクについても懸念が議論されています。今回ご紹介するOpenAIの論文は、まさにこの「... -
AI論文
[論文解説]gpt-ossモデルカード
はじめに 今回は、OpenAIが公開した「gpt-oss-120b」と「gpt-oss-20b」という2つのオープンウェイトモデルについて、その詳細を深く掘り下げて解説していきたいと思います。 このモデルは、単にテキストを生成するだけでなく、推論能力やツール利用(... -
AI論文
[論文解説]AIの進化と安全性を探る:Claude Opus 4.1 システムカード解説
はじめに Anthropic社が新たに大規模言語モデル「Claude Opus 4.1」を発表しました。今回は、「Claude Opus 4.1」に関するシステムカード(System Card Addendum)を基に、その能力と安全対策について解説します。 ※概要を知りたい方: https://jobirun.... -
AI論文
[論文詳細解説]「Web検索」と「集中と選択」でより賢く自己改良するAI「MLE-STAR」
はじめに MLモデルの開発は、地道で手間のかかる作業が多く、データの前処理、特徴量エンジニアリング、モデルの選択、ハイパーパラメータの調整など、試行錯誤の連続です。データサイエンティストがこの一連の作業に費やす労力は決して少なくないことは... -
AI論文
[モデルカード解説]Gemini 2.5 Deep Think
はじめに 最先端のAI技術の進化は目覚ましく、日々新しいモデルが発表されています。その中でも、Googleが開発した「Gemini」シリーズは、その高い汎用性と強力な性能で注目を集めていますね。今回ご紹介するのは、その中でも特に推論能力を強化したモデ... -
AI論文
[論文詳細解説]AIとの協働:生成AIが仕事に与える影響を測定する
はじめに 近年、生成AI(Generative AI)の進化と普及は目覚ましく、私たちの働き方に大きな変革をもたらし始めています。AIが様々なタスクを改善し、効率化できる可能性を秘めているため、経済全体にどのような影響を与えるのかは、社会にとって非常に... -
AI論文
[論文詳細解説]大規模システム性能予測の新境地:テキストからテキストへの回帰モデル
はじめに 今回は、大規模なコンピューティングシステムにおける性能予測という、多くの産業にとって非常に重要な課題に、革新的なアプローチで挑んだGoogleの最新論文をご紹介します。その課題を「テキストからテキストへの回帰」という、意外な方法で解...