AI論文– category –
-
[研究紹介]Anthropicの最新研究から見るLLMの危険な自律行動:AIエージェントがもつ潜在的なリスク
はじめに AI技術の進化が目覚ましい今日この頃、大規模言語モデル(LLM)は私たちの生活や仕事に欠かせない存在になりつつあります。チャットボットとして質問に答えるだけでなく、最近では自分で判断し、様々なツールを使って行動する「自律的なAIエー... -
[論文紹介]OpenAIが発表した言語モデルに潜む「有害なペルソナ」の出現とその制御
はじめに 近年、ChatGPTのような大規模言語モデル(LLM)の汎用性と能力の高さには目覚ましいものがあります。しかし、その強力な「汎化能力」は、意図しない望ましくない挙動、例えば、モデルが不正確な情報を提供したり、ユーザーを扇動したりする原因... -
[論文解説]Mambaとは何か? Transformerの課題に挑戦する線形時間系列モデリング
はじめに 近年、AI分野では「基盤モデル(Foundation Models)」と呼ばれる、大規模なデータで事前学習されたモデルが様々な応用を牽引しています。これらのモデルのバックボーンとして広く使われているのが、TransformerアーキテクチャとそのAttention... -
[論文解説]DeepSeek-V3から学ぶ、大規模言語モデル開発を支えるハードウェアとモデルの協調設計
はじめに AI技術の進化は目覚ましく、大規模言語モデル(LLMs)は私たちの生活や仕事に革命をもたらしつつあります。最新モデルが次々と登場していますが、それらのモデルは、その性能向上のために、モデルサイズや学習データ、計算リソースを指数関数的... -
[論文解説]大規模言語モデルは著作権付きコンテンツを無断で利用しているのか? OpenAIのモデルを調査した研究を紹介
はじめに 大規模言語モデル(LLM)は、文章生成や対話など、様々なタスクで驚くべき能力を発揮しています。しかし、その強力な能力は、インターネット上の膨大なテキストデータや書籍データなどを学習することによって成り立っています。この学習に使わ... -
[論文解説]大規模言語モデルの著作権問題をどう検出するか?新手法「DE-COP」とは
はじめに 近年、大規模言語モデル(LLM)の進化は目覚ましく、私たちの生活や仕事に大きな変化をもたらしています。ChatGPTのようなLLMは、大量のデータを使って学習することで、非常に自然な文章を生成したり、複雑なタスクをこなしたりできるようにな... -
[論文解説]vLLMとPagedAttention:大規模言語モデルサービングのための効率的なメモリ管理に関する論文を解説
はじめに LLMをサービスとして提供する(サービングと呼びます)には、高性能なGPUが大量に必要となり、その運用コストは非常に高額となっています。 従来型の検索クエリと比べて、LLMのリクエスト処理は10倍もコストがかかるという試算もあるほどです。... -
[技術解説]ウェブ操作AI「OpenAI o3 Operator」システムカードを読み解く:その進化と安全性
はじめに 様々なタスクをこなしてくれる「AIエージェント」と呼ばれる分野が注目されています。本稿では、OpenAIが研究プレビューとして公開している「o3 Operator」について、システムカードから解説します。 Operatorは、「Computer Using Agent(CU... -
[論文解説]SUFFICIENT CONTEXT:RAGを「十分な文脈」という新たな視点で読み解く
はじめに AI技術の進化は目覚ましく、特に大規模言語モデル(LLM)は様々なタスクで高い性能を発揮しています。しかし、LLMが知らない情報を扱う際には課題があり、それを解決する手法の一つとしてRAG(Retrieval Augmented Generation)が注目されて... -
[論文解説]AIが画像や医療文書も理解して診察?最新の対話型診断AI「AMIE」の進化
Googleが2025年5月6日にarxivに発表した医療分野におけるAIシステムに関する論文「Advancing Conversational Diagnostic AI with Multimodal Reasoning」を紹介します。従来のテキストベースの対話だけでなく、「マルチモーダルデータ」(画像や医療文書...
12