LLM– tag –
-
[研究紹介]Anthropicの最新研究から見るLLMの危険な自律行動:AIエージェントがもつ潜在的なリスク
はじめに AI技術の進化が目覚ましい今日この頃、大規模言語モデル(LLM)は私たちの生活や仕事に欠かせない存在になりつつあります。チャットボットとして質問に答えるだけでなく、最近では自分で判断し、様々なツールを使って行動する「自律的なAIエー... -
[論文紹介]OpenAIが発表した言語モデルに潜む「有害なペルソナ」の出現とその制御
はじめに 近年、ChatGPTのような大規模言語モデル(LLM)の汎用性と能力の高さには目覚ましいものがあります。しかし、その強力な「汎化能力」は、意図しない望ましくない挙動、例えば、モデルが不正確な情報を提供したり、ユーザーを扇動したりする原因... -
[技術紹介]大規模AI学習の常識を変える!Google Cloudの「多層チェックポイント」技術で、時間とコストを削減
はじめに 本稿では、Google Cloudの公式ブログ「Save early and often with multi-tier checkpointing to optimize large AI training jobs」を基に、大規模なAIモデルの学習効率を劇的に向上させる新技術「多層チェックポイント(Multi-tier Checkpoint... -
[技術紹介]AIの未来を安全に:MicrosoftとLangChainの提携が示すオープンソースセキュリティの新基準
はじめに 本稿では、急速に進化するAI開発の現場で注目を集めるオープンソースフレームワーク「LangChain」と、そのセキュリティ強化に向けたMicrosoftの重要な取り組みについて「Microsoft and LangChain: Leading the Way in AI Security for Open Sou... -
[ニュース解説]AI時代到来!今日から始める「AIサバイバルキット」活用術
はじめに 本稿では、急速に進化するAI(人工知能)技術と共存し、それを自己の成長やキャリアアップに活かすための具体的な方法についてAxiosが発行した「Behind the Curtain: Your AI survival kit」をもとに解説します。 引用元記事 タイトル: Behind ... -
[論文解説]Mambaとは何か? Transformerの課題に挑戦する線形時間系列モデリング
はじめに 近年、AI分野では「基盤モデル(Foundation Models)」と呼ばれる、大規模なデータで事前学習されたモデルが様々な応用を牽引しています。これらのモデルのバックボーンとして広く使われているのが、TransformerアーキテクチャとそのAttention... -
[技術紹介]ハードウェアの壁に挑むDeepSeek-V3:次世代AIを支える協調設計の本質と低コストの秘密
はじめに 本稿では、DeepSeek-AIが発表した論文「Insights into DeepSeek-V3: Scaling Challenges and Reflections on Hardware for AI Architectures」を基に、大規模言語モデル(LLM)の急速な進化に伴い顕在化するハードウェアの限界と、その課題に革... -
[論文解説]DeepSeek-V3から学ぶ、大規模言語モデル開発を支えるハードウェアとモデルの協調設計
はじめに AI技術の進化は目覚ましく、大規模言語モデル(LLMs)は私たちの生活や仕事に革命をもたらしつつあります。最新モデルが次々と登場していますが、それらのモデルは、その性能向上のために、モデルサイズや学習データ、計算リソースを指数関数的... -
[論文解説]vLLMとPagedAttention:大規模言語モデルサービングのための効率的なメモリ管理に関する論文を解説
はじめに LLMをサービスとして提供する(サービングと呼びます)には、高性能なGPUが大量に必要となり、その運用コストは非常に高額となっています。 従来型の検索クエリと比べて、LLMのリクエスト処理は10倍もコストがかかるという試算もあるほどです。... -
vLLMとは何なのか:高速・高効率なLLMサービングエンジンについて
はじめに 大規模言語モデル(LLM)の実用化が進む中、巨大なモデルを効率的にサービングすることは重要な技術課題となっています。本稿では、UC Berkeley発のLLMサービングエンジン「vLLM(Versatile Language Model)」について、vLLM公式GitHubリポジ...