LLM– tag –
-
【エンジニア向け技術解説】Microsoft発・超効率1ビットLLM「BitNet b1.58 2B4T」登場!
はじめに 本稿では、Microsoft Researchによって開発された、初のオープンソース・ネイティブ1ビット大規模言語モデル(LLM)である「BitNet b1.58 2B4T」について詳しく解説します。その技術的な特徴、性能、そして実際の利用方法まで解説します。 引用... -
[技術解読]大規模言語モデルの「思考回路」を覗く:Anthropicによる解釈可能性研究の最前線
はじめに 近年、目覚ましい発展を遂げている大規模言語モデル(LLM)は、文章生成、翻訳、質疑応答など、多岐にわたるタスクで人間のような能力を発揮しています。しかし、ClaudeのようなLLMは、人間が直接プログラムするのではなく、大量のデータに基づ... -
[エンジニア向け]LLamaを超える「Cogito-v1-preview」が登場!ハイブリッド推論とツール連携で開発を加速するモデルの実装方法を解説
はじめに 本稿では、DeepCogitoによって開発された新しい命令チューニング済み生成モデル「Cogito v1 preview」についてご紹介します。このモデルは、テキストを入力として受け取り、テキストを出力するタイプのLLM(大規模言語モデル)であり、商用利用... -
[技術解説]新星LLM「Cogito v1 preview」登場!自己進化するAIがオープンソースの限界を超えるか?
はじめに AI技術は日々進化していますが、特にLLMの分野では目覚ましい進歩が見られます。そんな中、Deep Cogito社から、既存のオープンソースモデルの性能を凌駕する可能性を秘めた「Cogito v1 Preview」がリリースされました。 本稿では、Deep Cogi... -
[ニュース解説]生成AIバブルへの懸念と、超低コストの大規模言語モデル開発の隆盛
はじめに 生成AIへの期待と懸念が交錯する中、AI開発の現場では新たな潮流が生まれています。本稿では、大規模言語モデル(LLM)の開発におけるコスト削減の動きと、それがAI研究にもたらす影響についてCNBCの記事「As generative AI bubble fears grow,...
1