マルチモーダル– tag –
-
[技術紹介]オープンソースで発表!マルチモーダルAI「BAGEL」を解説 ~次世代AIの理解力と生成能力に迫る~
はじめに 本稿では、中国のテクノロジー企業ByteDanceの研究チーム「ByteDance-Seed」が発表した、最新のオープンソース・マルチモーダルAIモデル「BAGEL」について解説します。 BAGELは、テキストと画像を統合的に理解し生成する能力において、既存のオ... -
[技術解説]視覚情報を統合した診断対話AI「Multimodal AMIE」の登場
はじめに 近年、大規模言語モデル(LLM)は目覚ましい発展を遂げ、医療分野においても診断支援などへの応用が期待されています。Google ResearchとGoogle DeepMindが開発した研究用の診断対話AIエージェントAMIE (Articulate Medical Intelligence Explo...
1