音声生成– tag –
-
AI技術
[開発者向け]Googleの新音声AI「Gemini 2.5 Flash Native Audio」が大幅進化──関数呼び出し精度71.5%、リアルタイム音声翻訳も実現
はじめに Googleは2025年12月13日、音声エージェント向けAIモデル「Gemini 2.5 Flash Native Audio」の大幅なアップデートを発表しました。本稿では、この発表内容をもとに、関数呼び出しの精度向上、指示追従の改善、そして新たに導入されたライブ音声... -
AI技術
[開発者向け]Google、Gemini 2.5 TTSモデルを大幅改善—表現力とペース制御が向上
はじめに Google DeepMindが2025年12月10日、音声合成モデル「Gemini 2.5 Flash TTS」と「Gemini 2.5 Pro TTS」の大幅な改善を発表しました。本稿では、この発表内容をもとに、新しいTTSモデルの機能改善と実用性について解説します。 参考記事 タイトル... -
AI技術
[技術紹介]声でAIを自由自在に操る時代へ!Gemini 2.5の音声生成技術の最前線
はじめに 本稿では、Google DeepMindが発表した最新AIモデル「Gemini 2.5」に搭載された、高度な音声対話および音声生成機能についてGoogle Blogに掲載された「Advanced audio dialog and generation with Gemini 2.5」をもとに詳しく解説します。 引用... -
AIニュース
[ニュース解説]オーディオブック業界にAIの波:利便性の裏で問われる「声」の価値
はじめに 近年、私たちの生活のあらゆる場面で人工知能(AI)の活用が進んでいます。その波は出版業界、特にオーディオブックの分野にも押し寄せています。Amazon傘下のオーディオブック最大手であるAudible(オーディブル)が、AI技術を用いた音声ナレ...
1