MENU

合同会社JOBIRUNのHPです。

音声生成– tag –

AI技術

［開発者向け］Googleの新音声AI「Gemini 2.5 Flash Native Audio」が大幅進化──関数呼び出し精度71.5%、リアルタイム音声翻訳も実現

はじめに　Googleは2025年12月13日、音声エージェント向けAIモデル「Gemini 2.5 Flash Native Audio」の大幅なアップデートを発表しました。本稿では、この発表内容をもとに、関数呼び出しの精度向上、指示追従の改善、そして新たに導入されたライブ音声...

2025-12-14
AI技術

［開発者向け］Google、Gemini 2.5 TTSモデルを大幅改善—表現力とペース制御が向上

はじめに　Google DeepMindが2025年12月10日、音声合成モデル「Gemini 2.5 Flash TTS」と「Gemini 2.5 Pro TTS」の大幅な改善を発表しました。本稿では、この発表内容をもとに、新しいTTSモデルの機能改善と実用性について解説します。参考記事タイトル...

2025-12-11
AI技術

［技術紹介］声でAIを自由自在に操る時代へ！Gemini 2.5の音声生成技術の最前線

はじめに　本稿では、Google DeepMindが発表した最新AIモデル「Gemini 2.5」に搭載された、高度な音声対話および音声生成機能についてGoogle Blogに掲載された「Advanced audio dialog and generation with Gemini 2.5」をもとに詳しく解説します。引用...

2025-06-05
AIニュース

［ニュース解説］オーディオブック業界にAIの波：利便性の裏で問われる「声」の価値

はじめに　近年、私たちの生活のあらゆる場面で人工知能（AI）の活用が進んでいます。その波は出版業界、特にオーディオブックの分野にも押し寄せています。Amazon傘下のオーディオブック最大手であるAudible（オーディブル）が、AI技術を用いた音声ナレ...

2025-05-14

1