［ニュース解説］あなたの声が15秒で盗まれる？ AI音声詐欺「新たな常態」への警鐘

2025-07-13

はじめに

　近年、急速に発展する人工知能（AI）技術は、私たちの生活に多くの恩恵をもたらす一方で、新たな脅威も生み出しています。その一つが、本物と聞き分けがつかないほど精巧な偽の音声を作り出す「AI音声クローニング」技術です。この技術が悪用され、政府高官になりすまして詐欺を働くという深刻な事件が米国で多発しています。

　本稿では、米CNNが報じた「Why fake AI calls impersonating US officials are ‘the new normal’」という記事をもとに、AI音声クローニングによるなりすまし詐欺の現状、その手口の巧妙さ、そして私たちが取るべき対策について解説します。

引用元記事

タイトル： Why fake AI calls impersonating US officials are ‘the new normal’
著者： Sean Lyngaas
発行元： CNN
発行日： 2025年7月12日
URL： https://edition.cnn.com/2025/07/12/politics/fake-ai-calls-us-officials

要点

AIによる音声クローニング技術は急速に進化しており、わずか15秒未満の音声サンプルがあれば、本人の声と信じ込ませるのに十分な音声クローンを作成可能である。
この技術が悪用され、マルコ・ルビオ国務長官をはじめとする米政府高官へのなりすまし事件が多発しており、専門家はこれを「ニューノーマル（新たな常態）」と見なしている。
攻撃の目的は、人間の心理的な隙を突くソーシャルエンジニアリングの一環として、標的の連絡先リストにいる人物の信頼を勝ち取り、最終的に情報や金銭を窃取することにある。
現時点で攻撃を技術的に完全に防ぐ手段はなく、FBIなどの機関は、電話などで重要な依頼を受けた際に別の通信手段で本人確認を行うなど、人間側の警戒と対策を強く推奨している。

詳細解説

前提知識：脅威を理解するための2つのキーワード

　今回の問題を理解するために、まずは2つの重要なキーワードについてご説明します。

AI音声クローニング（ボイスクローニング）
　これは、AI、特にディープラーニング（深層学習）を用いて、特定の個人の声を模倣した音声を人工的に生成する技術です。少量の本人の音声データをAIに学習させるだけで、その人の声質、抑揚、話し方の癖などを驚くほど忠実に再現し、任意の文章をその声で読み上げさせることができます。記事によれば、かつては1〜2分のノイズがないクリアな音声が必要でしたが、技術の進歩により、今や15秒にも満たない短い音声で、信憑性の高い音声クローンが作成できてしまいます。
ソーシャルエンジニアリング
　これは、システムの脆弱性を突くような技術的なハッキングとは異なり、人間の心理的な隙や信頼関係を悪用して情報を盗み出す攻撃手法です。例えば、権威ある人物になりすまして相手を信用させたり、緊急性を装って冷静な判断を奪ったりする手口がこれにあたります。今回のAI音声クローニングは、このソーシャルエンジニアリングを極めて巧妙かつ容易にするための強力なツールとして悪用されています。

米政府を揺るがす「なりすまし」の実態

　米国政府の最も高位な人物の2人、マルコ・ルビオ国務長官とホワイトハウスの首席補佐官がAIによるなりすましの標的になりました。

　ルビオ氏のケースでは、攻撃者はメッセージアプリ「Signal」に「marco.rubio@state.gov」というもっともらしい表示名で偽のアカウントを開設。その上で、少なくとも3人の外国の大臣、1人の知事、1人の上院議員を含む5人に接触しました。攻撃者はAIで生成したルビオ氏の声のボイスメッセージを残すなどして、標的を信用させようと試みたのです。

　この手口の恐ろしい点は、その大胆さと手軽さにあります。サイバーセキュリティ企業McAfeeのCTO、スティーブ・グロブマン氏が指摘するように、政治家や企業の役員など、公の場で話す機会が多い人物は、演説やインタビューの動画・音声がインターネット上に大量に存在します。これらは攻撃者にとって、音声クローンを作成するための格好の材料となってしまうのです。

「聞いても信じられない」時代の到来

　「seeing – or hearing – is no longer believing（見たり聞いたりすることは、もはや信じることにはならない）」という記事中の言葉は、この問題の本質を的確に表しています。私たちはこれまで、電話口の声で相手が本人かどうかを判断してきました。しかし、AI音声クローニング技術は、その長年の常識を根底から覆します。

　特に、上司や取引先、家族など、信頼している人物の声で「緊急でお金が必要になった」「機密情報を至急送ってほしい」といった緊急性の高い依頼をされた場合、訓練された専門家でさえ騙されてしまう危険性があると専門家は警鐘を鳴らしています。

私たちにできる防御策とは？

　残念ながら、現時点では、攻撃者が偽のアカウントを作成したり、オンライン上のフリーソフトで音声をクローニングしたりすることを技術的に完全に防ぐ方法はありません。そのため、防御の鍵は私たち人間側の意識と行動にかかっています。

　FBIや国務省が推奨している最も効果的な対策は、「別の通信手段による本人確認」です。例えば、上司から電話で機密情報の提供を求められたとします。その際、一度電話を切り、その上司が普段使っている別の電話番号や、社内のチャットツールなど、電話とは異なる経路で「先ほどの件、ご本人様で間違いないでしょうか？」と確認するのです。この一手間を挟むだけで、なりすまし詐欺のリスクを大幅に減らすことができます。

　政府機関は現在、職員に対して暗号化されたメッセージングアプリの使用を奨励していますが、これはあくまで通信内容の盗聴を防ぐためのものであり、なりすましそのものを防ぐわけではありません。最終的な砦は、私たちの警戒心なのです。

まとめ

　本稿では、CNNの記事を基に、AI音声クローニング技術を用いたなりすまし詐欺という新たな脅威について解説しました。この問題は、もはや遠い国の政府高官だけの話ではありません。技術がさらに普及し、より手軽になれば、企業間の取引や、オレオレ詐欺のような形で一般市民が標的になる未来も十分に考えられます。

　技術の進化を止めることはできません。だからこそ、私たちは「声だけで相手を100%信用しない」「重要な依頼や金銭が関わる話は、必ず別の手段で本人確認を行う」という、新しい時代のセキュリティ意識を身につける必要があります。