AI安全性– tag –
-
AIニュース
[ニュース解説]米国連邦取引委員会、AI検索サービスを「消費者詐欺」で提訴——ダークパターンの実態とは?
はじめに NPRが2026年1月13日に報じたところによると、米国連邦取引委員会(FTC)がAI搭載の質問応答サービス「Pearl」を運営するJustAnswerを消費者詐欺で提訴しました。本稿では、この訴訟の内容と、企業が使用したとされる「ダークパターン」の手法につ... -
AI技術
[開発者向け]AIエージェントを狙う間接的プロンプトインジェクション攻撃とその対策
はじめに IBM Technologyが2026年1月10日にYouTubeで公開した動画では、ブラウザ操作型AIエージェントが抱えるセキュリティリスクと、その対策方法が解説されています。本稿では、この動画の内容をもとに、間接的プロンプトインジェクション攻撃の仕組み... -
AI論文
[論文解説]Anthropicがコスト40分の1でジェイルブレイクを防ぐ「Constitutional Classifiers++」を発表
はじめに LLMをプロダクトに組み込む際の最大の懸念事項の一つが「安全性」です。特に、悪意のあるユーザーが巧妙なプロンプトを用いて、爆発物の製造方法やサイバー攻撃の手順といった有害な情報を引き出そうとする「ジェイルブレイク」攻撃への対策は... -
AIニュース
[ニュース解説]生成AIがオンラインの「信頼崩壊」を加速させている、と専門家が警告
はじめに NBCニュースが2026年1月9日に報じた記事によれば、AI技術の急速な進化により、オンラインでの情報に対する信頼が著しく低下していると専門家が警告しています。本稿では、この報道をもとに、AIが生成する偽情報が実際のニュースとどのように混... -
AIニュース
[ニュース解説]Grokの不適切画像生成が浮き彫りにするAIの法的責任問題
はじめに Axiosが2026年1月7日に報じたところによれば、Elon MuskのAIチャットボット「Grok」が同意なしの不適切な画像をX上で生成・公開し続けている問題を通じて、AIが生成したコンテンツの法的責任の所在という未解決の重要課題が浮き彫りになってい... -
AIツール
[ニュース解説]2025年、AI生成「スロップ」が急増——NPRが警鐘を鳴らす現実と対策
はじめに NPR(National Public Radio)が2025年12月24日、2025年におけるAI生成コンテンツ、いわゆる「AIスロップ」の急増について報じました。本稿では、政治的プロパガンダから一見無害な動物動画まで、3つの具体例を通じて、AI生成動画が現実とフィク... -
AI技術
[開発者向け]OpenAIが提案する「思考の監視可能性」評価手法とは?GPT-5やo3で検証した結果
はじめに OpenAIが2025年12月18日、AIモデルの思考プロセス(Chain-of-Thought)を監視する手法の評価フレームワークを発表しました。本稿では、この発表内容をもとに、思考の監視可能性(Monitorability)とは何か、どのように評価するのか、そしてGPT-5やo... -
AIニュース
[ニュース解説]Anthropic、Claudeのユーザー保護機能を強化——自殺・自傷対応と追従性削減の取り組みを公開
はじめに AnthropicのSafeguardsチームが2025年12月19日、AIチャットボット「Claude」におけるユーザー保護の取り組みについて詳細を公開しました。本稿では、自殺・自傷に関する会話への対応、追従性(sycophancy)の削減、18歳以上の年齢制限など、Claud... -
AI論文
[論文解説]GPT-5.2-Codexシステムカード――その安全性と実力
はじめに AI技術の進化に伴い、モデルがどのような能力を持ち、どのようなリスク対策が講じられているかを透明性高く公開する「システムカード」の重要性が増しています。今回は、OpenAIの最新コーディング特化モデル「GPT-5.2-Codex」に関するシステム... -
AIツール
[AIツール利用者向け]GoogleがGeminiアプリに動画検証機能を追加、SynthID透かしで生成コンテンツを判別可能に
はじめに Googleが2025年12月18日、Geminiアプリで動画がGoogleのAIで生成・編集されたものかを確認できる機能を追加したと発表しました。本稿では、この新機能の仕組みと利用方法、そしてAI生成コンテンツの透明性確保における意義について解説します。...