MENU

合同会社JOBIRUNのHPです。

AI安全性– tag –

AIニュース

［ニュース解説］国連で始まったAI規制の議論：平和の道具か、新たな火種か

はじめに　本稿では、AP通信が2025年9月25日に報じた内容を基に、国連の安全保障理事会で中心的な議題となった人工知能（AI）の可能性とリスクについて解説します。参考記事タイトル： AI’s double-edged sword: UN leaders weigh its promise and peri...

2025-09-26
AI技術

［技術紹介］AIの新たなリスクに備える：Google DeepMindの最新安全フレームワーク解説

はじめに　人工知能（AI）技術は、医療から教育まで、私たちの社会に大きな利益をもたらす可能性を秘めています。その一方で、AIが高度化するにつれて、その能力が悪用されたり、意図しない形で社会に害を及ぼしたりするリスクも増大しています。こうした...

2025-09-23
AI論文

［論文解説］AIは人間を欺くか？ OpenAIとApollo Researchによる「スキーミング」に関する研究

はじめに　AI技術が急速に進化し、自律的にタスクをこなすシステムが登場する中で、新たなアラインメントの課題が浮き彫りになっています。アラインメントとは、AIの行動や目標を、開発者が意図したもの、ひいては人類の価値観と一致させるための技術や考...

2025-09-19
AIニュース

［ニュース解説］AIの安全性強化における官民連携の最前線：AnthropicとOpenAIの取り組み

はじめに　近年、急速な進化を遂げるAI（人工知能）は、私たちの社会に大きな利益をもたらす一方で、その悪用リスクも懸念されています。Anthropic社とOpenAI社が、米英の政府機関と連携し、AIの脆弱性対策を強化したことを発表しました。　本稿では、AI...

2025-09-13
AIニュース

［ニュース解説］AIが悪用される新たな手口とは？Anthropic社の最新レポートから見るサイバー犯罪の現状と対策

はじめに　本稿では、AI開発企業であるAnthropic社が公開した脅威インテリジェンスレポート「Detecting and countering misuse of AI: August 2025」を基に、AIが悪用されるサイバー犯罪の新たな手口と、それに対する具体的な対策について詳しく解説しま...

2025-08-28
AIニュース

［ニュース解説］AIはサイバー攻撃の矛か盾か？善悪問わず利用が広がる最前線

はじめに　近年、ChatGPTに代表される大規模言語モデル（LLM）が身近なものになりましたが、その影響はサイバーセキュリティの分野にも及んでいます。攻撃者（ハッカー）はより巧妙な手口のために、そして防御側（セキュリティ専門家）はより強固な守りの...

2025-08-18
AIレポート

［レポート解説］AI導入を急ぐ前に。2025年データ侵害コストレポートが示すセキュリティの落とし穴

はじめに　本稿では、AI（人工知能）の活用が急速に進む現代において、企業が見落としがちなセキュリティリスクについて解説します。AIはビジネスに大きな可能性をもたらす一方で、その導入を急ぐあまり、セキュリティ対策が追いついていない「監視のギャ...

2025-08-02
AI論文

［論文解説］AIモデルは蒸留を通じて「隠れた特性」も伝達する：サブリミナル学習の驚くべき現象とは？

はじめに　AI、特に大規模言語モデル（LLM）の開発において、「知識蒸留（Distillation）」という技術がよく使われます。これは、高性能な「教師モデル」の振る舞いを、より小さく、あるいは特定の目的に特化した「生徒モデル」に模倣させる学習方法です...

2025-07-31
AI技術

［技術紹介］AIがAIに「悪癖」をこっそり教える？：サブリミナル学習の脅威とAI安全性の新たな課題

はじめに　近年、AI（人工知能）の進化は、私たちの生活や社会に大きな変化をもたらす可能性を秘めており、その開発競争は日々激しさを増しています。しかしその一方で、私たちは自らが生み出したシステムの全てを理解できているわけではありません。最近...

2025-07-30
AIレポート

［レポート解説］いまのAIはどれくらい安全なのか？主要AI企業7社の安全管理への取り組みに関する調査結果

はじめに　AIの急速な進化は目覚ましいものがありますが、その一方で「本当に安全なの？」と疑問に思う方もいるのではないでしょうか。私たちが日々利用するAIシステムが、意図しない問題を引き起こしたり、最悪の場合、社会に大きなリスクをもたらしたり...

2025-07-18

1...2 345 6