MENU

合同会社JOBIRUNのHPです。

AI論文– category –

AI論文

［論文解説］Anthropicがコスト40分の1でジェイルブレイクを防ぐ「Constitutional Classifiers++」を発表

はじめに　LLMをプロダクトに組み込む際の最大の懸念事項の一つが「安全性」です。特に、悪意のあるユーザーが巧妙なプロンプトを用いて、爆発物の製造方法やサイバー攻撃の手順といった有害な情報を引き出そうとする「ジェイルブレイク」攻撃への対策は...

2026-01-10
AI論文

［論文解説］LLMはどれくらい正確なのか？Google発のLLM新評価指標「FACTS」

はじめに　本稿では、Google DeepMindやGoogle Researchの研究チームが2025年12月11日に発表した、大規模言語モデル（LLM）の「事実性（Factuality）」を多角的に評価する新しいベンチマークスイート「FACTS Leaderboard」に関する論文について解説します...

2025-12-30
AI論文

［論文解説］DeepSearchQA：AIエージェントの「網羅性」と「停止判断」を評価する新指標

はじめに　近年、ChatGPTなどのLLM（大規模言語モデル）は、単に質問に答えるだけのチャットボットから、自律的に行動計画を立ててタスクを遂行する「エージェント」へと進化を遂げています。特に、ウェブ上の情報を検索・収集してユーザーの目的を達成す...

2025-12-29
AI論文

［論文解説］LLMの次のフロンティア「Generative UI」：マークダウンからインタラクティブな「カスタムアプリ」へ

はじめに　近年、AIモデル、特にLLM（大規模言語モデル）は、テキスト、コード、画像など、さまざまなコンテンツを生成する能力で注目を集めています。しかし、これらの強力なツールが生成した結果は、通常、静的で事前に定義されたインターフェースで提...

2025-12-27
AI論文

［論文紹介］AI学習に使われた創作物、誰が報酬を得るべきか?「learnright」という新しい権利の提案

はじめに　生成AIが画像を生成し、テキストを作成する中で、元となる創作物の権利者への補償をどう考えるべきかという議論が高まっています。Cornell大学が2025年12月22日に報じた内容によれば、現行の著作権制度ではAIの学習利用に対応できないとして、...

2025-12-23
AI論文

［論文解説］GPT-5.2-Codexシステムカード――その安全性と実力

はじめに　AI技術の進化に伴い、モデルがどのような能力を持ち、どのようなリスク対策が講じられているかを透明性高く公開する「システムカード」の重要性が増しています。今回は、OpenAIの最新コーディング特化モデル「GPT-5.2-Codex」に関するシステム...

2025-12-19
AI論文

［論文解説］GPT-5.2システムカード解説

はじめに　AIモデルの進化に伴い、その安全性とリスク評価の重要性はかつてないほど高まっています。OpenAIは、モデルのリリースごとに「システムカード（System Card）」と呼ばれる技術レポートを公開しています。これは、モデルの開発プロセス、安全性...

2025-12-12
AI論文

［論文解説］LLMの「告白」機能：OpenAIが欺瞞行動を検知する新たな安全技術を発表

はじめに　近年、大規模言語モデル（LLM）の能力向上に伴い、その振る舞いにおける正直性（Honesty）が重要な課題となっています。LLMは、その行動や信念を報告する際、例えば、事実の主張に対する過度な確信を示したり、隠密に行った行動の証拠を隠蔽し...

2025-12-08
AI論文

［論文解説］LLMの普遍的な脆弱性：「詩的」文体変化が安全ガードレールを突破する

はじめに　近年、大規模言語モデル（LLM）は、人間の言葉を理解し、高度な応答を生成する能力により、ビジネスや研究、さらには社会の重要な意思決定パイプラインにおいて、ますます中心的な役割を担うようになっています。AIエンジニアである皆様もご存...

2025-12-01
AI論文

［論文解説］AI時代の労働市場の隠れた真実：「氷山指数（Iceberg Index）」が示すホワイトカラー自動化の全容

はじめに　近年、AI（人工知能）技術、特にChatGPTのような大規模言語モデル（LLMs）の進化は目覚ましく、私たちの労働環境を根底から変えつつあります。アメリカだけでも9.4兆ドルに及ぶ巨大な労働市場は、目に見えるテクノロジー部門にとどまらず、連鎖...

2025-11-30

12 3...7