OCR– tag –
-
AI論文
[論文解説]DeepSeek-OCRが拓くLLMの「記憶と忘却」メカニズム:視覚モダリティを活用したコンテキスト管理
はじめに 大規模言語モデル(LLM)が直面する大きな課題として、コンテキスト長(文脈の長さ)が伸びた際の計算量の問題(二次スケーリング)があります。この課題は、長大な文書や対話履歴を処理する際に、リソースの制約を深刻化させます。 この問題に... -
AIツール
[開発者向け]DeepSeek-OCR:画像ベースのテキスト抽出で大規模ドキュメント処理が効率化
はじめに DeepSeekが2025年10月20日に公開した「DeepSeek-OCR」は、ドキュメント画像からテキストを抽出する多言語対応モデルです。従来のテキストトークン方式ではなく、ビジョントークンを活用することで、大規模ドキュメントの処理速度とコスト効率を...
1