🔔科技频道[奇诺分享-ccino.org]⚡️
9 小时前
IT之家
百度开源 Unlimited OCR 模型:基于 DeepSeek OCR,解析文档告别 AI 越生成越慢
Telegraph
|
原文
Telegraph
百度开源 Unlimited OCR 模型:基于 DeepSeek OCR,解析文档告别 AI 越生成越慢 - IT之家
IT之家 6 月 25 日消息,百度于 6 月 22 日开源推出 Unlimited OCR 模型,总参数量 30 亿,推理时仅激活 5 亿参数,目标解决在解析长文档时,端到端 OCR 模型越生成越慢的问题。 IT之家注:端到端 OCR 模型是统一神经网络架构系统,融合检测图像中的文本和字符识别,摒弃了传统“先检测文字框、再单独识别”的繁琐流程,直接从输入图像映射到文本序列输出,从而减少信息丢失和计算冗余。 主流端到端 OCR 模型每生成 1 个 token,都会扩大 KV cache(键值缓存),显存…
Home
Blog
Discuss
Gsearch
Powered by
BroadcastChannel
&
Sepia