🔔科技频道[奇诺分享-ccino.org]⚡️
5 小时前
IT之家
让大模型从“一问一答”走向“边看边说”,京东开源实时视频视觉语言交互模型 JoyAI-VL-Interaction
Telegraph
|
原文
Telegraph
让大模型从“一问一答”走向“边看边说”,京东开源实时视频视觉语言交互模型 JoyAI-VL-Interaction - IT之家
IT之家 6 月 22 日消息,京东官方宣布开源实时视频视觉语言交互模型 JoyAI-VL-Interaction,这也是全球首个全栈开源的 interaction 模型和系统,并获得 vLLM-Omni 的 day-0 原生支持。 官方表示,它让大模型从“一问一答”走向“边看边说”,开发者基于这套框架,可以快速搭建能持续观察、自主判断、即时响应的实景 AI 助手。 据介绍,相比传统模型,JoyAI-VL-Interaction 有三重突破: 主动判断,而非被动回答:传统模型通常要等用户发起问题,才开始处理当前画面,而…
Home
Blog
Discuss
Gsearch
Powered by
BroadcastChannel
&
Sepia