IT之家让大模型从“一问一答”走向“边看边说”，京东开源实时视频视觉语言交互模型 JoyAI-VL-Interaction Telegraph | 原文 | 🔔科技频道[奇诺分享-ccino.org]⚡️

IT之家
让大模型从“一问一答”走向“边看边说”，京东开源实时视频视觉语言交互模型 JoyAI-VL-Interaction Telegraph | 原文

让大模型从“一问一答”走向“边看边说”，京东开源实时视频视觉语言交互模型 JoyAI-VL-Interaction - IT之家

IT之家 6 月 22 日消息，京东官方宣布开源实时视频视觉语言交互模型 JoyAI-VL-Interaction，这也是全球首个全栈开源的 interaction 模型和系统，并获得 vLLM-Omni 的 day-0 原生支持。官方表示，它让大模型从“一问一答”走向“边看边说”，开发者基于这套框架，可以快速搭建能持续观察、自主判断、即时响应的实景 AI 助手。据介绍，相比传统模型，JoyAI-VL-Interaction 有三重突破：主动判断，而非被动回答：传统模型通常要等用户发起问题，才开始处理当前画面，而…

Powered by BroadcastChannel & Sepia