您的位置:首页 人工智能

上海AI实验室发布新一代书生·视觉大模型

来源:大半导体产业网    2024-01-30
上海AI实验室联合清华大学、香港中文大学、商汤科技等机构开源新一代书生·视觉大模型(InternVL)。

据上海人工智能实验室官微消息,近日,上海人工智能实验室(上海AI实验室)联合清华大学、香港中文大学、商汤科技等机构开源新一代书生·视觉大模型(InternVL)。上海AI实验室在视觉大模型上持续发力,在2021年、2022年先后推出书生1.0和InternImage,不仅及模型性能领先,还构建了视觉大模型的新架构。

(InternVL概览)

据悉,新一代“书生·视觉基础”模型的视觉编码器参数量达60亿(InternVL-6B),首次提出了对比-生成融合的渐进式对齐技术,实现了在互联网级别数据上视觉大模型与语言大模型的精细对齐。InternVL-6B不仅能处理复杂图片中细微的视觉信息并完成图生文任务,还可以识别和解读复杂页面中的信息,甚至解决其中的数理问题。

目前,InternVL全系列模型、代码均已开源,并提供Demo试用。

0