NVIDIA研究团队发表的最新研究表明,小语言模型(SLM)在AI代理中具有很大的潜力,并且可以以低成本和潜伏期提供与大型模型相当的性能。研究表明,AI代理系统的当前大规模语言模型(LLM)的设计范式提出了经济和环境可持续性的问题,而小型模型通常能够实现或克服专业任务中的较大模型。同时,其低计算机需求及其内存使用使其适合在终端环境(例如智能手机和边缘设备)中实现。此外,越来越多的制造商推出了更多的制造商,其中包括Gemma 3 270m型号最近推出了270 M参数,该行业集中在小型型号上。图|相关文件(来源:ARXIV)ISTANDENCIA也是Liquid AI,这是一家人工智能公司,该公司衍生自人工信息研究所麻省理工学院理工学院(MIT)的ICS与智能(CSAIL)已正式启动了其第一个基本的视觉语言模型LFM2-VL。这组模型旨在解决一个共同的问题,即由于其尺寸较大而难以在终端设备中显示当前的多模式人工智能模型,并致力于为智能手机,笔记本电脑,笔记本电脑,便携式设备和各种集成系统的低潜伏期视觉理解提供有效的能力。目前,LFM2-VL系列的模型重量向拥抱的拥抱社区开放,以供开发人员和研究人员使用。 LFM2-VL系列的第一批启动了两个具有不同参数尺寸的模型,以满足不同设备的实现需求。其中,LFM2-VL-450M是一个具有4.5亿个参数的轻型模型,主要针对资源非常有限的环境,例如智能手表和基本的互联网节点。另一个LFM2-VL-1.6B具有1.6 BIllion参数,并且更全面,适用于具有单一防护性能的单个块的高端智能手机,计算机和个人设备。根据Liquid AI发布的数据,GPU中LFM2-VL的推理速度可能是类似的视觉语言模型的两倍。同时,与某些具有较大性能参数的模型相比,多个行业的标准参考点(例如图像描述和视觉问题和答案)具有竞争力,从而大大降低了内存使用的使用。图|参考测试结果(来源:液体AI)LFM2-VL的性能优势来自其独特的基础体系结构。该模型基于液体液体AI(LFM,液体粉底型)。该体系结构设计的灵感来自动态系统和信号处理理论,并由当今的主要变形金刚体系结构来处理。序列数据的差异Ethod在计算机效率方面提供了先天的利益。特别是,LFM2-VL的实现由三个基本模块组成:语言模型的脊柱,视觉编码器和多模式投影仪。语言部分遵循LFM2型号,但是Visual编码器USA Siglip2 Naflex。图| LFM2-VL架构和流程图(来源:液体AI)为了进一步提高效率,LFM2-VL整合了一种称为“ Pixel Unshuffle”的技术。这项技术巧妙地降低了Thenúmerodeimágenespara Analizar al procesarimágenes,Readuceightoasílascargasinformáticasy acelerando el procesamiento。 Cuando se trata de procesar Entradas de Imagen,El lfm2-Vltambiénevitaevisas disasas dedistorsióndela imagen comunes en Muchos Modelos。 Admite Entradas deResoluciónNativade Hasta 512x512píxelessin sin estiramiento forzado o recorte deimágenes。对于此尺寸的图像,该模型被分为多个镶嵌物,而无法处理用于处理,并获得了全球环境信息。n通过编码完整的低分辨率微型,以提供对图像和一般场景细节的不可或缺的理解。 los desarrolladores pueden al gueden al Modeo de acuerdo con necesidades esexecíficasinvolver a Jjustar ajustar ejustar elnúmerode tokens y fichas y fichas y fichas y e el e e e e e e e e equede eque eque equilibrar delil deli y la veli la veLiociDAD。 LFM2-VL促进了社区的使用,与常规开发库(例如面部变压器和对定量技术的支持)集成在一起。这降低了数据的准确性,并通过适应边缘硬件的严格要求来更大程度地压缩模型的模型。在许可方面,该模型为年收入低于1000万美元的公司提供免费的商业许可证,但大公司必须与Liquid AI进行商业许可证进行通信。对于AI代理和众​​多终点AL设备,轻型,高效且专门设计的模型(例如LFM2-VL)是释放云功能和促进实际应用的关键。下一波可以由这些小型健壮的模型驱动。这些模型是使智力无处不在的中心力量。参考材料:1。 https://www.liquid.ai/blog/lfm2-vl-efficity-vision-vision-language-models2。 https://arxiv.org/pdf/2506.02153印象类型:刘Yakun
特殊声明:先前的内容(包括照片和视频(如果有),如有)已由网络自我媒体平台的用户收费和发布。该平台仅提供信息存储服务。
注意:以前的内容(如果您拥有包含照片和视频的EOS)已由社交网络平台NetEase Hao的用户收取和发布,仅提供信息存储服务。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注