LFM2-VL-3B

Specifications
Quick Start

← Back to Vision Models LFM2-VL-3B is Liquid AI’s highest-capacity multimodal model, delivering enhanced visual reasoning and detailed image understanding. Ideal for complex vision tasks requiring deeper comprehension.

HF GGUF MLX ONNX

Specifications

Property	Value
Parameters	3B
Context Length	32K tokens
Architecture	LFM2-VL (Dense)

Advanced Reasoning

Complex visual logic and analysis

Document Understanding

Detailed document and chart parsing

Multi-Image

Compare and reason across images

Quick Start

Transformers
vLLM
SGLang
llama.cpp

⌘I

Models

Fine-tuning

Edge Inference

GPU Inference

Cloud Inference

Help

Specifications

Advanced Reasoning

Document Understanding

Multi-Image

Quick Start

Models

Fine-tuning

Edge Inference

GPU Inference

Cloud Inference

Help

Documentation Index

​Specifications

Advanced Reasoning

Document Understanding

Multi-Image

​Quick Start

Specifications

Quick Start