ViSpec: Accelerating Vision-Language Models with Vision-Aware Speculative Decoding

By admin NU / September 30, 2025

arXiv:2509.15235v4 Announce Type: replace-cross
Abstract: Speculative decoding is a widely adopted technique for accelerating inference in large language models (LLMs), yet its application to vision-language models (VLMs) remains underexplored, with existing methods achieving only modest speedups (

ViSpec: Accelerating Vision-Language Models with Vision-Aware Speculative Decoding

Our Services

Home

How it work

News

Pricing

Support

Help Center

Report an Issue

Give Feedback

Privacy Policy

User Account

Follow Us