В 3,2 раза быстрее конкурентов: Apple запустила FastVLM

Wait 5 sec.

Apple выпустила новую линейку FastVLM — это ультраскоростные VL-модели с гибридным энкодером FastViTHD, который уменьшает количество визуальных токенов и ускоряет их обработку. По сравнению с LLaVA-1.5, FastVLM обеспечивает в 3,2 раза более быстрое время до первого токена (TTFT) при аналогичном уровне качества. А в сопоставлении с LLaVa-OneVision новая модель достигает тех же результатов на бенчмарках, но при этом использует энкодер, который в 3,4 раза меньше. Читать далее