• ReDrafter ofrece 2,7 veces más tokens por segundo en comparación con la regresión automática tradicional
  • ReDrafter puede reducir la latencia para los usuarios usando menos GPU
  • Apple no ha dicho cuándo se implementará ReDrafter en las GPU de IA de la competencia de AMD e Intel.

Apple anunció una colaboración con Nvidia para acelerar la inferencia de modelos en lenguajes grandes utilizando su tecnología de código abierto, Recurrent Drafter (o ReDrafter para abreviar).

La asociación tiene como objetivo abordar los desafíos computacionales de la generación automática de tokens regresivos, que es esencial para mejorar la eficiencia y reducir la latencia en aplicaciones LLM en tiempo real.

Source link