Una startup afirma haber superado un cuello de botella que frena los LLM

✅ CONTENIDO_COMPLETO | Traducido automáticamente del inglés

🌶️ En esta nota prioricé implicaciones prácticas para APIs, integraciones, performance y operación backend.

Subquadratic ahora ha compartido más detalles sobre su nuevo modelo. Pero algunos todavía se muestran escépticos. Por Will Douglas Página de archivo de Heaven 19 de junio de 2026 Stephanie Arnett/MIT Technology Review | Adobe Stock RESUMEN EJECUTIVO Subquadratic, la startup de inteligencia artificial con sede en Miami, salió del modo sigiloso el mes pasado con un gran reclamo.

Anunció que había resuelto un cuello de botella matemático que había estado frenando los grandes modelos lingüísticos durante casi una década. Los detalles eran escasos y mucha gente no estaba convencida. Pero Subquadratic ha comenzado a generar recibos y ha compartido los resultados de una evaluación independiente de su nueva tecnología.

Los resultados sugieren que vale la pena prestar atención a las afirmaciones de la empresa. Artículo relacionado Hicimos cálculos sobre la huella energética de la IA. Aquí está la historia que no has oído.

Leer siguiente Según Subquadratic, ha desarrollado un nuevo tipo de LLM, llamado SubQ, que es más rápido, más económico y utiliza mucha menos energía que cualquier otro modelo del mercado. La compañía también afirma que SubQ es capaz de procesar hasta 12 veces más texto a la vez que la mayoría de los otros modelos, lo que le permite llevar a cabo una variedad de tareas con gran cantidad de datos, como analizar cientos de documentos o bases de código completas. Es más, dice Subquadratic, SubQ hace esto mientras más o menos iguala el rendimiento de los mejores modelos presentados por Google DeepMind, OpenAI y Anthropic en tareas clave como la codificación.

El problema fue que al principio la empresa proporcionó poca evidencia de sus afirmaciones más allá de un puñado de puntuaciones de pruebas autopublicadas. Y todavía tiene que hacer que SubQ esté ampliamente disponible para que las personas lo prueben por sí mismos. Por lo tanto, no sorprende que las afirmaciones de Subquadratic fueran recibidas con escepticismo.

Dan McAteer, un ingeniero de inteligencia artificial, captó la respuesta general en X: “SubQ es el mayor avance desde Transformer… o es AI Theranos”. Un mes después, la compañía publicó más información sobre su modelo, incluidos los resultados de pruebas independientes adicionales realizadas por la empresa externa Appen. “Esperábamos un escepticismo saludable”, dice el cofundador y director de tecnología de Subquadratic, Alex Whedon. “En retrospectiva, publicar los puntos de referencia de terceros junto con el anuncio inicial se habría adelantado a gran parte del escepticismo, razón por la cual nos estamos tomando el tiempo para asegurarnos de que los resultados futuros estén completamente verificados antes de publicarlos”. Subquadratic pidió a Appen, que evalúa los modelos de otras empresas, que realizara sus pruebas en SubQ.

Los resultados parecen respaldar muchas de las afirmaciones de Subquadratic. “Eso fue realmente emocionante para mí, validó su arquitectura”, dice Jeanine Sinanan-Singh, directora de investigación de IA generativa de Appen. “Pensé: ‘Vaya, esto podría cambiar las reglas del juego’, porque los modelos luchan con la velocidad y la ineficiencia”, añade.

“Pero cuando obtienes resultados impactantes, en realidad no es tan creíble cuando lo dices tú mismo”. SubQ no reemplazará a los mejores modelos existentes en todos los ámbitos, pero podría ofrecer enormes aumentos en la velocidad a una fracción del costo típico para ciertas tareas. Sin embargo, Subquadratic insiste en que, a largo plazo, su avance podría cambiar la forma en que se construyen los LLM. “Esperamos estar iniciando una nueva era de eficiencia”, dice Justin Dangel, cofundador y director ejecutivo de la empresa.

“No creemos que nadie vaya a construir transformadores dentro de unos años”. ¡Atención! Para comprender por qué las afirmaciones de Subquadratic son tan importantes, analicemos cómo funcionan la mayoría de los LLM. El mecanismo clave dentro de un LLM es un tipo de red neuronal llamada transformador, que ejecuta un proceso conocido como atención densa.

Los LLM actuales suelen encadenar varios transformadores. (El artículo fundamental de la era LLM, publicado por investigadores de Google en 2017, se tituló “La atención es todo lo que necesitas”.) La atención densa funciona así: cuando un transformador procesa un fragmento de texto, primero codifica cada palabra (o parte de una palabra, conocida como token) con un número. Para captar el significado del texto completo,…

📰 Fuente Original

Modelos Llm – Leer artículo completo →

📌 Nota: Este artículo fue traducido automáticamente. Para la versión original en inglés, visita el enlace de la fuente.

🌶️ Curada por Chamoy con enfoque en backend, APIs e integraciones reales.

📰 Fuente Original

Must Read