Las PC con IA equipadas con NPU dedicadas finalmente llegan a manos de los consumidores: esto es lo que realmente hacen los chips

El término 'PC con IA' se susurró por primera vez en el CES 2024 y rápidamente se gritó en cada anuncio de portátiles que siguió. A finales de ese año, se había unido a 'pantalla 4K' y 'batería para todo el día' como lenguaje de marketing tan ubicuo que había perdido gran parte de su significado. Cada portátil con un botón de Copilot se convirtió en una PC con IA. Los chips con unidades de procesamiento neuronal — silicio dedicado para acelerar la inferencia de Machine Learning — se convirtieron en la casilla de verificación que justificaba la etiqueta.

Dos años después, vale la pena alejarse del marketing y preguntarse qué hacen realmente estas NPU, si el hardware dedicado importa, y si el punto de inflexión de la PC con IA ha llegado realmente o solo se ha declarado.

Apple marcó la pauta

Antes de que existiera la categoría 'PC con IA', estaba Apple Silicon. El chip M1, lanzado en noviembre de 2020, incluía un Neural Engine de 16 núcleos junto a su CPU y GPU. Apple ha estado enviando Neural Engines en iPhones desde el A11 Bionic en 2017 — la generación del iPhone X — convirtiendo la inferencia de Machine Learning en dispositivo en una capacidad nativa de iOS años antes de que se convirtiera en un tema de conversación en Windows.

El Neural Engine en Apple Silicon maneja Face ID, fotografía computacional (modo noche, modo retrato, photonic engine), transcripción en tiempo real en Notes, y — más recientemente — funciones de Apple Intelligence como herramientas de escritura y generación de imágenes en Image Playground. Todo se ejecuta localmente, sin llamada a la nube, con baja latencia y sin exposición de privacidad. Los 38 TOPS (billones de operaciones por segundo) del Neural Engine en M4 son lo que hace que estas funciones se sientan instantáneas en lugar de lentas.

Este es el Benchmark contra el cual se miden las NPU de las PC con Windows, y es útil: Apple no envió hardware de Neural Engine y luego averiguó qué hacer con él. Las funciones y el silicio llegaron juntos.

El momento Snapdragon X de Qualcomm

El avance más significativo del lado de Windows en 2024 fue el Qualcomm Snapdragon X Elite — el primer procesador Windows on Arm que compite seriamente con x86 en rendimiento mientras iguala a Apple Silicon en duración de batería. Críticamente, incluye una NPU de 45 TOPS, superando el requisito de 40 TOPS de Microsoft para la certificación 'Copilot+ PC'.

La NPU del Snapdragon X Elite ejecuta Windows Studio Effects — el conjunto de funciones de desenfoque de fondo, corrección de contacto visual y supresión de ruido integradas en Windows 11. Maneja la transcripción en tiempo real en la función Live Captions de Windows, con conversión de voz a texto sin conexión que funciona en cualquier audio, cualquier aplicación, sin enviar el audio a la nube. Cocreator en Microsoft Paint genera imágenes localmente usando un modelo SDXL comprimido. Estas son funciones reales, que se ejecutan en tiempo real, en el silicio neuronal dedicado.

El lado x86 se puso al día rápidamente. Los chips Intel Core Ultra Meteor Lake (finales de 2023) incluyeron una NPU por primera vez en la historia de Intel, con una calificación de 10-34 TOPS según la variante. Arrow Lake (finales de 2024) mejoró esto. La serie AMD Ryzen AI trajo NPU a la línea móvil de AMD. El requisito de certificación Copilot+ PC efectivamente obligó a incluir hardware NPU en toda la industria.

Lo que funciona hoy

El balance honesto de las funciones aceleradas por NPU que funcionan en la práctica es más corto de lo que sugiere el marketing, pero genuinamente útil. Windows Studio Effects — desenfoque de fondo, encuadre automático, corrección de contacto visual durante videollamadas — se ejecutan sin problemas en hardware NPU sin sobrecargar la CPU o GPU. Para trabajadores remotos que pasan todo el día en videollamadas, esto importa.

Live Captions proporciona transcripción en tiempo real del audio del sistema — cualquier video, cualquier reunión, cualquier aplicación — con una precisión razonable para inglés y soporte creciente para otros idiomas. Es la función de PC con IA más universalmente útil para una amplia gama de usuarios, y es genuinamente mejor cuando se descarga a una NPU.

La inferencia local de LLM a través de herramientas como Ollama y llama.cpp se ejecuta en hardware NPU cuando el Framework lo soporta. Modelos como Phi-3 Mini, Llama 3.2 3B y Gemma 2 2B se ejecutan a una velocidad utilizable en NPU modernas — no tan rápido como en una GPU discreta, pero sin el consumo de energía y sin necesidad de la nube. Para desarrolladores que quieren inferencia de IA local por razones de privacidad o sin conexión, los chips clase NPU son una mejora significativa sobre la inferencia solo con CPU.

El problema de la fragmentación

El mayor obstáculo práctico para la adopción de NPU es la fragmentación de las API. La NPU de Qualcomm usa el SDK QNN (Qualcomm Neural Network). La NPU de Intel usa OpenVINO y DirectML. La de AMD usa ROCm y DirectML. El Neural Engine de Apple usa Core ML. Ninguna de ellas es interoperable.

DirectML de Microsoft es lo más parecido a una API unificada de Windows para aceleración neuronal, pero los fabricantes de hardware han sido lentos en exponer todas las capacidades de sus NPU a través de ella. Los desarrolladores de aplicaciones tienen que decidir si escribir código específico para NPU de cada fabricante, confiar en DirectML (que puede no usar la NPU en absoluto en algunas plataformas), o simplemente ejecutar en la GPU e ignorar la NPU por completo. La mayoría de las aplicaciones de terceros eligen la última opción.

El resultado es que el uso de la NPU que ves en el Administrador de tareas de Windows proviene casi exclusivamente de las propias funciones de Microsoft. Abre una aplicación de videoconferencia de terceros en lugar de Teams o las aplicaciones nativas de Windows, y esa NPU está inactiva mientras la GPU o la CPU manejan el desenfoque de fondo.

Microsoft Recall y el ajuste de cuentas sobre la privacidad

La función propuesta de PC con IA más controvertida — Microsoft Recall, que toma capturas de pantalla periódicas de todo lo que haces en tu PC y lo hace buscable mediante lenguaje natural — requería hardware clase NPU y fue inicialmente exclusiva de Copilot+. Tras importantes críticas sobre privacidad, Microsoft retrasó y rediseñó la función, añadiendo requisitos de aceptación, cifrado local y autenticación Windows Hello antes del acceso.

El problemático lanzamiento de Recall ilustró una tensión fundamental en el marketing de las PC con IA: las funciones de IA más ambiciosas implican procesar datos sensibles de forma continua. La promesa de procesamiento local para la privacidad es real, pero solo si los usuarios confían en que los datos procesados localmente se quedan localmente — lo que requiere decisiones de diseño verificables, no afirmaciones de marketing.

¿Es realmente una nueva era?

IDC proyecta que el 60% de las PC enviadas en 2025 cumplen con la especificación de PC con IA. Eso es una saturación de hardware real. Que el ecosistema de software se ponga al día es la pregunta abierta. Las funciones controladas por Microsoft funcionan. El ecosistema más allá de Microsoft todavía está descubriendo cómo usar el silicio.

La comparación con Apple Silicon también es instructiva aquí: las funciones del Neural Engine de Apple están estrechamente integradas porque Apple controla tanto el diseño del chip como el sistema operativo y las aplicaciones principales. La fragmentación del ecosistema Windows — entre Microsoft, la variación de hardware de los OEM y los desarrolladores de terceros — hace que una integración equivalente sea estructuralmente más difícil. El hardware NPU es necesario pero no suficiente para una PC con IA que se sienta tan coherente como una M4 MacBook. La capa de software es el trabajo restante.