PCهای هوش مصنوعی با NPU اختصاصی بالاخره به دست مصرف‌کننده رسیدند — این تراشه‌ها واقعاً چه کاری انجام می‌دهند | IRCNF - Intelligent Reliable Custom Next-gen Frameworks

عبارت 'AI PC' اولین بار در CES 2024 زمزمه شد و بعد از آن در هر معرفی لپ‌تاپ با صدای بلند تکرار شد. تا پایان آن سال، این عبارت به 'نمایشگر 4K' و 'باتری تمام‌روز' پیوست — زبان بازاریابی‌ای که آنقدر همه‌گیر شد که معنای اصلی‌اش را از دست داد. هر لپ‌تاپی که دکمه Copilot داشت، یک AI PC محسوب می‌شد. تراشه‌هایی با واحدهای پردازش عصبی — سیلیکون مخصوص برای شتاب‌دهی به استنتاج Machine Learning — تبدیل به تیک‌باکسی شدند که این برچسب را توجیه می‌کرد.

دو سال بعد، ارزش دارد که از بازاریابی فاصله بگیریم و بپرسیم این NPUها واقعاً چه کار می‌کنند، آیا سخت‌افزار اختصاصی مهم است، و آیا نقطه عطف AI PC واقعاً رسیده یا فقط اعلام شده است.

اپل قالب را ساخت

قبل از اینکه دسته‌بندی 'AI PC' وجود داشته باشد، Apple Silicon بود. تراشه M1 که در نوامبر ۲۰۲۰ عرضه شد، شامل یک Neural Engine ۱۶ هسته‌ای در کنار CPU و GPU بود. اپل از زمان A11 Bionic در سال ۲۰۱۷ — نسل iPhone X — Neural Engine را در آیفون‌ها قرار داده بود، بنابراین استنتاج on-device Machine Learning سال‌ها قبل از اینکه در ویندوز مطرح شود، یک قابلیت بومی iOS بود.

Neural Engine در Apple Silicon کارهایی مثل Face ID، عکاسی محاسباتی (حالت شب، پرتره، Photonic Engine)، رونویسی بلادرنگ در Notes، و اخیراً قابلیت‌های Apple Intelligence مثل ابزارهای نوشتن و تولید تصویر در Image Playground را انجام می‌دهد. همه اینها به‌صورت محلی، بدون تماس با ابر، با تأخیر کم و بدون نشت حریم خصوصی اجرا می‌شوند. ۳۸ TOPS (تریلیون عملیات در ثانیه) Neural Engine در M4 باعث می‌شود این قابلیت‌ها فوری به نظر برسند نه کند.

این معیاری است که NPUهای ویندوزی با آن سنجیده می‌شوند، و مقایسه مفیدی است: اپل سخت‌افزار Neural Engine را نفرستاد و بعد فهمید چه کاری با آن کند. قابلیت‌ها و سیلیکون با هم عرضه شدند.

لحظه Snapdragon X کوالکام

مهمترین تحول سمت ویندوز در سال ۲۰۲۴، Qualcomm Snapdragon X Elite بود — اولین پردازنده Windows on Arm که در عملکرد با x86 رقابت جدی کرد و در عمر باتری با Apple Silicon برابری کرد. نکته حیاتی این است که شامل یک NPU با ۴۵ TOPS است که از الزام ۴۰ TOPS مایکروسافت برای گواهی 'Copilot+ PC' فراتر می‌رود.

NPU Snapdragon X Elite Windows Studio Effects را اجرا می‌کند — مجموعه‌ای از محو کردن پس‌زمینه، تصحیح تماس چشمی و کاهش نویز که در ویندوز ۱۱ تعبیه شده است. همچنین رونویسی بلادرنگ در Live Captions ویندوز را با گفتار به متن آفلاین انجام می‌دهد که روی هر صدایی، هر برنامه‌ای، بدون ارسال صدا به ابر کار می‌کند. Cocreator در Microsoft Paint تصاویر را به‌صورت محلی با استفاده از یک مدل SDXL فشرده تولید می‌کند. اینها قابلیت‌های واقعی هستند که در زمان واقعی روی سیلیکون عصبی اختصاصی اجرا می‌شوند.

سمت x86 هم سریعاً خود را رساند. تراشه‌های Intel Core Ultra Meteor Lake (اواخر ۲۰۲۳) برای اولین بار در تاریخ اینتل شامل یک NPU شدند، با ۱۰ تا ۳۴ TOPS بسته به مدل. Arrow Lake (اواخر ۲۰۲۴) این را بهبود داد. سری AMD Ryzen AI NPU را به لاین‌آپ موبایل AMD آورد. الزام گواهی Copilot+ PC عملاً سخت‌افزار NPU را در سراسر صنعت الزامی کرد.

چه چیزی امروز کار می‌کند

فهرست صادقانه قابلیت‌های NPU-accelerated که در عمل کار می‌کنند کوتاه‌تر از چیزی است که بازاریابی نشان می‌دهد، اما واقعاً مفید است. Windows Studio Effects — محو کردن پس‌زمینه، قاب‌بندی خودکار، تصحیح تماس چشمی در تماس‌های ویدیویی — به آرامی روی سخت‌افزار NPU اجرا می‌شوند بدون اینکه CPU یا GPU را تحت فشار بگذارند. برای کارگران دورکار که تمام روز تماس ویدیویی دارند، این مهم است.

Live Captions رونویسی بلادرنگ از صدای سیستم را ارائه می‌دهد — هر ویدیو، هر جلسه، هر برنامه — با دقت معقول برای انگلیسی و پشتیبانی رو به رشد از زبان‌های دیگر. این همه‌کاره‌ترین ویژگی AI PC برای طیف وسیعی از کاربران است، و وقتی روی NPU بارگذاری می‌شود واقعاً بهتر است.

استنتاج محلی LLM از طریق ابزارهایی مثل Ollama و llama.cpp وقتی Framework پشتیبانی کند روی NPU اجرا می‌شود. مدل‌هایی مثل Phi-3 Mini، Llama 3.2 3B و Gemma 2 2B روی NPUهای مدرن به‌اندازه کافی سریع اجرا می‌شوند — نه به سرعت یک GPU مجزا، اما بدون مصرف برق بالا و بدون نیاز به ابر. برای توسعه‌دهندگانی که به دلایل حریم خصوصی یا آفلاین به استنتاج محلی نیاز دارند، تراشه‌های رده NPU بهبود معناداری نسبت به استنتاج فقط با CPU هستند.

مشکل تکه‌تکه شدن API

بزرگترین مانع عملی برای پذیرش NPU، تکه‌تکه شدن API است. NPU کوالکام از SDK مخصوص خود یعنی QNN (Qualcomm Neural Network) استفاده می‌کند. NPU اینتل از OpenVINO و DirectML استفاده می‌کند. AMD از ROCm و DirectML. Neural Engine اپل از Core ML. هیچکدام با یکدیگر سازگار نیستند.

DirectML مایکروسافت نزدیک‌ترین چیز به یک API یکپارچه برای شتاب عصبی در ویندوز است، اما فروشندگان سخت‌افزار در افشای کامل قابلیت‌های NPU خود از طریق آن کند عمل کرده‌اند. توسعه‌دهندگان برنامه باید تصمیم بگیرند که کد مخصوص هر فروشنده بنویسند، به DirectML تکیه کنند (که ممکن است در برخی پلتفرم‌ها اصلاً از NPU استفاده نکند)، یا فقط روی GPU اجرا کنند و NPU را نادیده بگیرند. بیشتر برنامه‌های شخص ثالت گزینه آخر را انتخاب می‌کنند.

نتیجه این است که استفاده از NPU که در Task Manager ویندوز می‌بینید تقریباً کاملاً از قابلیت‌های خود مایکروسافت است. یک اپلیکیشن کنفرانس ویدیویی شخص ثالث را باز کنید به جای Teams یا برنامه‌های بومی ویندوز، و آن NPU بیکار است در حالی که GPU یا CPU محو کردن پس‌زمینه را انجام می‌دهند.

Microsoft Recall و حساب‌کشی حریم خصوصی

جنجالی‌ترین ویژگی AI PC پیشنهادی — Microsoft Recall که به‌طور دوره‌ای از همه کارهایی که روی PC خود می‌کنید اسکرین‌شات می‌گیرد و آن را با زبان طبیعی قابل جستجو می‌کند — نیاز به سخت‌افزار رده NPU داشت و در ابتدا انحصاری Copilot+ بود. پس از انتقادات شدید حریم خصوصی، مایکروسافت آن را به تأخیر انداخت و دوباره طراحی کرد، با افزودن الزامات opt-in، رمزگذاری محلی و احراز هویت Windows Hello قبل از دسترسی.

راه‌اندازی پرچالش Recall یک تنش اساسی در بازاریابی AI PC را نشان داد: جاه‌طلبانه‌ترین 'قابلیت‌های هوش مصنوعی' شامل پردازش مداوم داده‌های حساس هستند. وعده پردازش on-device برای حریم خصوصی واقعی است، اما فقط اگر کاربران اعتماد کنند که داده‌های پردازش شده محلی باقی می‌مانند — که نیاز به انتخاب‌های طراحی قابل تأیید دارد، نه ادعاهای بازاریابی.

آیا واقعاً یک عصر جدید است؟

IDC پیش‌بینی می‌کند که ۶۰٪ از PCهای عرضه شده در سال ۲۰۲۵ مشخصات AI PC را برآورده می‌کنند. این اشباع واقعی سخت‌افزار است. اینکه آیا اکوسیستم نرم‌افزاری خود را می‌رساند، سؤال باز است. قابلیت‌های تحت کنترل مایکروسافت کار می‌کنند. اکوسیستم فراتر از مایکروسافت همچنان در حال فهمیدن چگونگی استفاده از این سیلیکون است.

مقایسه با Apple Silicon در اینجا هم آموزنده است: قابلیت‌های Neural Engine اپل به‌شدت یکپارچه هستند چون اپل هم طراحی تراشه، هم OS و هم برنامه‌های اصلی را کنترل می‌کند. تکه‌تکه شدن اکوسیستم ویندوز — بین مایکروسافت، تنوع سخت‌افزاری OEM و توسعه‌دهندگان شخص ثالث — یکپارچه‌سازی مشابه را از نظر ساختاری سخت‌تر می‌کند. سخت‌افزار NPU لازم است اما برای یک AI PC که به اندازه یک M4 MacBook منسجم باشد کافی نیست. لایه نرم‌افزاری کار باقی‌مانده است.