PCهای هوش مصنوعی با NPU اختصاصی بالاخره به دست مصرفکننده رسیدند — این تراشهها واقعاً چه کاری انجام میدهند

عبارت 'AI PC' اولین بار در CES 2024 زمزمه شد و بعد از آن در هر معرفی لپتاپ با صدای بلند تکرار شد. تا پایان آن سال، این عبارت به 'نمایشگر 4K' و 'باتری تمامروز' پیوست — زبان بازاریابیای که آنقدر همهگیر شد که معنای اصلیاش را از دست داد. هر لپتاپی که دکمه Copilot داشت، یک AI PC محسوب میشد. تراشههایی با واحدهای پردازش عصبی — سیلیکون مخصوص برای شتابدهی به استنتاج Machine Learning — تبدیل به تیکباکسی شدند که این برچسب را توجیه میکرد.
دو سال بعد، ارزش دارد که از بازاریابی فاصله بگیریم و بپرسیم این NPUها واقعاً چه کار میکنند، آیا سختافزار اختصاصی مهم است، و آیا نقطه عطف AI PC واقعاً رسیده یا فقط اعلام شده است.
اپل قالب را ساخت
قبل از اینکه دستهبندی 'AI PC' وجود داشته باشد، Apple Silicon بود. تراشه M1 که در نوامبر ۲۰۲۰ عرضه شد، شامل یک Neural Engine ۱۶ هستهای در کنار CPU و GPU بود. اپل از زمان A11 Bionic در سال ۲۰۱۷ — نسل iPhone X — Neural Engine را در آیفونها قرار داده بود، بنابراین استنتاج on-device Machine Learning سالها قبل از اینکه در ویندوز مطرح شود، یک قابلیت بومی iOS بود.
Neural Engine در Apple Silicon کارهایی مثل Face ID، عکاسی محاسباتی (حالت شب، پرتره، Photonic Engine)، رونویسی بلادرنگ در Notes، و اخیراً قابلیتهای Apple Intelligence مثل ابزارهای نوشتن و تولید تصویر در Image Playground را انجام میدهد. همه اینها بهصورت محلی، بدون تماس با ابر، با تأخیر کم و بدون نشت حریم خصوصی اجرا میشوند. ۳۸ TOPS (تریلیون عملیات در ثانیه) Neural Engine در M4 باعث میشود این قابلیتها فوری به نظر برسند نه کند.
این معیاری است که NPUهای ویندوزی با آن سنجیده میشوند، و مقایسه مفیدی است: اپل سختافزار Neural Engine را نفرستاد و بعد فهمید چه کاری با آن کند. قابلیتها و سیلیکون با هم عرضه شدند.
لحظه Snapdragon X کوالکام
مهمترین تحول سمت ویندوز در سال ۲۰۲۴، Qualcomm Snapdragon X Elite بود — اولین پردازنده Windows on Arm که در عملکرد با x86 رقابت جدی کرد و در عمر باتری با Apple Silicon برابری کرد. نکته حیاتی این است که شامل یک NPU با ۴۵ TOPS است که از الزام ۴۰ TOPS مایکروسافت برای گواهی 'Copilot+ PC' فراتر میرود.
NPU Snapdragon X Elite Windows Studio Effects را اجرا میکند — مجموعهای از محو کردن پسزمینه، تصحیح تماس چشمی و کاهش نویز که در ویندوز ۱۱ تعبیه شده است. همچنین رونویسی بلادرنگ در Live Captions ویندوز را با گفتار به متن آفلاین انجام میدهد که روی هر صدایی، هر برنامهای، بدون ارسال صدا به ابر کار میکند. Cocreator در Microsoft Paint تصاویر را بهصورت محلی با استفاده از یک مدل SDXL فشرده تولید میکند. اینها قابلیتهای واقعی هستند که در زمان واقعی روی سیلیکون عصبی اختصاصی اجرا میشوند.
سمت x86 هم سریعاً خود را رساند. تراشههای Intel Core Ultra Meteor Lake (اواخر ۲۰۲۳) برای اولین بار در تاریخ اینتل شامل یک NPU شدند، با ۱۰ تا ۳۴ TOPS بسته به مدل. Arrow Lake (اواخر ۲۰۲۴) این را بهبود داد. سری AMD Ryzen AI NPU را به لاینآپ موبایل AMD آورد. الزام گواهی Copilot+ PC عملاً سختافزار NPU را در سراسر صنعت الزامی کرد.
چه چیزی امروز کار میکند
فهرست صادقانه قابلیتهای NPU-accelerated که در عمل کار میکنند کوتاهتر از چیزی است که بازاریابی نشان میدهد، اما واقعاً مفید است. Windows Studio Effects — محو کردن پسزمینه، قاببندی خودکار، تصحیح تماس چشمی در تماسهای ویدیویی — به آرامی روی سختافزار NPU اجرا میشوند بدون اینکه CPU یا GPU را تحت فشار بگذارند. برای کارگران دورکار که تمام روز تماس ویدیویی دارند، این مهم است.
Live Captions رونویسی بلادرنگ از صدای سیستم را ارائه میدهد — هر ویدیو، هر جلسه، هر برنامه — با دقت معقول برای انگلیسی و پشتیبانی رو به رشد از زبانهای دیگر. این همهکارهترین ویژگی AI PC برای طیف وسیعی از کاربران است، و وقتی روی NPU بارگذاری میشود واقعاً بهتر است.
استنتاج محلی LLM از طریق ابزارهایی مثل Ollama و llama.cpp وقتی Framework پشتیبانی کند روی NPU اجرا میشود. مدلهایی مثل Phi-3 Mini، Llama 3.2 3B و Gemma 2 2B روی NPUهای مدرن بهاندازه کافی سریع اجرا میشوند — نه به سرعت یک GPU مجزا، اما بدون مصرف برق بالا و بدون نیاز به ابر. برای توسعهدهندگانی که به دلایل حریم خصوصی یا آفلاین به استنتاج محلی نیاز دارند، تراشههای رده NPU بهبود معناداری نسبت به استنتاج فقط با CPU هستند.
مشکل تکهتکه شدن API
بزرگترین مانع عملی برای پذیرش NPU، تکهتکه شدن API است. NPU کوالکام از SDK مخصوص خود یعنی QNN (Qualcomm Neural Network) استفاده میکند. NPU اینتل از OpenVINO و DirectML استفاده میکند. AMD از ROCm و DirectML. Neural Engine اپل از Core ML. هیچکدام با یکدیگر سازگار نیستند.
DirectML مایکروسافت نزدیکترین چیز به یک API یکپارچه برای شتاب عصبی در ویندوز است، اما فروشندگان سختافزار در افشای کامل قابلیتهای NPU خود از طریق آن کند عمل کردهاند. توسعهدهندگان برنامه باید تصمیم بگیرند که کد مخصوص هر فروشنده بنویسند، به DirectML تکیه کنند (که ممکن است در برخی پلتفرمها اصلاً از NPU استفاده نکند)، یا فقط روی GPU اجرا کنند و NPU را نادیده بگیرند. بیشتر برنامههای شخص ثالت گزینه آخر را انتخاب میکنند.
نتیجه این است که استفاده از NPU که در Task Manager ویندوز میبینید تقریباً کاملاً از قابلیتهای خود مایکروسافت است. یک اپلیکیشن کنفرانس ویدیویی شخص ثالث را باز کنید به جای Teams یا برنامههای بومی ویندوز، و آن NPU بیکار است در حالی که GPU یا CPU محو کردن پسزمینه را انجام میدهند.
Microsoft Recall و حسابکشی حریم خصوصی
جنجالیترین ویژگی AI PC پیشنهادی — Microsoft Recall که بهطور دورهای از همه کارهایی که روی PC خود میکنید اسکرینشات میگیرد و آن را با زبان طبیعی قابل جستجو میکند — نیاز به سختافزار رده NPU داشت و در ابتدا انحصاری Copilot+ بود. پس از انتقادات شدید حریم خصوصی، مایکروسافت آن را به تأخیر انداخت و دوباره طراحی کرد، با افزودن الزامات opt-in، رمزگذاری محلی و احراز هویت Windows Hello قبل از دسترسی.
راهاندازی پرچالش Recall یک تنش اساسی در بازاریابی AI PC را نشان داد: جاهطلبانهترین 'قابلیتهای هوش مصنوعی' شامل پردازش مداوم دادههای حساس هستند. وعده پردازش on-device برای حریم خصوصی واقعی است، اما فقط اگر کاربران اعتماد کنند که دادههای پردازش شده محلی باقی میمانند — که نیاز به انتخابهای طراحی قابل تأیید دارد، نه ادعاهای بازاریابی.
آیا واقعاً یک عصر جدید است؟
IDC پیشبینی میکند که ۶۰٪ از PCهای عرضه شده در سال ۲۰۲۵ مشخصات AI PC را برآورده میکنند. این اشباع واقعی سختافزار است. اینکه آیا اکوسیستم نرمافزاری خود را میرساند، سؤال باز است. قابلیتهای تحت کنترل مایکروسافت کار میکنند. اکوسیستم فراتر از مایکروسافت همچنان در حال فهمیدن چگونگی استفاده از این سیلیکون است.
مقایسه با Apple Silicon در اینجا هم آموزنده است: قابلیتهای Neural Engine اپل بهشدت یکپارچه هستند چون اپل هم طراحی تراشه، هم OS و هم برنامههای اصلی را کنترل میکند. تکهتکه شدن اکوسیستم ویندوز — بین مایکروسافت، تنوع سختافزاری OEM و توسعهدهندگان شخص ثالث — یکپارچهسازی مشابه را از نظر ساختاری سختتر میکند. سختافزار NPU لازم است اما برای یک AI PC که به اندازه یک M4 MacBook منسجم باشد کافی نیست. لایه نرمافزاری کار باقیمانده است.