IRCNF

ان‌پی‌سی‌های هوش مصنوعی بالاخره واقعی شدند: چطور مدل‌های زبانی روی دستگاه، شخصیت‌های اسکریپتی را منسوخ می‌کنند

اشتراک‌گذاری:
ان‌پی‌سی‌های هوش مصنوعی بالاخره واقعی شدند: چطور مدل‌های زبانی روی دستگاه، شخصیت‌های اسکریپتی را منسوخ می‌کنند

هر بازی منتشر شده در سی سال گذشته یک داستان تخیلی داشت. شخصیت‌هایی که دنیاها را پر می‌کردند - میخانه‌دارها، ماموران ماموریت، دشمنان، همراهان - هرگز واقعاً زنده نبودند. آنها اسکریپت اجرا می‌کردند. درخت گفتگو داشتند. حرف‌هایشان را تکرار می‌کردند. بازیکن‌ها این را به عنوان ویژگی این رسانه پذیرفتند، همانطور که خوانندگان می‌پذیرند نمی‌توان با رمان تعامل کرد. این محدودیت نامرئی بود چون جایگزینی برای مقایسه وجود نداشت. در ۲۰۲۶، آن جایگزین در راه است و تضادش با فرضیات قدیمی طراحی بازی، ناراحت‌کننده است.

لایه فنی پشت شخصیت‌های هوش مصنوعی

NVIDIA Avatar Cloud Engine (ACE) شناخته‌شده‌ترین پلتفرم تجاری برای شخصیت‌های بازی مبتنی بر هوش مصنوعی است، اما معماری زیرساخت در صنعت دارد استاندارد می‌شود. یک NPC هوش مصنوعی در ۲۰۲۶ معمولاً روی چند لایه اجرا می‌شود: یک مدل تشخیص گفتار که حرف بازیکن را به متن تبدیل می‌کند، یک Language Model که ورودی را پردازش کرده و پاسخ مناسب تولید می‌کند، یک مدل Text-to-Speech با لحن احساسی، و یک مدل انیمیشن چهره که حرکت لب و حالت را با خروجی صدا هماهنگ می‌کند. سیستم Audio2Face انویدیا دو لایه آخر را مدیریت می‌کند؛ لایه زبان می‌تواند روی هر مدل توانمندی اجرا شود.

نوآوری کلیدی که این را در مقیاس عملی می‌کند، inference روی دستگاه است. NVIDIA In-Game Inferencing (NVIGI) SDK اجازه می‌دهد این مدل‌ها مستقیماً روی GPU RTX بازیکن اجرا شوند نه از طریق سرورهای ابری. این به سه دلیل مهم است: تاخیر (مکالمه‌ای که سه ثانیه طول بکشد جواب بدهد، غوطه‌وری را نابود می‌کند)، هزینه در مقیاس (inference ابری برای میلیون‌ها تعامل همزمان NPC بسیار گران است)، و حریم خصوصی (مکالمات با شخصیت‌های بازی روی دستگاه بازیکن می‌ماند و یک دسته حساسیت داده حذف می‌شود).

وقتی NPCها واقعاً می‌توانند فکر کنند چه تغییری می‌کند

تفاوت‌های رفتاری در سناریوهای مشخص مشخص می‌شود. در بازی‌های با NPC اسکریپتی، تکرار یک سوال همان جواب را می‌دهد. پرسیدن چیزی که NPC نباید بداند، یک انحراف اسکریپتی یا هیچ جوابی ندارد. تلاش برای دوست شدن با دشمن یا دستکاری متحد خارج از پارامترهای طراحی شده به دیوار می‌خورد. NPC دقیقاً می‌داند توسعه‌دهنده چه سوالاتی را پیش‌بینی کرده، و بس.

یک NPC هوش مصنوعی در زمان واقعی تطبیق می‌یابد. PUBG: Battlegrounds در حال ادغام «شخصیت‌های قابل بازی با هم» از طریق PUBG Ally است - هم‌تیمی‌های هوش مصنوعی با حافظه پایدار که اتفاقات جلسات قبل را ردیابی می‌کنند، بر اساس وضعیت فعلی بازی توصیه استراتژیک ارائه می‌دهند و گفتگو تاکتیکی انجام می‌دهند. inZOI از NVIDIA ACE برای NPCهای «Smart Zoi» استفاده می‌کند که بر اساس تعاملات انباشته، شخصیت و رفتار خود را تنظیم می‌کنند. Total War: PHARAOH یک مشاور AI آگاه از زمینه ادغام کرده که مکانیک‌های بازی را با زبان ساده بر اساس وضعیت دقیق صفحه بازیکن توضیح می‌دهد - ویژگی‌ای با پیامدهای واقعی دسترسی‌پذیری برای بازیکنانی که از بازی‌های استراتژیک پیچیده دوری می‌کردند.

تفاوت اصلی فقط این نیست که NPCها زنده‌تر به نظر می‌رسند. این است که عاملیت بازیکن در دنیا گسترش می‌یابد. وقتی یک شخصیت می‌تواند ورودی جدید را بفهمد و منسجم پاسخ دهد، تعاملاتی که قبلاً غیرممکن بود ممکن می‌شود: مذاکره خارج از گزینه‌های اسکریپتی، کشف اطلاعات از طریق سوالات خلاقانه، ایجاد روابطی که بر اساس گفتگوی واقعی توسعه می‌یابد نه امتیازات روابط اسکریپتی.

مشکل طراحی که هنوز کسی حل نکرده

همان قابلیتی که NPCهای هوش مصنوعی را جذاب می‌کند، یک مشکل طراحی ایجاد می‌کند که صنعت هنوز حل نکرده: اگر یک شخصیت بتواند هر چیزی بگوید، بازی چطور روایت خود را حفظ می‌کند؟ یک بازی داستان‌محور کار می‌کند چون توسعه‌دهنده جریان اطلاعات را کنترل می‌کند - شخصیت‌ها در زمان مناسب چیزها را فاش می‌کنند، رویدادها به ترتیب رخ می‌دهند، درک بازیکن به سمت اوج طراحی شده می‌رود. یک NPC کاملاً باز با قابلیت‌های عمومی Language Model به طور بالقوه می‌تواند نقاط داستانی را لو بدهد، جهان‌سازی را نقض کند، یا پاسخ‌هایی بدهد که غوطه‌وری را به شکل متفاوتی از دیالوگ اسکریپتی بشکند.

راه‌حل‌هایی که امتحان می‌شوند متفاوت است. برخی پیاده‌سازی‌ها مدل را با System Promptهای سنگین محدود می‌کنند که دانش، شخصیت و موضوعات مجاز شخصیت را تعریف می‌کند. برخی دیگر از Retrieval-Augmented Generation استفاده می‌کنند که شخصیت فقط می‌تواند به اطلاعات موجود در یک پایگاه دانش مدیریت‌شده مرتبط با نقش خود در دنیا ارجاع دهد. pipeline Unreal Engine 5.7 انویدیا که در Unreal Fest 2026 نمایش داده شد، به توسعه‌دهندگان اجازه می‌دهد انگیزه و پیشینه شخصیت را تعریف کنند که پاسخ‌ها را شکل می‌دهد بدون اینکه تک‌خط‌ها را اسکریپت کنند. تنش بین کنترل روایت و آزادی مکالمه، مشکل طراحی حل‌نشده مرکزی شخصیت‌های هوش مصنوعی است، و بازی‌های مختلف آن را با trade-offهای بسیار متفاوت حل می‌کنند.

حافظه به عنوان عنصر گمشده

ویژگی‌ای که یک NPC هوش مصنوعی واقعاً جذاب را از یک تازگی جدا می‌کند، حافظه پایدار است. شخصیتی که حرف شما را سه جلسه قبل به خاطر می‌آورد، به تاریخچه مشترک ارجاع می‌دهد، بر اساس تجربه انباشته رابطه‌اش را با شما تغییر می‌دهد - این چیزی است که یک NPC را مانند یک رابطه می‌کند نه یک ابزار. پیاده‌سازی‌های فعلی شروع به پرداختن به این کرده‌اند. حافظه بلندمدت PUBG Ally گامی در این مسیر است. اما چالش‌های فنی و طراحی مدیریت حافظه پایدار شخصیت در مقیاس، بین جلسات و به روش‌هایی که روایی بمانند، قابل توجه است. شخصیت‌های ۲۰۲۶ آزمایش‌های اولیه هستند. بازی‌هایی که در ۲۰۲۸ و بعد حول این قابلیت ساخته می‌شوند، احتمالاً به اندازه امروز نسبت به دیالوگ‌های درختی ۲۰۱۰ متفاوت خواهند بود.

اشتراک‌گذاری:
ان‌پی‌سی‌های هوش مصنوعی بالاخره واقعی شدند: چطور مدل‌های زبانی روی دستگاه، شخصیت‌های اسکریپتی را منسوخ می‌کنند | IRCNF - Intelligent Reliable Custom Next-gen Frameworks