روبوتاک

تجربه شبیه ساز واقعیت ساخته‌شده با هوش مصنوعی؛ با پشتیبانی یکی از بنیان‌گذاران پیکسار

در ماه‌های اخیر، شرکت‌های فعال در حوزه هوش مصنوعی شروع به آزمایش دنیاهای مجازی تعاملی و تولیدشده توسط هوش مصنوعی کرده‌اند. نسخه‌هایی از بازی‌های کلاسیکی مانند Quake و Minecraft با استفاده از هوش مصنوعی بازسازی شده‌اند. همچنین، تیمی در Google DeepMind مشغول توسعه مدل‌هایی است که بتوانند «شبیه ساز واقعیت» انجام دهند.

اکنون استارتاپی به نام Odyssey که از حمایت ادوین کتمول، یکی از بنیان‌گذاران پیکسار برخوردار است، قدم جدیدی در این مسیر برداشته و مفهومی به نام «ویدئوی تعاملی» را معرفی کرده است. این تجربه هم‌اکنون در قالب نسخه پیش‌نمایش تحقیقاتی در دسترس عموم قرار گرفته است.

ویدیویی که تماشا می‌کنید و با آن تعامل دارید

Odyssey در وب‌سایت خود، ویدیوی تعاملی را این‌گونه تعریف می‌کند: «ویدیویی که می‌توانید هم آن را ببینید و هم با آن تعامل داشته باشید، و همه چیز آن در لحظه توسط هوش مصنوعی تولید می‌شود.» این تجربه شبیه بازی‌های اول‌شخص است، اما در محیط‌هایی که بیشتر شبیه دنیای واقعی هستند تا محیط‌های پیکسلی یا چندضلعی.

Odyssey این فناوری را یک «نسخه اولیه از هولودک» (Holodeck) توصیف می‌کند – مفهومی برگرفته از سریال Star Trek – اما با این توضیح که فعلاً تجربه آن بیشتر شبیه یک رؤیای خام و ناپایدار است: پر از باگ، ولی نو و هیجان‌انگیز.

تجربه کاربری: مثل قدم زدن در نسخه تار و لرزان Google Street View

در عمل، این ویدیوهای تعاملی شبیه قدم زدن در نسخه‌ای تار و گلیچی از Google Street View هستند. کاربران با استفاده از کلیدهای WASD می‌توانند در محیط‌های مختلف قدم بزنند. برخی از این دنیاها شامل مناطق جنگلی با کلبه، یک مرکز خرید، یا پارکینگی جلوی یک ساختمان بزرگ هستند. هر بار که وارد محیط می‌شوید، ظاهر آن کمی متفاوت است چون تصاویر به‌صورت زنده و در لحظه بازتولید می‌شوند.

وضوح تصویر البته هنوز پایین است و بیشتر تصاویر تار هستند. هر بار تنها دو و نیم دقیقه فرصت دارید در دنیای آزمایشی گشت بزنید، ولی می‌توانید با رفرش کردن، دوباره وارد شوید.

از تکنولوژی پیشرفته تا واقعیت ناقص

Odyssey از خوشه‌هایی از GPUهای قدرتمند H100 در آمریکا و اروپا برای تولید این ویدیوها استفاده می‌کند. طبق توضیحات شرکت، «با استفاده از ورودی و تاریخچه فریم‌ها، مدل پیش‌بینی می‌کند که فریم بعدی باید چگونه باشد و آن را در لحظه برای شما استریم می‌کند.» کل این فرآیند می‌تواند در حدود ۴۰ میلی‌ثانیه انجام شود.

با این حال، تجربه هنوز خالی از اشکال نیست. برخورد با اجسام همیشه به‌درستی کار نمی‌کند؛ مثلاً گاهی با یک حصار متوقف می‌شوید، اما از میان دیوار یک خانه عبور می‌کنید. گاهی نیز هنگام بی‌حرکت ماندن، مدل خودش به آرامی تصویر را به چپ می‌چرخاند یا شما را به دیوار نزدیک می‌کند.

نظر بنیان‌گذار پیکسار

در مصاحبه‌ای با The Verge، ادوین کتمول که در هیئت‌مدیره Odyssey حضور دارد، زمان دقیقی برای بهبود کیفیت تصویر ارائه نکرد، اما گفت:
«Odyssey در خط مقدم این حوزه قرار دارد و در جامعه‌ای فعال است که اطلاعات و دانش فنی به سرعت در آن پیشرفت می‌کند.»

او اذعان کرد که تصاویر هنوز پر از نویز هستند، اما افزود که بسیاری از این نویزها، به‌ویژه در بافت ساختمان‌ها، همان چیزهایی هستند که فیلترهای عصبی می‌توانند به‌خوبی اصلاح کنند.

هنوز با “هولودک” فاصله داریم

این تجربه هنوز نمی‌تواند جای بازی‌هایی مانند Fortnite را بگیرد، و حتی به عنوان یک فیلم یا ترکیبی از فیلم و بازی هم هنوز خام و پر از اشکال است. در حال حاضر، تغییرات ناگهانی محیط‌ها و جلوه‌های بصری ناپایدار مانع از ارائه یک تجربه منسجم و سینمایی می‌شود.

با این حال، پتانسیل‌های جالبی در این فناوری دیده می‌شود. با سرعتی که ابزارهای هوش مصنوعی در حال پیشرفت هستند، شاید در آینده‌ای نه‌چندان دور، شاهد نسخه‌ای از این فناوری باشیم که پایدارتر، واقعی‌تر و قابل استفاده‌تر باشد.

دیدگاه‌ها (1)

  1. محمدرضا
    ۱۳ خرداد ۱۴۰۴

    دنیا داره شبیه فیلما میشه

    پاسخ

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *