همراه ما باشید
هفته نامه عصر ارتباط
اولیـن و پرتیـراژتـرین هفتـه نـامه ICT کشـور

هوش مصنوعی تبدیل عکس به فیلم متحرک

هوش مصنوعی تبدیل عکس به فیلم متحرک

محققان حوزه یادگیری ماشین موفق به طراحی سیستمی شدند که می‌تواند تصویر متحرک شبیه‌سازی‌شده‌ی بسیار واقعی را تنها با یک فریم از چهره شخص و حتی یک نقاشی‌ بازسازی کند. این سیستم هنوز کامل نشده و در حال آزمایش است، اما زمانی‌که به سیستمی تمام عیار تبدیل شود، مانند دستاوردهای هوش مصنوعی، بسیار جذاب و شگفت‌انگیز خواهد بود

این مدل در مقاله‌ای منتشر شده توسط مرکز تحقیقات هوش مصنوعی سامسونگ (Samsung AI Center) به‌ثبت رسیده است. امکان دسترسی به این مقاله در آرشیو Arxiv وجود دارد. این مدل جدید از روشی برای بازسازی چهره با دو الگوی چهره منبع و چهره هدف استفاده می‌کند. تمام نشانه‌های صورت، هر کدام از اجزای صورت که به هنگام صحبت کردن به‌کار گرفته می‌شود در چهره منبع (source face) ذخیره می‌شود. سپس این اطلاعات به‌دست آمده از صورت در چهره هدف (target face) اعمال می‌شود. این کار باعث می‌شود تا شبیه‌سازی صورت هدف از روی صورت منبع صورت گیرد یعنی چهره هدف همان کاری را انجام دهد که چهره منبع انجام می‌دهد

این مدل به‌نوبه خود جدید نیست، بلکه بخشی از موضوع تصویرسازی مصنوعی است که دنیای هوش مصنوعی در حال حاضر با آن روبه‌رو است. موضوع بسیار جذابی که اخیرا در رویداد رباتیک و هوش مصنوعی دانشگاه برکلی مورد بحث قرار گرفت. امکان شبیه‌سازی چهره به‌صورت ویدئویی ازطریق الگو قرار دادن چهره‌ای دیگر وجود دارد. به‌طوری که چهره ویدئویی می‌تواند حالت حرف زدن یا نگاه کردن شخصی را شبیه‌سازی کند. اما بسیاری از این مدل‌ها، نیازمند اطلاعات درخورتوجهی مانند، یک تا دو دقیقه از تجزیه و تحلیل دقیق ویدئویی هستند.در مقاله جدیدی که از سوی پژوهشگران Samsung در مرکز مسکو منتشر شده است؛ آن‌ها موفق به ساخت ویدئویی، تنها با استفاده از یک تصویر فرد شدند که می‌توانست صورتش را بچرخاند، صحبت کند و عبارات عادی را بیان کند. اگرچه این ویدئو متقاعدکننده به‌نظر می‌رسید اما به دور از نقص نبود

ساخت این ویدئو با استفاده از فرایند شناسایی نشانه‌های صورت با به‌کارگیری داده‌های بسیار زیاد انجام شد. این مدل به‌دنبال بخشی از اجزای چهره هدف بود که با چهره منبع مطابقت پیدا می‌کرد. در این مدل هرچه داده‌ها بیشتر باشد، نتیجه بهتر و کامل‌تری حاصل می‌شود. این درحالی است که این داده‌ها فقط باید از یک تصویر به دست آمده باشند که به آن یادگیری تک‌شات (single-shot learning) گفته می‌شود.

با استفاده از این مدل می‌توان با داشتن تنها یک تصویر از انیشتین، مریلین مونرو یا حتی مونا لیزا تصاویر متحرکی از آن‌ها ساخت که گویا صحبت می‌کنند و صورتشان را مانند یک انسان واقعی حرکت می‌دهند
برای نمونه، در تصویری که مشاهده می‌کنید مونا لیزا با سه چهره منبع مختلف به‌صورت انیمیشن شبیه‌سازی شده است که نتایج مختلفی در ساختار صورت و رفتار آن قابل مشاهده است.همچنین، این مدل از فناوری Generative Adversarial Network استفاده می‌کند. این فناوری با قرار دادن دو مدل دربرابر یکدیگر، تلاش بر فریب دیگری دارد تا بتواند بیننده را متقاعد کند که آنچه ایجاد شده واقعی است. این بدان معنا است که نتایج حاصل شده با سطح مشخصی از واقع‌گرایی از سوی سازندگان این مدل تعیین شده است. به‌طوری که در مدل discriminator با قطعیت ۹۰ درصد گفته می‌شود که خروجی، تصویر یک انسان واقعی است

در نمونه‌های دیگری که از سوی پژوهشگران ارائه شد، کیفیت و وضوح چهره‌ی شبیه‌سازی شده‌ی درحال صحبت کاملا متفاوت بود. برخی تلاش کردند تا تصویر شخصی را از یک برنامه خبری تکثیر کنند و در آن حتی زیرنویس اخبار شبکه را در زیر تصویر با کمک اطلاعات ساختگی بازسازی کردند و جزئیات تصویری دیگر را نیز در آن گنجاندند

همان‌طور که گفته شد، این مدل جدید هنوز کامل نیست. این مدل تنها می‌تواند صورت و گردن به بالا را به‌صورت ویدئویی شبیه‌سازی کند. پس فعلا انتظار رقصیدن مونا لیزا یا دست زدن او را نداشته باشید.

درج دیدگاه

مطالب مشابه ICTNews.ir

  • کنسول جدید مایکروسافت به زودی عرضه میشود

    کنسول جدید مایکروسافت به زودی عرضه میشود

    پروژه مایکروسافت اسکارلت نام گرفته و طی اعلام رسمی این شرکت، قرار است در عید کریسمس سال آینده عرضه شود.

  • خط تولید آیفون به هند انتقال یافت

    خط تولید آیفون به هند انتقال یافت

    در ایالات متحده، فروشندگانی مانند اپل، سامسونگ، ال جی و لنوو بازار تلفن همراه را در دست دارند و حدود 90 درصد از بازار محلی در دست این تولید کنندگان است.

  • برای امنیت سرویس‌های ایرانی باید هکرهای کلاه‌سفید را جدی گرفت

    برای امنیت سرویس‌های ایرانی باید هکرهای کلاه‌سفید را جدی گرفت

    اگر جزو علاقه‌مندان به اخبار دنیای فناوری باشید، احتمالا اصطلاح باگ‌بانتی (Bug Bounty) را شنیده‌اید. باگ‌بانتی به برنامه‌ای اطلاق می‌شود که شرکت‌های بزرگ با استفاده از آن سعی در برطرف‌کردن مشکلات امنیتی خود دارند. به‌بیان ساده‌تر، شرکت‌هایی نظیر

  • دستیارهای صوتی گوگل به افراد مبتلا به مشکلات تکلم کمک می کند

    دستیارهای صوتی گوگل به افراد مبتلا به مشکلات تکلم کمک می کند

    دستیارهای صوتی این روزها به یکی از اجزای جدایی ناپذیر گجت‌های هوشمند تبدیل شده‌اند و روزانه میلیون‌ها نفر در سراسر دنیا از آن‌ها استفاده می‌کنند. اما هستند افرادی هم که به دلیل ابتلا به بیماری‌هایی همچون ام اس و ALS که بر تکلم اثر می‌گذارند، قادر به استفاده از مزایای این دستیارها نیستند.

  • آیا به iOS می توان نفوذ کرد

    آیا به iOS می توان نفوذ کرد

    در همین راستا، اخیرا گزارشی منتشر شده که نشان می‌دهد که یک بازار سیاه برای فروش نمونه‌های پیش تولید آیفون‌ها وجود دارد که بیشتر آن‌ها به سرقت رفته‌اند.

  • ثبت گوشی مسافری فقط برای مسافران حقیقی

    ثبت گوشی مسافری فقط برای مسافران حقیقی

    از آخر هفته گذشته سایت ثبت گوشی مسافری فقط برای مسافران حقیقی که ورود و خروج برای آنها ثبت شده باز است و روی سایر گوشی‌هایی که به اسم مسافری وارد شده‌اند،‌ بسته شده است.

  • درسدسر جدید برای نسخه ios اپلیکیشن های ایرانی

    درسدسر جدید برای نسخه ios اپلیکیشن های ایرانی

    طبق گزارشات رسیده از روز گذشته اکثر اپلیکیشن های ایرانی نسخه ios در حوزه پرداخت، از دسترس خارج شده اند و کاربران گوشی‌های آیفون نمی توانند از این اپلیکیشن ها استفاده کنند.

  • اختلال در ارتباط تلفنی برخی مشترکان تهرانی

    اختلال در ارتباط تلفنی برخی مشترکان تهرانی

    به دلیل عملیات کابل برگردان، ارتباط تلفنی مشترکان ۴ مرکز مخابراتی در تهران طی ۳ روز آینده با اختلال همراه است.

  • امنیت اینستاگرام با ویژگی جدید رو به خطر است

    امنیت اینستاگرام با ویژگی جدید رو به خطر است

    به گزارش اسپوتنیک، اینستاگرام در حال توسعه یک ویژگی برای حفظ آسان تر پروفایل ها برای صاحبان چندین حساب کاربری است.

عصــر بــازی