خالق ChatGPT با رونمایی Sora نشان داد که حتی در حوزهی سرویسهای تبدیل متن به ویدیو هم حرفهای زیادی برای گفتن دارد.
OpenAI در بیانیهای غیرمنتظره از مدل هوش مصنوعی جدیدی به نام Sora رونمایی کرد که میتواند متن را به ویدیو تبدیل کند. بر اساس گفتهی شرکت خالق ChatGPT، هوش مصنوعی Sora میتواند «صحنههایی واقعگرایانه و مبتکرانه» بسازد.
سرویس Sora به کاربران امکان میدهد با بهرهگیری از دستور متنی، ویدیوهای حداکثر یک دقیقهای تولید کنند. Sora توانایی ساخت «صحنههایی پیچیده با چندین کاراکتر، انواع خاص حرکات و جزئیات دقیق سوژه و پسزمینه» را دارد.
OpenAI میگوید مدل هوش مصنوعی جدیدش میتواند بفهمد که اشیاء مدنظر کاربر در دنیای واقعی چگونه به نظر میرسند. Sora همچنین دستورهای متنی را به دقت تفسیر میکند و کاراکترهای دقیقی میسازد که احساساتشان پرجنبوجوش به نظر میرسد.
مدل هوش مصنوعی جدید OpenAI افزونبر تبدیل متن به ویدیو میتواند ویدیو را از روی عکس تولید کند و همچنین توانایی پرکردن فریمهای خالی ویدیوها و حتی افزایش زمان آنها را دارد.
دموهایی که از Sora نمایش داده شدهاند، شامل مواردی مثل نمایی قدیمی از کالیفرنیا و ویدیویی در داخل توکیو میشوند. در اکثر این نمونهها، میتوان با کمی دقت فهمید که ویدیو توسط هوش مصنوعی ساخته شده است. OpenAI میگوید که Sora ممکن است در نمایش دقیق فیزیکهای محیطی پیچیده به مشکل بخورد؛ اما بهطور کلی نتایج حاصل از این هوش مصنوعی بسیار چشمگیرند.
تا همین چند سال پیش، سرویسهای تبدیل متن به عکس نظیر میدجرنی سروصدای زیادی به پا کردند و حالا نوبت سرویسهای تبدیل متن به ویدیو است که خودنمایی کنند. شرکتهایی مثل راناوی و پیکا مدلهای هوش مصنوعی جذابی برای ساخت ویدیو از روی متن معرفی کردهاند و حتی گوگل هم سرویسی مشابه دارد.
سرویس Sora فعلا بهصورت محدود در دسترس کاربران خاص قرار دارد تا ارزیابیهای نهایی دربارهی آن انجام بگیرند. OpenAI همچنین دسترسی به Sora را برای برخی از هنرمندان و طراحان و فیلمسازان ممکن کرده است تا بازخورد آنها را دریافت کند.
به قلم : جناب آقای مبین احمدی
منبع : زومیت