جمنای لایو با استفاده از دوربین و بررسی محیط اطراف، به سوالات پاسخ خواهد داد.
گوگل قصد دارد چتبات جمنای را تاحدی توسعه دهد که بتواند دنیای انسانها را بهتر درک کند و با آنها راحتتر ارتباط بگیرد. گوگل در مراسم بزرگ I/O 2024 پیشنمایش نسخهی جذاب جمنای موسوم به جمنای لایو را ارائه کرد که به کاربران امکان میدهد ازطریق گوشیهای هوشمند خود مکالمهی صوتی کامل و جامعی با جمنای داشته باشند.
کاربران میتوانند زمانی که چتبات جمنای درحال پرسیدن سوالهایی برای شفافسازی بیشتر است، مکالمهی صوتی را قطع کنند؛ بنابراین جمنای از این طریق با الگوی گفتاری کاربر سازگار خواهد شد. هوش مصنوعی گوگل میتواند محیط اطراف کاربران را از طریق عکسها یا ویدئوهایی که توسط دوربین گوشی گرفته شده است، بررسی کند و به سوالات کاربر پاسخ دهد.
جمنای لایو میتواند به سوالاتی دربارهی چیزهایی که در دید دوربین گوشی قرار دارند یا اخیراً قرار داشتهاند، پاسخ دهد. بهعنوان مثال به سوالاتی مانند اینکه کاربر الان در کدام محله است یا قطعهی شکستهشدهی دوچرخه چه نام دارد، پاسخ خواهد داد.
جمنای لایو میتواند توضیح دهد که یک کد کامپیوتری چه کاربردی دارد یا مثلا بگوید که عینک کاربر ممکن است در کجا قرار داشته باشد و اینکه به کاربر اعلام خواهد کرد که آخرینبار عینک را کجا دیده است.
سیسی هسیائو، مدیر جمنای در گوگل، میگوید: «با جمنای لایو، امکان درک بهتر کاربر به جمنای افزوده خواهد شد. جمنای لایو امکان تجربهی مکالمهی واقعی و زنده با هوش مصنوعی را فراهم میکند.»
جمنای لایو را میتوان بهعنوان نسخهی تکاملیافتهی گوگل لنز، پلتفرم قدیمی بصری گوگل برای تجزیه و تحلیل تصاویر و ویدئوها و همچنین Google Assistant، دستیار مبتنیبر هوش مصنوعی گوگل، درنظر گرفت.
نسخهی لایو جمنای میتواند بهعنوان یک مربی مجازی عمل کند و کاربران را برای رویدادهای مختلف و بارش ذهنی ایدههای جدید تمرین دهد؛ بهعنوان مثال به کاربران یاد میدهد برای اینکه یک فرصت شغلی را از آنِ خود کنند، نیاز به چه مهارتهایی دارند. جمنای لایو میتوانند در انجام سخنرانیها توصیههایی را ارائه دهد.
جمنای لایو، برای حل مشکلات پیچیدهی کاربران ازطریق مکالمهی صوتی زنده، پاسخهایی را در اختیار آنها قرار خواهد داد. این نسخه از جمنای با برخورداری از معماری مدل زیربنایی Gemini 1.5 Pro که پرچمدار هوش مصنوعی مولد جمنای بهحساب میآید، از قابلیت بهخاطرسپاری بالایی برخوردار است.
نسخهی لایو جمنای دارای Context Window جدیدی با دو میلیون توکن است و این یعنی میتواند حجم عظیمی از دادهها را دریافت و درک کند. این هوش مصنوعی میتواند باکمک Context Window، یک ویدئوی یکساعته را تجزیه و تحلیل کند.
شاید جمنای لایو در نگاه اول تفاوت چندانی با جمنای نداشته باشد؛ اما گوگل ادعا میکند که در جمنای لایو از تکنیکهای جدیدتر با درصد خطای کمتر در زمینهی هوش مصنوعی برای تجزیه و تحلیل دقیقتر تصاویر استفاده شده است.
گوگل تکنیکهای جدیدی در زمینهی هوش مصنوعی را در جمنای لایو ارائه کرده است تا بهکمک آنها موتور گفتاری پیشرفتهتری را برای گفتگوی زندهی منسجمتر، واقعیتر و با درک بهتر از احساسات کاربر ایجاد کند.
جمنای لایو بهصورت رایگان دردسترس کاربران قرار نخواهد گرفت و بعد از انتشار در انحصار سرویس Gemini Advanced خواهد بود که برای استفاده از آن باید اشتراک Google One AI Premium را با قیمت ۲۰ دلار در ماه تهیه کرد.
به قلم : سرکار خانم دیبا غفاری جهانی
منبع : زومیت