گوگل از مدل Gemini 2.5 Computer Use برای کنترل مرورگر رونمایی کرد

به گزارش تور ایتالیا ارزان، در بحبوحه رقابت تنگاتنگ در دنیای هوش مصنوعی، گوگل تنها یک روز پس از رویداد بزرگ OpenAI، با معرفی مدل Gemini 2.5 Computer Use، پاسخی قدرتمند به رقبای خود داد. این مدل تخصصی به گونه ای طراحی شده که بتواند مانند یک کاربر انسانی با وب سایت ها و نرم افزارها تعامل کند و وظایف پیچیده را به وسیله اقداماتی مانند کلیک، تایپ و اسکرول به صورت اتوماتیک به انجام برساند.

گوگل از مدل Gemini 2.5 Computer Use برای کنترل مرورگر رونمایی کرد

ویژگی منحصربه فرد این مدل، توانایی آن در درک مستقیم رابط کاربری گرافیکی (GUI) بدون احتیاج به API است. این هوش مصنوعی با تحلیل بصری اسکرین شات ها، المان های قابل تعامل مانند دکمه ها و فیلدها را شناسایی نموده و برترین اقدام بعدی را برای رسیدن به هدف مشخص می نماید. این فرآیند به صورت یک حلقه تکرارشونده ادامه می یابد تا زمانی که وظیفه محول شده به طور کامل انجام گردد. این مدل در حال حاضر از 13 عمل اصلی از جمله باز کردن مرورگر، کلیک، تایپ و حتی کشیدن و رها کردن پشتیبانی می نماید.

این فناوری که پیش از این در پروژه تحقیقاتی Project Mariner گوگل به کار گرفته شده بود، پتانسیل بالایی در اتوماتیکسازی فرآیندهای کاری تکراری دارد. گوگل در دموهای خود نشان داد که چگونه این مدل می تواند اطلاعات را بین دو وب سایت مختلف جابه جا نموده و حتی یک قرار دیدار در سیستم CRM تنظیم کند یا یک تخته یادداشت دیجیتال را مرتب سازی کند. این قابلیت ها، Gemini 2.5 Computer Use را به ابزاری ایده آل برای کسب وکارها و کاربران حرفه ای تبدیل می نماید.

معرفی این مدل، پاسخ مستقیم گوگل به قابلیت های ایجنت محور رقبایی چون OpenAI (ChatGPT Agent) و Anthropic (Claudes Computer Use) است. بنچمارک های منتشرشده به وسیله گوگل نشان می دهد که این مدل در کنترل وب و موبایل عملکرد بهتری نسبت به رقبا دارد، اما یک محدودیت مهم نیز وجود دارد: در حال حاضر، عملکرد آن به محیط مرورگر محدود شده و برخلاف بعضی رقبا، توانایی کنترل کامل سیستم عامل دسکتاپ را ندارد. Gemini 2.5 Computer Use از امروز به وسیله Gemini API در پلتفرم های Google AI Studio و Vertex AI به صورت پیش نمایش در اختیار توسعه دهندگان قرار گرفته است تا نسل جدیدی از اپلیکیشن های اتوماتیک را خلق نمایند.

منبع: Google

منبع: دیجیکالا مگ
انتشار: 16 مهر 1404 بروزرسانی: 16 مهر 1404 گردآورنده: italyro.ir شناسه مطلب: 2635

به "گوگل از مدل Gemini 2.5 Computer Use برای کنترل مرورگر رونمایی کرد" امتیاز دهید

امتیاز دهید:

دیدگاه های مرتبط با "گوگل از مدل Gemini 2.5 Computer Use برای کنترل مرورگر رونمایی کرد"

* نظرتان را در مورد این مقاله با ما درمیان بگذارید