
گوگل مدل Gemini 2.5 Computer Use را با قابلیت کنترل مرورگر معرفی کرد
[ad_1]
گوگل از یک مدل تخصصی و جدید به نام Gemini 2.5 Computer Use رونمایی کرد. این هوش مصنوعی میتواند مانند انسان واقعی، با کلیک، اسکرول و تایپکردن با وبسایتها و رابطهای کاربری گرافیکی تعامل داشته باشد و کارهای پیچیدهای را بهصورت خودکار انجام دهد.
برخلاف مدلهای سنتی که به API برای تعامل با نرمافزارها نیاز دارند، Gemini 2.5 Computer Use مستقیماً رابط کاربری گرافیکی (GUI) را درک میکند: هوش مصنوعی یک اسکرینشات از صفحه مرورگر به همراه درخواست کاربر دریافت میکند. سپس با استفاده از قابلیتهای پیشرفته درک بصری خود، صفحه را تحلیل و بهترین اقدام بعدی (مانند کلیک روی یک دکمه یا تایپ در یک فیلد) را تعیین میکند. در گام بعدی نیز یک اسکرینشات جدید گرفته میشود و این حلقه تا زمان تکمیل کامل وظیفه ادامه مییابد. این مدل درحالحاضر از ۱۳ اقدام اصلی مانند بازکردن مرورگر، تایپکردن، کلیک، اسکرول و Drag and drop پشتیبانی میکند.
مدل Gemini 2.5 Computer Use گوگل
مدل Gemini 2.5 Computer Use برای خودکارسازی کارهای پیچیدهای که در مرورگر انجام میشوند، ایدهآل است. گوگل برای نمایش قدرت این هوش مصنوعی، دو دمو نشان داده است: در یک دمو هوش مصنوعی وظیفه پیداکردن اطلاعات حیوانات خانگی از یک وبسایت و واردکردن آنها در یک سیستم مدیریت مشتری (CRM) در یک وبسایت دیگر را برعهده میگیرد و حتی یک قرار ملاقات نیز برای آنها تنظیم میکند. در دموی دیگر، این مدل یک تخته یادداشت دیجیتال بههمریخته را با کشیدن و رهاکردن یادداشتها در دستهبندیهای صحیح مرتب میکند.
نکته جالب اینکه این همان فناوری پشت پرده در پروژه تحقیقاتی Project Mariner گوگل و قابلیتهای ایجنتمحور AI Mode جستجو است.
رونمایی از این مدل، تنها یک روز پس از رویداد بزرگ OpenAI و معرفی قابلیت اجرای «اپلیکیشنها در ChatGPT»، نشاندهنده شدت رقابت در این حوزه است. Gemini 2.5 Computer Use پاسخ مستقیم گوگل به قابلیتهای مشابه از OpenAI (ChatGPT Agent) و Anthropic (Claude’s Computer Use) است.
براساس بنچمارکهای منتشرشده توسط گوگل، این مدل در وظایف کنترل وب و موبایل، عملکرد بهتری نسبت به رقبای پیشرو از خود نشان داده است. بااینحال، یک تفاوت مهم وجود دارد: مدل گوگل درحالحاضر فقط برای مرورگرها بهینهسازی شده است و برخلاف رقبای خود، هنوز قابلیت کنترل کامل سیستمعامل دسکتاپ را ندارد.
Gemini 2.5 Computer Use از امروز به صورت پیشنمایش برای توسعهدهندگان از طریق Gemini API در پلتفرمهای Google AI Studio و Vertex AI در دسترس قرار گرفته است.
[ad_2]
جدید ترین اخبار
اخبار خودرو
مطالب ترند هفته
لینک های مهم
مدیریت | کسب و کار | فرصت های شغلی

در دنیای متحول امروز، فضای کاری دیگر تنها محیطی برای انجام وظایف روزمره نیست. دفتر کار مدرن به بستری برای نوآوری، تعامل انسانی، تقویت فرهنگ سازمانی و توسعه پایدار تبدیل شده است. با رشد اقتصاد دیجیتال، تمرکز بر بهرهوری نیروی انسانی و شکلگیری مدلهای کاری منعطف (مانند دورکاری یا هابهای

[ad_1] ادغام سازمانی یکی از مؤثرترین راههای افزایش سود و بهرهوری شرکت است. ادغام قراردادهای کاری در ابعاد بزرگ و با سود دوجانبه است. اگر در حال تحقیق دربارهی رشد کسبوکار هستید یا بهزودی ادغام را تجربه میکنید، ممکن است به یادگیری دربارهی مؤلفههای ادغام موفق علاقهمند باشید. در این

[ad_1] مدیریت مالی یکی از مهمترین جنبههای زندگی فردی و سازمانی است که تأثیر مستقیمی بر کیفیت زندگی، موفقیت شغلی و آرامش روانی دارد. بسیاری از افراد با وجود داشتن درآمد مناسب، به دلیل اشتباهاتی در نحوه مدیریت مالی خود، با مشکلات مالی مواجه میشوند. این نوشته به بررسی اشتباهات

[ad_1] با پیشرفت تکنولوژی و تغییر سریع جهان، منطقی است که مهارتهای ضروری برای مشاغل آینده نیز تغییر کنند. در حقیقت با رشد دنیای دیجیتال، مهارت های نرم (Soft Skills) کارکنان، مانند برقراری ارتباط، حل مسئله، همکاری و همدلی، بهاندازه مهارت استفاده از تکنولوژیهای جدید و حتی بیشتر از آن




