OpenAI تطلق OpenAI Operator، وهو مشغل ذكاء اصطناعي يتصفح الويب مثل البشر

تقدم OpenAI مرحلة جديدة في تطور الذكاء الاصطناعي (AI) مع إطلاق OpenAI، أول وكيل ذكاء اصطناعي مستقل (AI). تَعِد هذه التقنية الجديدة، التي أُعلِن عنها في 23 يناير 2025، بإحداث ثورة في طريقة تفاعلنا مع الويب من خلال أتمتة المهام المعقدة بفضل نموذج جديد يُسمى وكيل المستخدم الحاسوبي (CUA). سيصبح CUA أشبه ما يكون بمساعد شخصي إضافي، ونهج OpenAI في هذا الصدد.


  • العميل IA الذي يرى ويتصرف كإنسان واحد

يعتمد رأس المشغّل على نموذج CUA، الذي يجمع بين قدرات الرؤية في GPT-4o مع نظام متقدم للتدريب المعزز. تسمح هذه التقنية للمشغّل "برؤية" الشاشة من خلال لقطات الشاشة والتفاعل مع واجهات الويب تماماً كما يفعل المستخدم البشري: من خلال النقر على النص والتنقل بطريقة مستقلة.

كان أداء المشغّل مثيرًا للإعجاب، حيث بلغ معدل نجاحه 87% على معيار WebVoyager لقوائم التشغيل على الويب. يتفوق النظام بشكل خاص في الإجراءات التفاعلية مثل إنشاء قوائم الدورات التدريبية أو إدارة قوائم التشغيل. كما أقام OpenAI شراكات استراتيجية مع شركات رائدة مثل Booking و Ebay لتحسين تجربة المستخدم على منصاتها. ليس هذا هو الوكيل الأول في مجال الذكاء الاصطناعي - فقد استثمرت جوجل وأنثروبيك في هذه التكنولوجيا قبل ذلك - ولكنهما يعملان بشكل فعال ومكمل.

من الواضح أن نظام الذكاء الاصطناعي المفتوح يمكن أن يكون قادراً على خدمة الفنادق أو قيادة المطاعم بتعليمات دقيقة دون أي تدخل من المستخدم. ومن شأن هذا النظام أن يمنحنا فرصة الحصول على مساعدة حقيقية من قبل مساعد ذكاء اصطناعي يعرف ويتحرك بطريقة دقيقة للغاية ومحددة السياق. هذا ما تفعله شركة Apple على سبيل المثال، والتي تريد تكييف نظامها مع حياتك الرقمية على هاتف iPhone لتحسين تنفيذ المهام باستخدام Siri.

  • الامان والقيود

في هذا الإصدار الأول، اختارت OpenAI نهجاً حكيماً في الأمان. يعمل الوكيل في بيئة افتراضية خاضعة للرقابة ويتطلب نظامًا للتحقق من صحة الإجراءات الحساسة مثل المدفوعات أو إرسال رسائل البريد الإلكتروني. كما تم تضمين تدابير مكافحة القرصنة ومكافحة حقن المطالبات. ومع ذلك، فإن النظام لديه بعض القيود. فهو لا يعمل بشكل جيد مع الواجهات المعقدة مثل الجداول والتقاويم، ولا يحقق معدل إكمال بنسبة 40% فقط عند تحرير النصوص المعقدة

في الوقت الحالي، يمكن الوصول إلى المشغّل من خلال متصفح ChatGPT Pro في الولايات المتحدة ، عبر operator chatgpt

تعتزم OpenAI تطوير الوصول التدريجي إلى مستويات الاشتراك الأخرى تدريجياً ودمج هذه الوظائف مباشرة في ChatGPT.

إرسال تعليق