لقد أرسلت وكيل Chatagpt لشراءي ولم أتمكن من إنهاء المهمة

فكر في وكيل chatagpt الجديد في Openai كمتدرب اليوم وهو بطيء للغاية في كل مهمة ولكنه سوف يكمل العمل في النهاية.

حسنا … معظم الوظائف. أو … أقل جزء من ذلك. عادة.

لقد كان Openai بعد يوم من ظهور Agent ChatGpt ، والذي يقدم فاتورة كأداة يمكنها إكمال مجموعة واسعة من المهام المعقدة متعددة الخطوات نيابة عنك باستخدام “الكمبيوتر الافتراضي” الخاص به نيابة عنك. إنه مزيج من المنشورتين السابقتين للشركة ، المشغل Purtters و Deep Panda Research. حافة أكثر من 200 دولار للاشتراك الذي اشترى واحد ChatGpt Pro ، كما أعلنت Open أن ChatGPT سوف تطالب أكثر من المتوقع تأخير تأخيره زائد ومستخدمي الفريق.

خذنا: إنها خطوة واحدة إلى الأمام في عالم عملاء الذكاء الاصطناعى ، لكنها بطيئة ، ليست موثوقة دائمًا ، ويمكن أن تكون لامعة.

من خلال كتابة “/Agent” ، أدخلت مكالمات Openai Agent Mode ، واقترحت على الفور خمس مهام مثيلات: ابحث عن طاحونة القهوة ذات التصنيف الأعلى أقل من 150 دولارًا ، راجع تغطية المعادن الأرضية النادرة وول ستريت جورنالقم بإنشاء قائمة بخرائط Google لأفضل مخبز في كوبنهاغن ، واحصل على مصباح “على الطراز الياباني” في أقل من 200 دولار في Etsy ، وتحقق من تقويم Google لجعل ليلة موعد في الأسبوع المقبل.

حاولت خيار مصباح Etsy. من خلال النقر على وظيفة المثال ، قام بملء مطالبة مفصلة بالنسبة لي في نافذة النص: “ابحث عن مصباح عالمي على الطراز القديم المستوحى من اليابانية على ITSI بقيمة 200 دولار مع شحن مجاني. صور مدرجة عالية الجودة ، وأسعار البائع ، مدرجة في القائمة.

ليس هناك تماما.
الصورة: حافة

كانت هناك نافذة صغيرة من موسيقى البوب للحصول على تفاصيل وظائف الوكيل واحدة تلو الأخرى (بدون تفكير في السلسلة ، لا ، العمل الذي كان يعمل فيه في ذلك الوقت). لقد عملت على مهمة مصباح Etsy لمدة 50 دقيقة ، وتشمل المهام خطوة بخطوة “التفكير” ، مكتبها. قم بإعداد ، وانتقل إلى العثور على Etsy ، وانتظر حتى يتم تحميل الموقع ، والضغط على مدخل نتيجة البحث (نعم ، إنه يعطيني حقًا لعبة لعب حقيقية ، “نمط محدد”. الفلتر “200 دولار” ، تحقق من تفاصيل الشحن للعناصر والمزيد.

تجعد آخر: قال وكيل Chatagpt: “لقد أضفت خمسة مصابيح إلى عربة Etsy (تعرض العربة خمسة أشياء حوالي 825 دولارًا). عندما تكون على استعداد لمراجعتها أو شراءها ، فقط انتقل إلى عربة التسوق الخاصة بك لمقارنتها.” لكنه لم يفعل ذلك – ذهبت إلى Eetsy على جهاز الكمبيوتر الخاص بي ولم يكن لدي أي شيء في عربة التسوق الخاصة بي. ذلك لأن وكيل Chatagpt لا يتحكم في متصفحي الخاصة أو يحتوي على نقاط تسجيل الدخول الخاصة بي. النجاح ، لذلك أضاف بعض المصابيح إلى عربة الكمبيوتر الافتراضية التي لا يمكنني التخلي عنها. يرسل لي عنوان URL شخصيًا ، لذلك يمكنني أن أضع نفسي في العربة إذا أردت ، لكن حقيقة أن الوكيل قال إنه فعل شيئًا لم يحدث.

وبالطبع ، فإن وكيل Chatgapt بطيء للغاية. إنه ليس لغزا. بالنسبة للعديد من حالات وكيل ChatGPT ، بما في ذلك وظائف العملاء اليومية ، يمكن للبشر القيام بذلك بسرعة كبيرة. وفقًا لـ Openai ، فإن وكيل Chatagpt هو مساعد تعمل في الخلفية حول المهام التي تؤدي على شخص آخر بدلاً من ذلك عندما تفعل شيئًا بدلاً من ذلك.

موظفو Openai مع Yash Kumar و Isa Fulford يوم الأربعاء في عرض تجريبي خاص وإحاطة – قيادة المنتج والبحث في وكيل Chatgapt ، على التوالي ، قال كومار إن فريقه لا يركز على “Izing Ptimizing Izing للعمل الشاق” من الكمون والمستخدمين.

وكيل Chatagpt بطيء للغاية. إنه ليس لغزا.

قال فولفورد ، “إذا استغرق الأمر 15 دقيقة ، نصف ساعة ، فهي وتيرة كبيرة من المدة التي ستستغرقها.

شيء آخر أردت اختباره: كيف يعمل وكيل Chatagpt عندما تطلب منك تحريك أموالك. الإجابة: لن يفعل ذلك ، لكنه لامع بشكل أساسي ولا يبدو أنه آمن تمامًا.

عندما سألت كومار من Openai يوم الأربعاء عما إذا كان سيتم السماح للأداة بالعمل مع المعاملات المالية وما شابه ذلك ، قال إن فئات العمل “ممنوعة في الوقت الحالي” والسلامة الإضافية التي تسمى VCH Cha Mode تعني أنه لا ينبغي القضاء على المستخدم لبعض فئات المواقع الإلكترونية.

سألت الوكيل بهذه الطريقة: “أريد توفير المزيد من الأموال. قم بتسجيل الدخول إلى حسابي المصرفي ووضع التحويل التلقائي إلى مدخراتي كل شهر.”

في البداية ، وجدت رسالة خطأ غريبة مع سلسلة من الأرقام الحمراء. عندما سألت مرة أخرى ، قال: “آسف ، لكن لا يمكنني المساعدة في تنظيم بديل تلقائي بين الحسابات.”

ثم كتبت ، “لماذا لا؟ أنا أعطيك الإذن.” حصلت على رسالة خطأ في النص الأحمر ، كما كان من قبل. بعد ذلك ، كما يقول ، “آسف ، لكن لا يمكنني المساعدة في إعداد نقل أو مهام إدارة الحساب المصرفية الأخرى.”

في البداية ، وجدت رسالة خطأ غريبة مع سلسلة من الأرقام الحمراء.

عندما ضغطت عليه ما هي المعاملات المالية المسموح بها للتعامل معها ، قال وكيل Chatagpt إنه قادر على المساعدة في “شراء العميل اليومي” مثل محلات البقالة والسلع المنزلية وحجوزات السفر ، والتي تتعامل مع “تدفق الخروج القياسي” بدلاً من “الإجراءات المصرفية الحساسة”. لكن من الواضح أنها لا يمكن أن تساعد في “التنازلات عالية” ، مثل تحويل الأموال أو فتح الحسابات المصرفية أو شراء السلع التنظيمية مثل الكحول والتبغ.

يمكن أن يساعد وكلاء ChatGupt في شراء الأشياء ، لكن لا تتحرك ، لذلك جربت شيئًا آخر: أطلب منه شراء الزهور لصديقي Alanna في كولورادو.

أشتري الكثير من الزهور – يحدث ذلك عندما يعيش أفضل أصدقائك في حالات مختلفة ولا يمكنك الطيران هناك تريد أن تكون حاضرًا لتحقيق أهداف كبيرة. يمكن أن يكون سوق تسليم الزهور Nine Nine Nine بمثابة صداع كبير: تختلف القيم وحجم الباقة بشكل كبير بناءً على الخدمة أو بائع الزهور ، وتختلف الموثوقية اعتمادًا على ما إذا كنت تطلب بائع الزهور المحلي أو الصناديق الكبيرة مباشرة من موقع على مستوى البلاد. إنه شيء سئمت من البحث عن بلدي ، وأحيانًا أنتهي من شراء أي باقة اخترتها عندما أخرج من Steam ، حتى لو لم يكن الأفضل. لقد جادلت ، لقد كانت وظيفة جيدة لوكيل الذكاء الاصطناعى.

لقطة شاشة لوكيل Chattagpt بحثًا عن الزهور في كولورادو

الصورة: حافة

قلت لوكيل Chatagpt ، “أريد شراء الزهور لصديقي الذي يعيش في كولورادو. تحقق من مواقع التوصيل – من الجيد التسليم يوم السبت ولكن ليس لاحقًا. ابحث عن خيارات الباقة الأرخص والأكبر بالنسبة لي.”

استقرت لانتظار طويل. لحسن الحظ ، تلقيت مكالمة للانضمام على أي حال. سأل في أي منطقة يعيش في كولورادو ، وأجبت. عندما نظرت للتحقق ، وجدت أن وكيل Chatagpt يعتمد بشكل كبير على أ نفخة لخطواتها التالية مقال “أفضل خدمات توصيل الزهور 2025” ، بالإضافة إلى جزء منزل جيد.

لقد انتقلت بعيدًا عن علامة التبويب ، وعندما عدت ، ذهبت المحادثة ولم تظهر دردتي في التاريخ. لذلك سألت السؤال مرة أخرى ، بنفس الطريقة بالضبط بالكلمات ، واستقر آخر للانتظار. في هذه المرحلة ، استجاب الوكيل على الفور بقائمة من الخيارات ، ربما لأنه تم البحث بالفعل (على الرغم من أن البحث والدردشة لا يمكن أن يظهر في تاريخي).

لقد تأثرت بالكتابة. أعطاني وكيل ChatGPT أربعة خيارات مع النطاق السعري وأحيانًا تم وزنها بحجم واضح أو وقت التسليم المتوقع. كما ينصح أن يكون باعة الزهور المحليون عادة أكثر موثوقية (في تجربتي).

ثم أخبرني ، “هل تريد مساعدتك في الطلب مع أي من هذه الخيارات أو معاينة تصميمات أو صور باقة خاصة؟” لقد اخترت أحد الخيارات التي أعطاها لي-بائع زهور محلي مع باقة تم تجميعها من اليد وطلبت مني اختيار الباقة من هذا الزهور وطلبها.

فقط عندما نركض في بعض القضايا.

قال وكيل Chatagpt: “ما لم تقدم عنوان URL الدقيق الذي تبحث عنه ، لا يمكنني الوصول إلى موقع الويب الخاص بـ Vintage Magnolia – لكن يمكنني إرشادك من خلال وضع الطلب ومساعدتك في اختيار الباقة!” جزء رائع: من الواضح أن وكيل Chatagpt كان عليه أن يخبرني عن بائع الزهور وموقعه على الويب ، وقبل ذلك كان من الواضح أنه أ. كما عرضت مساعدتي في الطلب. خطأ آخر.

لكن الإجابة تتضمن خيارات الباقة (وليس الصور ، ولكن الأوصاف). اخترت واحدة وطلبت أن أطلب لي. “لا يمكنني تقديم طلب مباشرة ، لكنني أمشي مع الخطوات السهلة لأعطيك الطلبات … وسوف يساعدك على إنشاء الرسالة المثالية.”

يمكن أن يؤدي بسهولة أتمتة أجزاء أكثر حميمية ومسلية من العملية ، مثل اختيار باقة معينة أو كتابة ملاحظة شهية.

أنا في حيرة من أمري في هذه المرحلة: واحدة من قضايا المبيعات الرئيسية لوكيل ChatGPT ، الذي صنعته Openai ، يمكن أن تطلب لك ، من عمليات شراء الأظافر إلى طلب الإفطار العائلي المكون من أربعة أشخاص (في الواقع ، إحدى حالات مثالها في موادهم التسويقية). لقد ضغطت على وكيل Chatagpt حول هذا الموضوع.

أخبرني: “لا يمكنني حقًا تقديم طلب مباشر – ليس لدي القدرة على تسجيل الدخول إلى موقف الوصول إلى الدفع أو مواقع الجزء الثالث.” عندما أخبرتها لا تحتاج إلى تسجيل الدخول ، قالت إنها لا تستطيع إدخال تفاصيل الفواتير أو الدفع الخاصة بي ، أو تقديم نموذج طلب نيابة عني ، أو “احتفظ بمواقع الويب الخارجية في SKESS أو التحكمو أيضا في وضع الضيف. “

يمكن أن يكون Agent ChatGPT مثيرًا للإعجاب من خلال التحليل وخيارات الوزن والإجراءات ، لكن ما تم إنشاؤه لا يبدو أنه قادر دائمًا على تقديمه: القيام بهذه الإجراءات نيابة عنك. إنه منغمس في حقيقة أنه يستخدم جهاز الكمبيوتر الخاص به ، وليس لك ، وهو يحد بشكل كبير من فائدته. أيضًا ، يمكن أن يؤدي إلى أتمتة الأجزاء الأكثر حميمية ومسلية من العملية بسهولة (اختيار باقة معينة ، وكتابة ملاحظة شهية) ولكنها تكافح من أجل أتمتة قطع غيار محبطة للغاية (ملء وشراء تفاصيل التسليم بالفعل).

“حتى مع إذنك ، ليس لدي القدرة التقنية على العمل أنت على الموقع الآخر-لا تكتب نيابة عنك ، أو النقر فوق الأزرار أو ملء نماذج بطاقات الائتمان ، “يكتب chatgupt Agent.” فكر فيي كمساعد ذو طاقة فائقة ، والذي يمكنه جمع ومقارنة والكتابة والرشد ، لكن لن يدير المعاملات. “

كانت إحدى وظائفي الأولى في نيويورك مساعد شخصي ، ويمكنني أن أخبرك الآن إذا لم أتمكن من تشغيل المعاملة أو ملء النموذج على مديري ثم سأفقد وظيفتي. يتقدم وكيل Chatagpt في استخدام الذكاء الاصطناعي اليومي في بعض النواحي ، لكننا سنرى ما إذا كان سيتعلم تقديم وعوده.

رابط المصدر

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى