OpenAI เปิดตัว Operatorผู้ช่วย AI Agent ที่สามารถทำงานต่าง ๆ ให้กับผู้ใช้งานได้ตามที่กำหนดผ่านเว็บเบราว์เซอร์
Operator ทำงานผ่านเบราว์เซอร์ของผู้ใช้งานเอง มีความสามารถทำความเข้าใจเนื้อหาที่แสดงบนเว็บไซต์ และดำเนินการโต้ตอบเช่น พิมพ์ คลิก เลื่อนหน้า ซึ่งเป็นวิธีการที่แตกต่างจากเครื่องมือประเภทบอต และยังสามารถกรอกแบบฟอร์ม ทำคำสั่งซื้อ และอื่น ๆ
Operator ทำงานบนโมเดลใหม่ของ OpenAI ชื่อ CUA ย่อมาจาก Computer-Using Agent โดยนำความสามารถด้าน Visual ของ GPT-4o รวมกับวิธีคิดเป็นเหตุผลผ่านระบบเรียนรู้ reinforcement ทำให้โต้ตอบกับสิ่งที่ปรากฎบนหน้าจอได้แบบเดียวกับคนเห็น แล้วโต้ตอบดำเนินการกับสิ่งเหล่านั้นได้
เมื่อสั่ง Operator ให้ดำเนินการบนเว็บไซต์ ผู้ใช้งานสามารถเข้ามาควบคุมแทนได้ตลอดตามที่เห็นหน้าเว็บไซต์ กรณีเว็บไซต์ให้ใส่ข้อมูลสำคัญ เช่น ล็อกอิน ข้อมูลการจ่ายเงิน หรือ CAPTCHAs Operator จะแจ้งให้ผู้ใช้งานเข้ามาควบคุมและเพิ่มข้อมูล นอกจากนี้ผู้ใช้งานยังคัสตอมโปรไฟล์สำหรับการใช้งานแต่ละเว็บไซต์ หากมีข้อมูลเบื้องต้นที่แตกต่างกัน
Operator เปิดให้ใช้งานตั้งแต่วันนี้สำหรับลูกค้า Pro ในสหรัฐอเมริกา สถานะยังเป็นพรีวิวงานวิจัย จึงอาจเกิดข้อผิดพลาดในการทำงานได้ และจำกัดการทำงานกับเว็บไซต์จำนวนหนึ่งก่อน แล้วจะขยายไปยังผู้ใช้งานกลุ่มอื่นในอนาคต
ที่มา: OpenAI
Comments
เอา operator มาใช้กับ chatgpt 😅
แบบนี้ถือว่าเป็นบอทจองบัตรคอนมั้ย
หลังจากนี้ได้เวลาทุกเว็บ แม้แต่เว็บง่าย ๆ ได้เวลาใส่ CAPTCHA ที่ยากยิ่งกว่า I am not a robot หรือเลือกรูปภาพและพร้อมเพิ่มเงื่อนไขแบนทันทีที่ใช้บอทหรือ CAPTCHA ไม่ผ่าน
บล็อก: wannaphong.com และ Python 3