OpenAI เริ่มดูดเว็บไปฝึก AI เอง ประกาศ User-Agent และ IP ให้จำกัดการดูดเว็บได้

By: lew

on 7 August 2023 - 23:26 Tags:

Topics:

OpenAI

ChatGPT

OpenAI เริ่มทำ web crawler สำหรับดูดเว็บของตัวเอง แม้ในเว็บจะไม่ได้ระบุว่าจะดูดเว็บไปทำอะไรแต่ก็ระบุว่าข้อมูลที่ดูดไปอาจจะใช้สำหรับโมเดลปัญญาประดิษฐ์ในอนาคต

ตัว crawler จะใช้ User-Agent ว่า GPTBot สามารถกำหนดห้ามเข้าส่วนต่างๆ ของเว็บได้ทางไฟล์ robots.txt และทาง OpenAI ยังประกาศ หมายเลขไอพีขาออก เพื่อให้เว็บไซต์บล็อคหรือตรวจสอบได้ว่าเป็น crawler ของ OpenAI จริง

ที่ผ่านมา OpenAI ไม่ได้เปิดเผยว่าตัว GPT ตัวหลังๆ ฝึกจากชุดข้อมูลใดบ้าง และแม้ว่าจะมีระบบปลั๊กอินให้ดูดเว็บได้ แต่ก็เป็นการอ่านเนื้อหาในเว็บเข้าไปให้ ChatGPT สรุปมาอีกทีเท่านั้น ไม่ใช่การฝึกโมเดลโดยตรง

ที่มา - OpenAI

Hiring! บริษัทที่น่าสนใจ

Connext AI

Empowering businesses with AI-driven solutions for efficiency, innovation, and sustainable growth.

Wisesight (Thailand) Co., Ltd.

The Best Choice For Handling Social Media · High Expertise in Social Data · Most Advanced and Secure

LTMH TECH

LTMH TECH มุ่งเน้นการพัฒนาผลิตภัณฑ์ที่สามารถช่วยพันธมิตรของเราให้บรรลุเป้าหมาย

Comments

By: rattananen

on 8 August 2023 - 11:03 #1291237

ดูดเว็บไปฝึก นี้น่าจะไม่ work สำหรับ AI นะครับผมว่า
ข้อมูลในเว็บมันมีที่ผิดๆ ค่อนข้างเยอะ
จาก AI ที่ให้คำตอบผิดบ่อยอยู่แล้ว จะกลายเป็นผิดมากกว่าเดิม

AI ของ bing ก็คือกัน ผมถามอะไร มันก็เอา link เว็บอื่นมาให้ใช้ search engine ธรรมดา จะประหยัดไฟรักโลกมากกว่าไหม

By: Fzo

on 8 August 2023 - 12:06 #1291243 Reply to:1291237

+1
ตอบมาให้แค่ 2-3 บรรทัด แล้วแปะลิงค์มาให้ ...
ไม่ได้ช่วยอะไรเลย

WE ARE THE 99%

By: Jirawat

on 8 August 2023 - 12:22 #1291248 Reply to:1291237

แต่ยิ่งข้อมูลเยอะขึ้น มันจะฉลาดกว่าเดิมแน่ๆ ส่วน ผลลัพผิดหรือถูกขนาดไหน มนุษต้องลองใช้เอง ส่วนการเอา ดาต้าไปใช้จะผิดกฎหมายอะไรรึป่าว ตามที่อีลอนมัส บอก ยิ่งกฏหมาย ai ยังไม่มีด้วย แต่ก็เป็นธรรมชาติ คือปัญหา มันจะมาก่อนกฏหมายเสมอ