Prashanth Chandrasekar ซีอีโอ Stack Overflow กล่าวว่าบริษัทเตรียมคิดเงินบริษัทผู้พัฒนา AI ขนาดใหญ่ ภายในช่วงกลางปีนี้ หากต้องการเข้าถึงข้อมูลคำถาม-คำตอบในแพลตฟอร์ม ที่มีมากกว่า 50 ล้านคำถาม
ทั้งนี้ Stack Overflow มีผู้ใช้งานลงทะเบียนปัจจุบันมากกว่า 20 ล้านบัญชี
แนวทางของ Stack Overflow นี้ ออกมาเหมือนกับ Reddit ที่ ประกาศก่อนหน้านี้ ว่าหากผู้พัฒนา AI ต้องการข้อมูลจำนวนมากไปเทรนโมเดล จะต้องจ่ายเงินให้แพลตฟอร์มด้วย ซึ่ง Chandrasekar ก็บอกเพิ่มเติมว่าเนื้อหาในชุมชนออนไลน์ สามารถสร้างคุณค่าให้กับ AI แบบ LLM บริษัทก็ควรได้ผลตอบแทนเพื่อมาลงทุนเพิ่มเติมเช่นกัน
ที่มา: Wired
Comments
เร่ิมมีการเก็บเงิน และ ห้ามเอาข้อมูลไปใช้ฟรีๆแล้ว
เทรนก่อนได้เปรียบ
คิดว่าเดี๋ยวบริษัท AI จะตามไปด้วย Lawsuit มากมาย (ซึ่งมีแนวโน้มว่า Judge/Jury จะมองไปในทางที่ผิดกฎหมายและต้องจ่ายด้วยแน่ๆ)
เพราะทันทีที่เก็บเงินและเป็นเชิงธุรกิจ (คิดเงิน) ข้อมูล Public/Open ที่ไม่คงความ Open แล้วก็ตกไป
ข้อมูลที่ถูกเอาไปเทรนก่อนหน้านั้นมีเยอะแยะที่ติด License, Term of usage, ไหนจะพวก GPL / Open Data / Policy / Agreement ในการนำไปใช้ทำ "เงิน"
AI ที่ถูกเทรนไปแล้ว มันตอบคำถามเองว่า ไม่สามารถ "Selective Unlearn" ข้อมูลบางอย่างได้ แล้วการพิสูจน์ว่า "ไม่ได้เอาข้อมูลที่ติดพวกนี้ไปใช้" มันยากเกินไป
ถึงจะไม่เห็นด้วยกับอีลอน แต่เริ่มแรกของโครงการนั้น มันคือ Open และใช้ Data ของมนุษย์ เพื่อมนุษยชาติ ดังนั้นหลายเจ้ายอมหลับหูหลับตาให้ Scrape ข้อมูลไปใช้ได้ แต่พอการเทรนการทำอะไรสักอย่างมันเริ่มถูกเอามาใช้เป็นพานิชย์ เจ้าที่อยู่รอดจะต้องเป็นเจ้าที่เทรนมาอย่างถูกต้องมากๆ อาจจะเหลือแค่แนวแบบ Adobe เอย หรืออะไรเอย ที่มี่ส่วนแบ่งในข้อมูลที่รอดได้
แต่ก่อนจะไปถึงจุดนั้นคงต้องใช้เวลา
+1 ยิ่งความกลัวของคนที่ตามมาด้วยแล้ว กฎหมายในบางรัฐก็เอื้ออำนวยอยู่แล้วด้วย