กูเกิลจริงจังกับงานด้าน deep learning ถึงขนาดออกแบบชิปประมวลผลเองในชื่อ TPU (Tensor Processing Unit) โดยในงาน Google I/O 2017 กูเกิลก็เปิดตัว TPU รุ่นที่สอง ที่มีความสามารถมากขึ้น
เป้าหมายของกูเกิลคือนำ TPU ขึ้นไปอยู่บนคลาวด์ เพื่อให้นักวิจัยหรือคนที่ต้องการเทรน AI ให้เร็วกว่าทำเอง เข้ามาเช่าใช้งาน แต่ในช่วงแรกเพื่อเปิดโอกาสให้คนลองใช้กันมากๆ กูเกิลเลยสร้างคลาวด์พิเศษ TensorFlow Research Cloud (TFRC) ให้กลุ่มนักวิจัยใช้งานกันฟรีๆ
TensorFlow Research Cloud เป็นคลัสเตอร์ที่มี TPU มากถึง 1,000 ตัว แต่ละตัวมีสมรรถนะสูงถึง 180 teraflops และมีหน่วยความจำให้เรียกใช้ 64GB นอกจากนี้ ระบบทั้งหมดยังออกแบบมาสำหรับการรัน TensorFlow อย่างมีประสิทธิภาพ
ผู้ที่มีสิทธิรันงานบน TensorFlow Research Cloud ไม่จำเป็นต้องมาจากภาคการศึกษา จะเป็นนักวิจัยอิสระหรือผู้สนใจทั่วไปก็ได้ เพียงแต่ต้องยื่นใบสมัครไปให้กูเกิลพิจารณาคัดเลือกก่อน
ที่มา - Google Research Blog
Comments
มันจะฟรีได้ยังไงในเมื่อคนใช้ จ่ายด้วยการ "มอบข้อมูล" (คุณภาพข้อมูล - ซึ่งเป็นสิ่งมีค่าที่สุดในการทำ DL)จำนวนมหาศาลให้กับกูกเกิล. ไม่พอ ยังจะมอบ pattern ของ NNetwork . (หยาดเหงื่อที่ทำ research ทั้งหมดทั้งมวล)
ให้กูกเกิลเอาไปทำโคตรพ่อ NN (ปัญญาประดิษฐ์ ที่ออกแบบปัญญาประดิษฐ์ได้เอง)
เอาไปโคกับควอนตัมคอม 50คิวบิก ซ้ำ - เหมือนเอาเลขยกกำลังไปซ้อนเลขยกกำลัง
วิเคราะห์หาเทคโนโลยีใหม่อาจได้เท่ากับรีเสิจเป็นพันๆปี . โดยใช้นักวิทยาศาสตร์เทียม .
ฟรี คือล่อลวงให้ เสียทรัพย์ซึ่งเราไม่รู้ว่าเป็นทรัพย์
ครับมันไม่ฟรี แต่ก็ไม่ได้เสียเงินในการลงทุนฮาร์ดแวร์นะครับ
ครับ
เข้าใจว่าผู้วิจัยภาคการศึกษาก็ทำวิจัยแล้วก็มีวิทยานิพนธ์ ซึ่งน่าจะมีงานวิจัยบางชนิดที่ยอมให้ทำครับ ส่วนพวกวิจัยเพื่อขายเนี่ยเขามีของเขาอยู่แล้วไม่น่าจะมาใช้ของฟรี(เทียม)แบบนี้
ยังไงก็ต้องตีพิมพ์อยู่แล้วนี่ครับ....? ภาคเอกชนคงไม่มีใครมาใช้หรอกครับ ถึงจะฟรีทุกอย่างจัดเต็มก็ตาม เขาหวงข้อมูลกันทั้งนั้น
ถ้าคิดว่าข้อมูลสำคัญกว่างบประมาณก็ลงทุนเองเถอะครับ
ถ้าคิดว่ามันไม่ฟรีจริง ก็อย่าใช้ครับ
:V ไม่ใช้แน่นอน . ใครจะไปส่ง NN pattern ให้ทางโน้นฟรีๆกันไม่งั้นตอนทำผลิตภัณฑ์ขายจะได้เจอนรกของ legit copy
เจอผลิตภัณฑ์คล้ายกันแต่ดันคุณภาพดีกว่า แปะแบรนด์กูเกิล แถมเป็นฟรีเซอร์วิสงานเข้าสิครับ
เหตุนึงที่มีบริการนี้เพราะ tensor flow มันห่วยเอง กินแรมอ้วนเว่อtheano พ่อทุกสถาบัน อิอิ
ถ้าสำคัญขนาดนั้น ควรหาทุน ลงทุนเอง จะได้ไม่รั่วไหลครับ ผมสนับสนุนการเพิ่มตัวเลือกในชีวิตทุกกรณี มีให้เลือก ใช้ไม่ใช้ เป็นสิทธิ์ของเรา
เป็นนักวิจัยแต่มุมมองแคบแบบนี้ น่าเป็นห่วงนะครับ วิจัยเก่งแต่เลือกใช้และตัดสินแบบนี้ แล้วผลงงานที่ทำจะขนาดไหนผมละห่วงจริง ๆ เลย
ผมว่าของแบบนี้ผมว่าทุกคนเขารู้ครับ เขาใช้ไม่ใช่ก็เรื่องของเค้า ยังมีอีกหลายงานวิจัยที่ไม่แสวงหา "ผลประโยชน์" เยอะแยะไปครับ เปิดโอกาสให้ นักวิจัยที่ทุนต่ำได้วิจัยอย่างเต็มที่ เราอาจจะได้เห็นอะไรใหม่ๆ จากคนกลุ่มนี้อีกเยอะแยะไปครับดีกว่าให้โลกมันพัฒนาช้าลงเพราะมุมมองแคบ ๆ แบบนี้ครับ
เห็นด้วยทุกตัวอักษร โดยเฉพาะเรื่อง "มุมมองแคบ" กับ "งานวิจัยที่ไม่แสวงหา "ผลประโยชน์""
:V ลองส่งซอร์สโค้ดที่คุณเขียน web นำไปทำ NN ให้ Ai เขียนโค้ดตามความต้องการของลูกค้า .เราคงจะได้เห็นอะไร " ใหม่ๆ " จริงๆแหละครับ
ผมไม่ได้ทำอาชีพเขียนโปรแกรม เขียน code
ปล.โลกนี้มันช่างคับแคบจริงๆ
"อืม..."
"แคบจริงๆ"
เห็นด้วยครับ
อันนี้คือเชื่อว่ากูเกิลจะดูด dataset ที่เราอัพโหลดขึ้นไป ไปใช้กับงานวิจัยภายในบริษัทเองหรือครับ??
ผมอ่านประกาศแล้วไม่เจอว่าต้องยกสิทธิ์การใช้ข้อมูลให้กูเกิลนะครับ (มีเรื่องงานตีพิมพ์, การ feedback กลับ, และสร้าง ML แบบใหม่ๆ)
ถ้าเป็นการเชื่อเอง (ว่ากูเกิลแอบขโมย) อันนั้นคือ ขโมยครับ ถ้าต้อง จ่ายอันนั้นต้องบอกก่อนว่ามีเงื่อนไขการเข้าโครงการ
ส่วนจะเชื่อหรือไม่เชื่อว่าใครจะขโมยหรือไม่อันนี้คงแล้วแต่เลย อย่างโลกธุรกิจเองก็มีบางส่วนที่ไม่ยอมใช้คลาวด์เพราะไม่ต้องการให้ข้อมูลอยู่ภายนอกองค์กค จะจ่ายเงินหรือจะ "ฟรี" ข้อมูลพวกนี้ก็ห้ามออกจากองค์กรทั้งนั้น
lewcpe.com , @wasonliw
ประเด็นสำคัญคือ NN pattern ที่เกิดขึ้นในตัวคลัสเตอร์น่ะแหละครับ ที่กูกเกิลต้องการข้อนี้จะเป็นการเลี่ยงบาลีเรื่องขโมยข้อมูลได้ 100%.
ระหว่างที่ประมวลผล NN กูเกิลก็กำลังรัน NN อีกตัวครอบการประมวลผลนั้นอยู่.และก็อ้างได้ว่ามันเป็นสิ่งที่กูกเกิลพัฒนาจากความร่วมมือของคุณเอง .
ทีนี้ต่อมากูเกิลอยากจะสร้าง NN แบบคุณขึ้นมา ก็ไม่ต้องไปหา raw data set อีกต่อไป . เพราะ generate เองได้ :V
ยังไม่มีกฎหมายเรื่องการขโมย "สติปัญญา" คำถามน่าสนใจคือ . สติปัญญาที่คอมสร้างขึ้นมาถือ สิทธิบัตรได้หรือไม่ ??หากมีปัญญาประดิษฐ์สองตัวพัฒนาด้วยเงื่อนไขเดียวกัน จนรูปแบบคล้ายกัน จะถือว่า Ai 1 ลอกเลียน Ai 2 หรือไม่ ??
ซ้ำร้ายคือ มนุษย์ไม่สามารถไปแกะหรือเข้าใจ pattern Ai ได้เอง.เมื่อมนุษย์ไม่สามารถพิสูจน์หรืออภิปรายได้ ก็เท่ากับไม่สามารถอธิบายในศาลได้นั่นเอง
เปรียบเสมือนกูกเกิลเป็นเจ้าของสุนัข A 1 และเราเป็นเจ้าของสุนัข B 1 .ไม่มีใครเข้าใจว่าสุนัขคิดอะไร
แต่สุนัข A 1 ไปลอกเลียนเชาว์ปัญญาของ B 1 . และทำการ perform ได้ดีกว่า B 1 .ต่อมา A 1 ไปลอกเลียนเชาว์ปัญญาของสุนัขอีกตัวคือ B 2
สุดท้าย คือสุนัข A 1 ออกลูก และสอนลูกสุนัข A 1.1 ให้ perform ได้ "ดียิ่งกว่ายิ่งกว่า" B 1 และ B 2A 1.1 ถือว่าลอกเลียน B 1 และ B 2 หรือไม่ ??
ช่องว่างของกฎหมายกับเทคโนโลยีกำลังจะ leap ไปอีกขั้น .
เห็นด้วยกับความเห็นนี้ทุกตัวอักษร +2 ลึกๆ ฉันก็คิดแบบนี้แหล่ะ ของฟรีหรอกูเกิล! ถุย.. ต้นทุนของบางคนคือทรัพย์สินที่มองเห็นอย่างเช่นเรื่องต้นทุนซินะ
NN Pattern เป็นผลจากการรันซอฟต์แวร์ของเราครับ ถ้ากูเกิลเอาไปก็ ขโมยอยู่ดีครับ ไม่งั้นพวกงาน data warehouse สารพัดที่เขารันกูเกิล (หรือ Azure/AWS) จะบอกว่ารันอยู่บนระบบเรา เราเอาผลไปใช้ได้แบบนั้นคงไม่ใช่
เรื่องพิสูจน์ไม่ได้นี่อีกเรื่องครับ อย่างที่บอก มีคนที่ไม่เชื่ออยู่ หลายองค์กรมีนโยบายห้ามนำข้อมูลออก อันนี้ไม่แปลก
แต่ที่คุณพูดมามันไม่ใช่ช่องว่างทางกฎหมาย มันคือการขโมยอย่างชัดเจน ถ้าพบ (ซึ่งคุณอาจจะคิดว่าไม่มีทางพบ) ก็ถูกดำเนินคดีได้
lewcpe.com , @wasonliw
:V ตรงนั้นละครับที่น่ากลัว เพราะ NN ที่ได้เป็น NN of NNคุณจะหาร่องรอยการลอกเลียนแบบหรือขโมยได้อย่างไร
ตรงนี้เหมือนหยดโค้ก 1 แก้ว ลงในมหาสมุทร แล้วถามว่าโค้กอยู่ที่ตำแหน่งใหน ?
ยิ่งถ้าหากผลลัพท์ของ NN ที่ generate ออกมา
เป็นส่วนผสมของเศษชิ้นส่วนย่อยของ NN อื่นๆ จำนวนล้านๆชุด
ก็กลายเป็นร่องรอยมีเพียง 1 ในล้าน ไม่สามารถถือว่าเป็นการลอกเลียนหรือขโมยได้เลย
คุณอาจบอกได้ว่าเปปซี่ เลียนแบบโค้ก
แต่ถ้าหากเครื่องดื่มทุกประเภทบนโลกมาผสมกัน เราจะเรียกเครื่องดื่มนั้นว่าอะไร ?? ลอกเลียนโค้กหรือไม่ ??
ครับ คุณกำลังเชื่อว่ากูเกิลจะขโมยทรัพย์สินของคุณถ้าคุณไปทำวิจัยบนเครื่องของเขา
ด้วยความคิดแบบนี้ กูเกิลจะเก็บเงินชั่วโมงละพันดอลลาร์หรือให้ฟรีก็คงไม่ต่างกันครับ
lewcpe.com , @wasonliw
เห็นด้วยกับความเห็นนี้ทุกตัวอักษร