คงจะเคยดูหนังหรือละครต่างประเทศแนวสืบสวนสอบสวนกันมาบ้าง หลายครั้งที่เราเห็นฉากการตามหาคนแล้วดึงภาพมาจากกล้องวงจรปิด หรือกล้องมือถือที่ไหนสักแห่งแล้วเห็นภาพบุคคลเป้าหมายเบลอๆ เห็นแค่เม็ดพิกเซลเหมือนภาพโมเสค จากนั้นเจ้าหน้าที่ก็ซูมภาพ ซูมแล้วซูมอีก แล้วใช้ซอฟต์แวร์ปรับแต่งภาพให้มีความคมชัดขึ้น จากภาพเบลอๆ เหลี่ยมๆ ก็กลายเป็นภาพใบหน้าคนที่มีความคมชัดขึ้น วันนี้อยากบอกให้รู้ว่าเรื่องพวกนี้มันไม่ได้ขี้โม้เกินจริงสักเท่าไหร่เลย ตัวอย่างโปรแกรมของชายที่ชื่อ David Garcia พิสูจน์เรื่องนี้ให้เห็นได้อย่างดี
สิ่งที่ Garcia ทำคือการสร้างปัญญาประดิษฐ์ที่มีการเรียนรู้ได้แบบ deep learning ซึ่งทำการเรียนรู้ใบหน้ามนุษย์มากกว่า 130,000 ภาพ หลังจากนั้นเมื่อใช้ข้อมูลภาพใบหน้าบุคคลมาลดขนาดลงเหลือ 16x16 พิกเซล ซึ่งได้จะภาพเบลอๆ แบบโมเสคที่มองไม่ออกว่าเป็นใบหน้าของใคร แล้วป้อนภาพที่ลดขนาดแล้วให้โปรแกรมทำการวิเคราะห์ มันจะทำการสร้างภาพใบหน้าที่คมชัดขึ้นเป็นขนาด 64x64 พิกเซลได้ ซึ่งแม้ใบหน้าที่โปรแกรมสร้างขึ้นนี้จะไม่ใช่ภาพใบหน้าเดียวกันกับภาพต้นฉบับ แต่ก็มีความใกล้เคียงอยู่มาก
- แถว A คือภาพขนาด 16*16 พิกเซลที่ถูกป้อนให้โปรแกรมทำการวิเคราะห์
- แถว B คือภาพที่ผ่านการแก้ไขแบบ bicubic interpolation ซึ่งทำให้ได้ภาพที่ดูเนียน ลดความเหลี่ยมของพิกเซล
- แถว C คือภาพที่ได้จากการสร้างสรรค์โดยปัญญาประดิษฐ์
- แถว D คือภาพต้นฉบับของจริง
จากภาพตัวอย่างการวิเคราะห์และสร้างภาพโดยโปรแกรม 8 ชุดด้านบน แม้ว่าภาพที่ได้ในแถว C จะไม่เหมือนกับภาพต้นฉบับในแถว D แต่ภาพจากการสร้างสรรค์โดยคอมพิวเตอร์ส่วนใหญ่ก็ดูเป็นภาพใบหน้าคนและใกล้เคียงกับภาพจริงอยู่ไม่น้อย ยิ่งเมื่อคิดว่านี่เป็นผลจากการศึกษาภาพใบหน้าแค่ 130,000 ภาพเท่านั้น หากมีการพัฒนาอย่างจริงจังและใช้ฐานข้อมูลภาพระดับร้อยล้านหรือพันล้านภาพ ก็อาจได้ผลลัพธ์ที่ดียิ่งขึ้นไปอีก
Garcia ได้เผยแพร่งานชิ้นนี้บน Github ใครสนใจจะนำมาลองเล่นหรือค้นคว้าพัฒนาต่อก็ตามสะดวก ซึ่งก็น่าสนใจว่านอกเหนือจากภาพใบหน้าคนแล้ว มันจะสามารถเรียนรู้ภาพสิ่งอื่นและทำการเปลี่ยนภาพเบลอหรือภาพโมเสคของสิ่งนั้นให้กลายเป็นภาพที่ชัดเจนขึ้นได้เช่นเดียวกันหรือไม่
ที่มา - Ubergizmo
Comments
รูปฝั่งซ้ายช่อง C นี่สยองเลย
ไอ้รูป D บางรูปมันเนียนกว่า 360 อีกนะ
บางครั้งพวกสูงวัยก็มีริ้วรอยแห่งวัยบ้างก็ได้
อย่างว่าแหละมันเรียนรู้จากแค่ 130,000 ภาพ
D คือรูปต้นฉบับ(รูปจริงไม่ได้ผ่านโปรแกรมคำนวน)
อ่าวจริงด้วยเราอ่านไม่ละเอียดเอง
นึกที่ใช้ออกทันทีเลย จะเอาไปลบเซนเซอร์อะไร -,.-
คงต้องใช้หนังจำนวนมาtrainเยอะพอสมควร ใครมีเยอะก็ส่งมาให้ผมได้นะ
หมายถึงหนังสอนภาษาใช่มั้ยครับ
หนังญี่ปุ่นอิอิ
มันยากตรงที่ไม่มีภาพต้นฉบับมาให้มันเรียนรู้(ส่วนใหญ่ออกมาแต่แบบเซน) จะไปเอาฝั่งตะวันตกมามันก็ดูแปลกๆ
JP แบบไม่เซนก็มีมากอยู่นะ
ผมอ่านข่าวแล้วคิดแบบเดียวกับคุณในทันทีเลย
แถมขึ้น Github ด้วย เดี๋ยวคงมีคนทำออกมาแน่นอน = =
เป็นการพัฒนาที่น่าสนใจ และน่ากลัวในคราวเดียวกัน
อนาคตสื่อต่างๆ คงใช้ป้ายดำแทนโมเสคแน่ๆ ถ้าต้องเซนเซอร์อะไรซักอย่าง
ภาพฝั่งขวานี่ยมันคนละคนชัดๆถ้าเอาไปตามหาคนร้ายรับรองว่าจับผิดคนแน่นอน
ซึ่งก็ไม่แปลกเพราะการเซ็นเซอร์มันใช้ "ทำลาย" ข้อมูลในภาพอยู่แล้ว
แต่กรณีนี้คือ AI มันทำงานคล้ายคนที่สามารถ "จินตนาการ" จากข้อมูลที่ไม่สมบูรณ์ได้ ผมว่างานวิจัยแบบนี้คงไม่สามารถวัดได้จากการทำภาพ "เหมือนเดิม" ครับ แต่คงต้องวัดจากการให้คนที่ไม่เคยเห็นภาพจริง มาชี้ว่าภาพไหนภาพจริง (ยิ่งชี้ผิดเยอะ แสดงว่าคุณภาพการจินตนาการมีสูง)
lewcpe.com , @wasonliw
รูปสุดท้ายนี่มันกลับเพศกันเลยทีเดียว
ดูจากรูป Skrillex แล้ว แสดงว่า AI ตัวนี้ยังแยกคนใส่แว่นกับไม่ใส่ ไม่ออก
ถ้าให้เรียนรู้มากกว่านี้ไปเรื่อย ๆ น่าจะใกล้เคียงขึ้นได้อีกนะครับ
ต่อยอดโดยการสร้างภาพ C มาหลายๆ แบบ แล้วก็ไป train รูปในฐานข้อมูลทั่วอินเทอร์เน็ต/หรือฐานข้อมูลรัฐ แล้วค่อยสร้างภาพใหม่อีกที
The Dream hacker..
ภาพแรกในหัวที่ผุดขึ้นมาคือ หนัง AV จะมีแต่ UNCEN แฮ่กๆ
เราจะได้เห็นโมเสค กลายเป็น Oyster สดๆ กันแล้วใช่มั้ยครับ
โฟกัสท่ีใบหน้าคนกันสิครับ มาโฟกัสที่การลบเซ็นเซอร์อะไรกัน
แฮ่ก แฮ่ก
ผมคิดว่า ถ้าใช้มันตอนนี้เพื่อออกหมายจับ มันยังไม่เหมือนนะครับ ถ้าใช้เป็นแนวทางแบบละม้าย ก็พอไหว
ก็ต้องพัฒนากันต่อไป เพิ่มจำนวนตัวอย่างในการประมวลผล และอีกไม่นานนัก สิ่งที่อยู่ในหนังจะกลายเป็นเรื่องอดีตไปเลย เพราะสิ่งที่พัฒนามันสามารถทำได้มากกว่าและละเอียดกว่า เผลอๆ เร็วกว่าด้วย
ปล. แต่คงใช้กับอันนี้ไม่ได้ อันนี้ก็ล้ำเกิน
Get ready to work from now on.
อย่างฮา ภาพถ่ายมุมสูงด้านข้าง ซูมเข้ามาเห็นตาชัดเจนหน้าตรงเฉย
เทคโนโลยีไม่ผิด คนใช้มันในทางที่ผิดนั่นแหละที่ผิด!?!
มันไม่รู้จักแว่น ไม่ถนัดภาพมุมข้าง
The Last Wizard Of Century.
ผมว่า ทำได้ดีทีเดียวเลยนะ ถ้าคิดว่ามาจากข้อมูล 130,000 รูปตอนนี้ คงขึ้นอยู่กับปริมาณข้อมูลที่จะป้อนให้มันละครับ
สงสาร skrillex
น่าลองกับภาพเคลื่อนไหวดู ภาพเคลื่อนไหวจะมีหลายๆเฟรม ถ้าเอาข้อมูลจากหลายๆเฟรมมาปะติดปะต่อกันได้น่าจะสร้างภาพแบบชัดเจนถูกต้องได้
https://www.blognone.com/node/64319#cid-777585
"How to zoom pictures in High Quality"ผลงานนี้จะไปต่อยอดเป้นการซูมภาพโดยไม่ต้องใช้เลนซ์ ใช้ AI ล้วนๆ