Baidu ประกาศความสำเร็จในการพัฒนา Deep Speech ระบบจดจำเสียงที่ใช้โครงสร้าง deep learning เข้ามาเรียนรู้เสียงจากโลกความเป็นจริงทำได้สามารถจดจำเสียงได้อย่างแม่นยำ
Andrew Ng ระบุว่างานวิจัย Deep Speech นี้สามารถฟังข้อความได้ถูกต้องแม้จะอยู่ในพื้นที่ที่มีเสียงรบกวนสูง รวมถึงพื้นที่ที่ระบบจดจำเสียงทุกวันนี้ไม่สามารถฟังข้อความเข้าใจได้ โดยเขาทดสอบกับระบบที่มีอยู่ในตลาด รวมถึง Google API, Apple Dictation, และ Baidu Speech เอง ระบบ Deep Speech นี้สามารถทำงานได้ดีว่าทุกระบบ
ทีมงานใช้เสียงที่บันทึกจากคน 9,600 คน รวมทั้งหมด 7,000 ชั่วโมง จากนั้นจึงใส่เสียงรบกวนเข้าไปในเสียงด้วยรูปแบบต่างๆ ทำให้ได้ข้อมูลถึง 100,000 ชั่วโมง จากนั้นให้ซอฟต์แวร์เรียนรู้จากข้อมูลที่ใส่เข้าไป โดยซอฟต์แวร์ deep learning ทำงานบนชิปกราฟิก มีความสามารถในการกระจายโหลดออกไปให้ประมวลผลขนานกันได้ (scalable)
Andrew ระบุว่ายังบอกไม่ได้แน่ชัดว่าระบบ Deep Speech นี้จะให้บริการจริงได้เมื่อไหร่ แต่เมื่อนักข่าวถามว่าต้องรอเป็นปีเลยไหม เขาตอบว่า "ไม่หรอก" ("Jesus Christ no!")
ที่มา - Forbes , Facebook: Andrew Ng
Comments
ปรบมือ!! แประ แประ
จะว่าไป ไบดู มันก็มีดีของมันนะ แต่เดินทางผิดคิดทำ PC Faster กับ Hao123 แทบจะหมดอนาคตกับประเทศไทยเลย
เห็นด้วยที่สุดครับ
โดยเฉพาะ ระบบแปลภาษาของไบดู แปลได้ดีไม่น้อยกว่า GG เชียว
แต่มาตกม้าตายกับ PC Faster นี่แหละ สิงมันทุกเครื่องสิน่า
จะว่าไปแปลภาษาของไป่ตู้นี่ใช้ได้ดีกับภาษาไทยนะดีกว่ากูเกิ้ลทรานสเลสเยอะ ส่วนระบบรับเสียงพูดของภาษาไทยผมยังยกให้ Apple เจ๋งสุด
เห็นด้วยครับ
โดยเฉพาะบางประโยค แปลได้แล้วอ่านเข้าใจได้ทันทีเลย ในจณะที่ GG ยังแปลงงๆ ฮ่าๆ
รับ Bing Translate หน่อยมั้ยครับ ตอนเปิดตัวแรกๆ นี่โอเคกว่ากูเกิลอีกนะครับ
เริ่มกันที่ rolling out
ยัง ยังไม่พอครับ please be patient อีกหน่อย อันนี้เลวร้ายกว่าอันแรกเพราะมันเป็นระบบใช้งานจริงอย่างเป็นทางการ
....
โอ๊ย น้ำตาไหล 5555
รักนะคะคนดีของฉัน
จะเป็นเพราะว่าแกรมม่าของไทยคล้ายๆ กับภาษาจีนด้วยหรือเปล่า เลยทำให้การแปลง่ายกว่า
อ่านแล้วรู้สึกไม่ค่อยน่าเชื่อถือไงไม่รู้ เพราะอคติสินะ
Baidu?Jesus Christ no!
"ทีมงานใช้เสียงที่บันทึกจากคน 9,600 คน รวมทั้งหมด 7,000 ชั่วโมง จากนั้นจึงใส่เสียงรบกวนเข้าไปในเสียงด้วยรูปแบบต่างๆ ทำให้ได้ข้อมูลถึง 100,000 ชั่วโมง"
Remote มาฟังเสียงของเครื่องที่ลง Baidu antivirus นี้ ก็ไม่รู้ว่าได้ไปกี่ล้านคนกี่พันล้านชั่วโมงละ :P
ทำงานได้ดีว่าทุกระบบ->ทำงานได้ดีกว่าทุกระบบ
ถ้ามองในแง่งานด้าน deep learning Andrew Ng นี่เป็นปรมาจารย์ในวงการนี้เลยนะครับ.. แต่ผลิตภัณฑ์ของฝ่ายอื่นๆดันทำชื่อเสียให้บริษัทซะนี่...
ก็ได้ระดับปรมาจารย์ไปทำให้นี่ครับ มันต้องเจ๋งกว่าเดิมสิ
Baidu Speech Faster
Baidu learn deeper