ทีม Microsoft Artificial Intelligence and Research ( ที่เพิ่งก่อตั้ง ) ประสบความสำเร็จกับระบบแยกแยะเสียงพูด (speech recognition) ที่มีความผิดพลาดน้อยเทียบเท่ากับมนุษย์ผู้เชี่ยวชาญด้านการถอดเสียงพูดแล้ว
ไมโครซอฟท์สามารถพัฒนาระบบถอดเสียงพูดที่มีอัตราความผิดพลาด (word error rate หรือ WER) ที่ 5.9% ซึ่งใกล้เคียงกับการถอดเสียงโดยมนุษย์ และถือเป็นระบบแยกแยกเสียงตัวแรกที่มีความแม่นยำถึงระดับนี้
ระบบของไมโครซอฟท์ใช้เทคนิค neural network เรียนรู้เสียงพูดของมนุษย์ โดยใช้ ชุดพัฒนา CNTK ตัวเดียวกับที่ไมโครซอฟท์เปิดซอร์สโค้ดขึ้นไว้บน GitHub
ที่มา - Microsoft
ทีมวิจัยระบบเสียงพูดของไมโครซอฟท์
Comments
"ยังไม่รองรับภาษาไทย" - ไมโครซอฟท์ยังไม่ได้กล่าวไว้แต่เราเชื่อแบบนั้น
ผมว่าไมโครซอฟท์เจอ "ไมค์ใหม่ไหม้มั้ยไหม" เข้าไปอาจจะขอตัวกลับไปทำการบ้านต่อ
ลองกับสำเนียงอินเดียรึยัง คุยกี่ทีก็มึนตึบ
CEO เป็นอินเดียก็น่าจะเข้าใจเรื่องนี้ดีนะ...
ผมให้ญี่ปุ่นชนะเลิศ
ญี่ปุ่นผมว่ามันฟังยากเพราะคำศัพท์นะ พี่แกชอบเติมอะไรเข้าไป
แต่อินเดียนี่ ศัพท์เหมือนอังกฤษปกติ แต่ฟังไม่ออก - -"
เคยเจอคนญี่ปุ่นชอบใช้ศัพท์ประหลาด หรือศัพท์ยากที่เราไม่ค่อยเจอฝรั่งใช้ใน Context เดียวกัน แถมออกเสียงลงท้ายด้วยเสียงสระแบบญี่ปุ่นอีก (ภาษาญี่ปุ่นไม่ลงเสียงตัวสะกดปิดพยางค์) เลยงง
ใช่ครับ Japan's English มันวิบัติเพราะคาตาคานะนี่แหละ
เคยคุยกับคนญี่ปุ่น เจอคำที่ประทับใจ(?)มาก......
"ซึรี บุริเอะอึน เอน"
Three Billion Yen........
ผมประทับใจ "คุโรวัซซัง" ครับ (クロワッサン)
Croissant........
ทีแรกก็ ใครนะ? เอ้ย ไม่ใช่คนนี่หว่า
ยังมีสำเนียง ญี่ปุ่นอีก ตึ๊บพอกัน
ภาษาญึ่ปุ่นส่วนใหญ่ไม่มีตัวสะกด ฟังแล้วห้วนๆ พิกล
มาทำเป็นภาษาที่มีตัวสะกดมากขึ้น เช่น อังกฤษ ไทย ก็เลยออกเสียงยาก
รวมถึงเพลงญี่ปุ่นด้วย ผมฟังไม่ค่อยเพราะ
ฟิลิปปินส์พูดอังกฤษเป็นหลักยังฟังยากเลยปราดึกส์-product
ซุปปอด ฟังแล้วเหมือนจะหิว อ๋อ support
ปราดึกส์นี่ ฟังไม่ออกอาจจะคิดว่าอยากกินปลาดุก XD