Common Voice เป็นโครงการที่ Mozilla ซึ่งเป็นองค์กรไม่แสวงหาผลกำไร ได้สร้างขึ้นเพื่อแก้ปัญหาการขาดแคลนชุดข้อมูลเสียงที่เป็นสาธารณสมบัติ (ไม่มีลิขสิทธิ์) ที่ทุกคน ทุกหน่วยงาน สามารถมีส่วนร่วมและ ใช้เพื่อสอนระบบ AI ต่าง ๆ เช่นระบบพิมพ์ด้วยเสียงได้
ปัจจุบันในภาษาไทยมีจำนวนเสียงที่บันทึกแล้ว 393 ชั่วโมง แต่ตรวจสอบไปเพียง 154 ชั่วโมง (ไม่ถึงครึ่งของจำนวนเสียงที่บันทึกไว้ทั้งหมด) ในขณะที่ชุดข้อมูลรอบถัดไปจะตัดรอบในวันที่ 7 กันยายน 2565 นี้ เราจึงต้องการให้ทุกคนเข้ามาร่วมตรวจสอบเสียงง่าย ๆ โดยไม่ต้องโหลดแอปใด ๆ ตามขั้นตอนด้านล่างนี้
- กดที่นี่ เพื่อเข้าสู่หน้าตรวจสอบเสียง
- ประโยคจะปรากฏบนหน้าจอ กดปุ่มเล่น (สามเหลี่ยม) 1 ครั้งเพื่อเล่นคลิปเสียง
- ประโยคจะต้องไม่มีการสะกดผิด ตัวอักษรภาษาอื่นที่ไม่ใช่ภาษาไทย หรือตัวเลข ส่วนคลิปเสียงต้องพูดให้ถูกต้องทุกคำ ไม่ขาด ไม่เกิน ไม่มีพูดผิดแล้วพูดใหม่ (ไม่จำเป็นต้องชัดเจน ขอแค่ฟังรู้เรื่องและมีเสียงรบกวนน้อย)
- หากถูกต้องให้กด "ใช่" แต่ถ้าไม่ถูกต้อง เสียงเบาเกินไป หรือกระตุก ให้กด "ไม่" (หากพบปัญหาในประโยคหรือคลิปเสียง ควรกด "รายงาน" เพื่อรายงานปัญหา)
นอกจากนี้ยังมีส่วนอื่น ๆ ที่ต้องการความช่วยเหลือ โดยเฉพาะการตรวจสอบประโยคใหม่สำหรับการบันทึกเสียง สามารถดูเพิ่มเติมได้ใน บทความนี้ (หมายเหตุ: ควรชะลอการบันทึกเสียงและเพิ่มประโยคใหม่ไปก่อน จนกว่าจะตรวจสอบคลิปเสียงและประโยคที่มีอยู่เดิมได้มากพอ)
ขอให้สนุกกับการมีส่วนร่วมครับ!
ที่มา: Common Voice , ข้อมูลวันที่ตัดรอบชุดข้อมูลจาก ห้องแชท Matrix ของ Common Voice
Comments
ถ้าหากมีปัญหาติดขัดในการตรวจสอบหรือบันทึกเสียงมาคุณกันในกลุ่ม Telegram ได้นะครับ https://t.me/MozillaThailand
ลองจิ้มตรวจสอบเสียงไปเรื่อย ๆ บ้างแล้ว เพลินดี
พยายามช่วยอยู่นะครับ ตั้งแต่ครั้งที่แล้วละ แต่ชอบสะดุดตรงเสียงผู้ชายคนนึง ชอบพูดไวมาก ไม่รู้จะรีบไปไหน และพูดผิดบ่อย บางทีก็พยางค์แรกหายไป บางทีก็พูดบางคำในประโยคผิด แล้วดันทำเยอะมากเลยคนนี้ ฟังแล้วชวนหงุดหงิดมาก = ="
เทคโนโลยีไม่ผิด คนใช้มันในทางที่ผิดนั่นแหละที่ผิด!?!
เจอเพื่อนร่วมชะตากรรมแล้ว 555+
+1 ผมฟังไปสามรอบยังไม่เข้าใจเลย555
นอกจากตาคนนั้นแล้ว ก็จะมีพี่ผู้ชายอีกคนที่เสียงเบามาก ๆๆๆๆ ต้องเงี่ยหูฟังดี ๆ แต่เค้าพูดดีนะ แล้วก็จะเจอพวกพูดเว้นวรรคไม่ถูก คืออ่านถูกแหละ แต่เว้นวรรคจังหวะนรก เวลากดให้ผ่านแล้วมันปวดใจพิลึก
อีกปัญหาที่เจอคือคำว่า "ฉัน" คนมักอ่านว่า "ชั้น" คิดแล้วก็ปวดหัว จะให้ผ่านหรือไม่ให้ผ่านดี สุดท้ายก็ให้ผ่าน ๆ ไปหมดเลย ไม่รู้ว่าคิดถูกมั้ย
เทคโนโลยีไม่ผิด คนใช้มันในทางที่ผิดนั่นแหละที่ผิด!?!