กูเกิลปรับสถานะของ Cloud Speech API บริการแปลงเสียงพูดเป็นข้อความ จากเดิมที่เป็น open beta เข้าสู่รุ่นจริง general availability แล้ว
Cloud Speech API คือการนำเทคโนโลยีแยกแยะเสียงพูด (speech recognition) ที่กูเกิลใช้งานอยู่แล้วใน Google Now, Google Assistant, Google Search) มาเปิดให้คนภายนอกใช้งานแบบคิดเงินผ่านคลาวด์ ข้อดีของมันคือเป็นระบบแยกแยะเสียงพูดที่กูเกิลเทรนมาเรียบร้อยแล้ว พิสูจน์แล้วว่าใช้งานได้จริง แถมทำงานได้แม้มีเสียงรบกวนมาก รองรับทั้งการแปลงเสียงแบบเรียลไทม์ และแปลงไฟล์เสียงที่อัดมาก่อนแล้ว
Cloud Speech API สามารถแยกแยะเสียงพูดของมนุษย์ได้กว่า 80 ภาษา และรองรับการแปลงเสียงภาษาไทยด้วย ใครสนใจลองไปเล่นกันได้ที่ Cloud Speech API เลือกภาษาเป็นภาษาไทย กดปุ่ม Start Now อนุญาตให้เว็บเพจเข้าถึงไมโครโฟน แล้วพูดได้เลย
ค่าบริการคิดเป็นหน่วยตามความยาวเสียงทุก 15 วินาที ราคาหน่วยละ 0.006 ดอลลาร์ ถ้าหากใช้งานต่อเดือนไม่ถึง 60 นาทีไม่ต้องเสียเงิน
ที่มา - Google Cloud Platform Blog
Comments
ยอดเยี่ยม
รักนะคะคนดีของฉัน
คำถามคือจะเริ่มใช้ในbrowserได้เมื่อไหร่? ขืนรอตัวไมโครซอฟท์ซะเองคงไม่ต้องทำอะไรกินกันแล้ว
ปล.อิจฉาคนใช้Macที่มีdictation TT
บนหน้าเว็บก็มีให้บนลองใช้งานบน Web Browser อยู่แล้วไม่ใช่หรือ?
SPICYDOG's Blog
เต้าหู้แปลภาษา กำลังเป็นจริงแล้ว