บริการ NotebookLM ของกูเกิลได้รับความนิยมค่อนข้างดีในช่วงหลัง จากความสามารถในการสรุปรวมเอกสารทั้งชุดให้กลายเป็นพอดแคสต์ ล่าสุดฝั่ง Meta ก็โชว์โครงการ NotebookLlama เป็นชุด Python Notebook ที่แปลงเอกสารให้กลายเป็นพอดแคสต์ได้เหมืิอนกัน
โครงการนี้ใช้ LLM สามชั้น ชั้นแรกใช้ตัวเล็ก Llama 3.2 8B เพื่อแปลง PDF เป็นเอกสารที่อ่านได้ง่ายๆ จากนั้นใช้ Llama 3.1 70B เขียนสริปต์พอดแคสต์ แล้วใช้ Llama 3.1 8B แปลงสคริปต์ให้เร้าใจขึ้น สุดท้ายจึงแปลงข้อความเป็นเสียง
แม้ในทางทฤษฎี โมเดลเหล่านี้จะรันในองค์กรได้ แต่ Llama 3.1 70B ก็ต้องการหน่วยความจำกราฟิกใหญ่มาก เกิน 140GB ขึ้นไป ส่วนมากจึงมักใช้งานผ่านคลาวด์กันอยู่ดี
ที่มา - Meta-Llama
Comments
แข่งกันหนักมาก
เหมือน
notebooklm ถอดเสียงเป็นข้อความ ยังกระโดด เนื้อหาบางส่วนหายไป และเว้นวรรคทุกคำ ไม่รู้จะแก้อย่างไรครับ
เรื่องเว้นวรรคทุกคำนี่เป็นตั้งแต่ Gemini
แต่จริงๆ ตอนคุยกับมันไม่ค่อยมีผลแล้วนะครับ
lewcpe.com , @wasonliw