เมื่อ 1 สิงหาคมที่ผ่านมา Black Forest Labs สตาร์ทอัปด้านปัญญาประดิษฐ์ ได้เปิดตัวบริษัทอย่างเป็นทางการ พร้อมกับเปิดตัวโมเดล AI สร้างรูปภาพจากข้อความ (Text-to-Image) ชื่อว่า FLUX.1ซึ่งเป็นกระแสทันทีที่เปิดตัว เพราะ FLUX.1 ชูจุดขายการสร้างรูปภาพบุคคลที่สมจริงมากกว่าโมเดลอื่นในตลาด
FLUX.1 มี 3 โมเดลให้ใช้งานได้แก่ Pro สามารถใช้งานได้ผ่าน API ของ Black Forest Labs หรือผ่านพาร์ตเนอร์ Replicate และ fal.ai , Dev สำหรับงาน Non-commercial สามารถดูเพิ่มเติมได้ที่ GitHub หรือ HuggingFace และ Schnell สำหรับการใช้งานส่วนบุคคลหรือรันบนโลคอล นอกจากนี้มีช่องทางอื่นสำหรับทดลองใช้งานเช่น NightCafe เป็นต้น
Black Forest Labs เป็นสตาร์ทอัปจากเยอรมนีที่โฟกัสการพัฒนาปัญญาประดิษฐ์สร้างรูปภาพ นั่นเพราะสามผู้ก่อตั้ง Robin Rombach, Andreas Blattmann และ Dominik Lorenz เคยเป็นวิศวกรอยู่ที่ Stability AI จึงเชี่ยวชาญโมเดล AI ประเภทนี้อยู่แล้ว
นอกจากโมเดล AI สร้างรูปภาพแล้ว Black Forest Labs บอกว่าบริษัทกำลังพัฒนาโมเดล AI สร้างวิดีโอจากข้อความอยู่ด้วย โดยทำงานบนพื้นฐานของ FLUX.1 มีเป้าหมายให้ได้ผลลัพธ์ที่ตรงตามต้องการ, ภาพความละเอียดสูงที่สามารถแก้ไขได้ และความเร็วในการสร้างวิดีโอ
ที่มา: Ars Technica และ Tom's Guide
Comments
ตัวนี้คือโหดจริง สูสีกับ Davinci มาก
ดีกว่ามากต่างหากครับ Davinci แค่ sd 1.5 sdxl แล้วเทรนเพิ่มเฉยๆ
WE ARE THE 99%
จุดเด่นนึงที่น่าสนใจของโมเดลนี้คือ มันบน VRAM ต่ำ (ราว ๆ 8-12GB) ก็ยังรันได้ และความเร็วก็ค่อนข้างโอเค (ผมรันได้ 1s/it ที่ 1024*1024 บน RTX3060 12GB) และคุณภาพออกมาดูดีทีเดียว
คือสำหรับผู้ใช้ตามบ้านทั่วไปมันก็ยังใช้ได้ครับ ไม่ต้องแบบไปซื้อ A100 มาเล่นอะไรงี้
VRAM น้อยเหมือนที่ว่ายังพอไปได้ครับ แต่ถ้า RAM เครื่องน้อยกว่า 32 GB คือนานมากกกก กว่าจะได้สักรูป 55
WE ARE THE 99%
เครื่องผมแรม 16GB DDR3 ครับ มันก็โอเคอยู่นะ
1s/it นี่ ผมเจ็นที่ 20 it ก็ตก 20s ต่อรูปเอง
วันแรกที่เปิดตัว ผมนึกว่าใครแฮกหลังบ้านของ MidJourney เอาโมเดลมาปล่อยตัว Pro คือโหดสุด ตามชาร์ทที่ปล่อยมาคือชนะ MidJourney V6 ไปแล้ว สุดจริง ส่วนตัว Dev ภาพก็ออกมาดีมากๆ ... สงสาร SD3 คือโดนฝังกลบไปแล้ว
WE ARE THE 99%
จริง ๆ ก่อนหน้า Flux ก็มีอีกตัวที่ออกมา ก็คือ AuraFlow แต่เหมือนจะไม่มีใครมองแล้วตัวนี้
อีกอย่างคือตัวนี้กินแรมหนักมาก 555