หากคุณกำลังมองหาโซลูชันสำหรับการสร้าง Avatar ที่สมจริงและสามารถโต้ตอบได้แบบเรียลไทม์ AVTR-1 คือโปรเจกต์โอเพนซอร์สบน GitHub ที่น่าจับตามองอย่างยิ่ง โดย AVTR-1 เป็นโมเดลแบบ Autoregressive ที่ใช้เทคนิค Flow Matching ในการประมวลผล ช่วยให้ Avatar สามารถลิปซิงค์คำพูดและแสดงท่าทางตอบสนอง (Active Listening) ได้อย่างเป็นธรรมชาติที่ความเร็ว 25 fps บน GPU เพียงตัวเดียว สรุปสั้นๆ สำหรับสาย Dev: AVTR-1 คือโมเดลสำหรับงาน Live Dialogue ที่เน้นการใช้งานจริง (Production-ready) รองรับการทำ Inference ผ่าน TensorRT และมาพร้อมกับ API สำหรับเชื่อมต่อระบบ Streaming เหมาะสำหรับนักพัฒนาที่ต้องการสร้าง Virtual Assistant หรือ Digital Human ที่โต้ตอบได้สมจริงและมีความหน่วงต่ำ สารบัญ ภาพรวมโปรเจกต์ AVTR-1 โปรเจกต์นี้เหมาะกับใคร จุดเด่นและประสิทธิภาพ […]

