AVTR-1 คือโปรเจกต์โอเพนซอร์สที่น่าจับตามองสำหรับนักพัฒนาที่ต้องการสร้าง Digital Avatar ที่มีความสมจริงสูง โดยใช้เทคนิค Flow Matching Autoregressive Model เพื่อสร้างการเคลื่อนไหวของริมฝีปาก (Lip-sync) และปฏิกิริยาโต้ตอบ (Active Listening) ได้แบบเรียลไทม์ที่ 25 fps บน GPU เพียงตัวเดียว สรุปโดยย่อ: AVTR-1 เป็นโมเดลสำหรับงาน Live Dialogue ที่ประมวลผลผ่าน TensorRT เพื่อประสิทธิภาพสูงสุด รองรับการใช้งานทั้งแบบ API และ Self-hosted เหมาะสำหรับงานที่ต้องการ Avatar ที่โต้ตอบได้เหมือนมนุษย์จริงๆ โดยโปรเจกต์นี้เน้นการทำงานร่วมกับภาพพอร์ตเทรตและสตรีมเสียงคู่ (Dual Stream Audio) เพื่อสร้างบทสนทนาที่ลื่นไหล สารบัญ ภาพรวมโปรเจกต์ โปรเจกต์นี้เหมาะกับใคร จุดเด่นของ AVTR-1 วิธีเริ่มต้นใช้งาน วิเคราะห์ประสิทธิภาพและ GPU ข้อควรระวังเรื่องลิขสิทธิ์และข้อจำกัด คำถามที่พบบ่อย (FAQ) สรุป ภาพรวมโปรเจกต์ AVTR-1 […]

