123-2341-74

แนะนำ เทคนิคลดค่าครองชีพ
ทุกครั้ง ที่ ซื้อ ของจาก marketplace อย่าลืม กดรับคูปอง และเช็คโปรโมชั่น บัตรเครดิต ก่อน กดจ่ายเงินทุกครั้ง

กดรับ คูปอง
ก่อนจ่ายเงินทุกครั้ง อยากลืม

เทคนิคลดค่าครองชีพ
ทุกครั้ง ที่ ซื้อ ของจาก marketplace อย่าลืม กดรับคูปอง และเช็คโปรโมชั่น บัตรเครดิต ก่อน กดจ่ายเงินทุกครั้ง

กดรับ คูปอง
อันดับ 1: Open LLM พบ Qwen ของ Alibaba

อันดับ 1: Open LLM พบ Qwen ของ Alibaba

[ad_1]

2 บทเรียน ที่ควรรู้

1. การทดสอบโมเดลภาษา

บทความเกี่ยวกับการทดสอบโมเดลภาษาจาก Hugging Face นำเสนอถึงวิธีการทดสอบโมเดล LLM แบบเปิด (open large language model) ในงานต่าง ๆ โดยใช้ตัววัดผลที่มีอย่าง MMLU-Pro, GPQA, MuSR, MATH, IFEval และ BBH ซึ่งช่วยให้ผู้อ่านเข้าใจถึงกระบวนการทดสอบและประสิทธิภาพของโมเดลในการแก้ปัญหาต่าง ๆ

2. ผลการจัดอันดับ LLM leaderboard

บทความนี้นำเสนอผลการจัดอันดับ LLM leaderboard ครั้งที่สอง ที่เกี่ยวกับการทดสอบโมเดล Qwen2-72B-Instruct และ Meta-Llama-3-70B-Instruct จาก Alibaba และ Meta ตามลำดับ ซึ่งช่วยให้ผู้อ่านทราบถึงผลการทดสอบและการประเมินความสามารถของโมเดลต่าง ๆ

2 ปัญหา และ วิธีการแก้ไข

1. ปัญหาการอธิบายวิธีการขั้นตอน

การอธิบายวิธีการขั้นตอนในงานทดสอบโมเดลภาษาอาจมีความซับซ้อนและยาก ผู้เขียนของบทความสามารถแจ้งให้ทราบถึงเทคนิคหรือแนวทางการอธิบายวิธีการขั้นตอนอย่างชัดเจนเพื่ออำนวยความสะดวกในการเข้าใจ

2. ปัญหาการสร้างโมเดลใหญ่พารามิเตอร์เยอะ

การสร้างโมเดลใหญ่พารามิเตอร์เยอะอาจทำให้ข้อกำหนดทางเทคนิคและข้อจำกัดของระบบทดสอบมีความซับซ้อนมากขึ้น ความแม่นยำและเสถียรภาพของโมเดลก็ทวีความสำคัญในขณะเดียวกัน

3 คำถามที่ถามบ่อย

  1. การทดสอบโมเดลภาษามีความสำคัญอย่างไรในการพัฒนาโมเดล?
  2. ปัญหาใดที่อาจเกิดขึ้นจากการสร้างโมเดลใหญ่พารามิเตอร์เยอะ?
  3. การทดสอบโมเดลโดยใช้ตัววัดผล MMLU-Pro, MuSR และ BBH ช่วยให้อิมพรูฟเรซเพิ่มขึ้นได้อย่างไร?

5 เว็บไซต์ที่เกี่ยวข้อง

  1. Hugging Face: เว็บไซต์ของ Hugging Face ที่เผยแพร่ข้อมูลเกี่ยวกับการทดสอบโมเดลภาษา
  2. Alibaba: เว็บไซต์ของ Alibaba บริษัทที่ผลิตโมเดล Qwen2-72B-Instruct
  3. Meta: เว็บไซต์ของ Meta บริษัทที่ผลิตโมเดล Meta-Llama-3-70B-Instruct
  4. Blognone: เว็บไซต์ภาคสนามเทคโนโลยีที่นำเสนอข่าวสารเกี่ยวกับเทคโนโลยี
  5. OpenAI: เว็บไซต์ของ OpenAI บริษัทที่ผลิตโมเดล ChatGPT

5 คำค้นหาที่เกี่ยวข้อง

  1. ทดสอบโมเดลภาษา
  2. LLM leaderboard
  3. การอธิบายวิธีการขั้นตอน
  4. การสร้างโมเดลใหญ่พารามิเตอร์เยอะ
  5. ตัววัดผลโมเดลภาษา

Hugging Face เผยแพร่ผลการจัดอันดับ LLM leaderboard ครั้งที่สอง โดยนำโมเดล LLM แบบเปิด (open large language model) มาทดสอบในการทำงานด้านต่าง ๆ

การทดสอบของ Hugging Face สนใจใน 4 งานได้แก่ วัดความรู้, ให้เหตุผลจากเนื้อหาขนาดยาวมาก, การคำนวณคณิตศาสตร์ที่ซับซ้อน และการอธิบายวิธีการขั้นตอน โดยใช้ตัววัดผล 6 อย่าง ได้แก่ MMLU-Pro, GPQA, MuSR, MATH, IFEval และ BBH

ผลการทดสอบรวม โมเดล Qwen2-72B-Instruct ของ Qwen จาก Alibaba ได้คะแนนรวมอันดับ 1 ตามด้วย Meta-Llama-3-70B-Instruct ของ meta-llama จาก Meta เป็นอันดับที่ 2 และ Qwen/Qwen2-72B ของ Qwen เช่นกัน อยู่ในอันดับที่ 3 นอกจากนี้ Qwen ยังติดอันดับที่ 10 และ 11 ด้วย (Qwen/Qwen1.5-110B และ Qwen/Qwen1.5-110B-Chat)

ในการทดสอบนี้ไม่มี ChatGPT ของ OpenAI รวมอยู่ด้วย เนื่องจากเป็นโมเดล LLM แบบปิด ซึ่ง Hugging Face ให้เหตุผลว่าเพราะจะไม่สามารถทำซ้ำผลทดสอบได้

Clem Delangue ซีอีโอ Hugging Face ให้ข้อมูลเพิ่มเติมว่า การทดสอบนี้ใช้จีพียู H100 ของ NVIDIA 300 ตัว ในการประมวลผล และพบเรื่องน่าสนใจเช่น การทดสอบจากนี้จะมีแต่ซับซ้อนและยากมากขึ้น และโมเดลขนาดใหญ่พารามิเตอร์เยอะ ไม่ได้แปลว่าจะฉลาดกว่าเสมอไป

ที่มา: Hugging Face

No Description

ผลการจัดอันดับ (ดูทั้งหมดที่นี่)

No Description


[ad_2]
Source link

https://www.blognone.com/node/140653