123-2341-74

แนะนำ เทคนิคลดค่าครองชีพ
ทุกครั้ง ที่ ซื้อ ของจาก marketplace อย่าลืม กดรับคูปอง และเช็คโปรโมชั่น บัตรเครดิต ก่อน กดจ่ายเงินทุกครั้ง

กดรับ คูปอง
ก่อนจ่ายเงินทุกครั้ง อยากลืม

เทคนิคลดค่าครองชีพ
ทุกครั้ง ที่ ซื้อ ของจาก marketplace อย่าลืม กดรับคูปอง และเช็คโปรโมชั่น บัตรเครดิต ก่อน กดจ่ายเงินทุกครั้ง

กดรับ คูปอง
VISTEC เปิดฝึก LLM ไทย 5,014 ชุด เพิ่มเป้าหมาย 40,000 ชุด

VISTEC เปิดฝึก LLM ไทย 5,014 ชุด เพิ่มเป้าหมาย 40,000 ชุด

[ad_1]

บทเรียนที่ควรรู้

1. ชุดข้อมูล WangchanThaiInstruct สำหรับ fine-tuning โมเดล LLM

บทความนี้เกี่ยวกับการปล่อยชุดข้อมูล WangchanThaiInstruct ที่สร้างโดยมนุษย์ทั้งหมดและเปิดให้ใช้งานได้เสรี โดยครอบคลุมทั้งหัวข้อทางการแพทย์, การเงิน, การค้า, และกฎหมาย ชุดข้อมูลนี้สามารถใช้ในการ fine-tuning โมเดล LLM ในการปรับปรุงประสิทธิภาพของโมเดล

2. เพิ่มชุดข้อมูลทุกเดือนจนครบ 40,000 รายการ

สถาบัน VISTEC ได้ประกาศว่าจะเพิ่มชุดข้อมูลใหม่ทุกเดือนจนครบ 40,000 รายการ เพื่อเสริมความครอบคลุมและคุณภาพของชุดข้อมูล WangchanThaiInstruct

ปัญหาและวิธีการแก้ไข

1. ปัญหาการจัดหมวดหมู่ข้อมูล

ปัญหาที่อาจเกิดขึ้นคือการจัดหมวดหมู่ข้อมูลไม่ถูกต้องหรือไม่ครอบคลุม วิธีการแก้ไขคือการตรวจสอบและปรับปรุงระบบจัดหมวดหมู่เพื่อให้ได้ผลลัพธ์ที่แม่นยำที่สุด

2. ปัญหาการเลือกคำตอบจากตัวเลือก

อีกปัญหาที่อาจเกิดขึ้นคือการเลือกคำตอบจากตัวเลือกไม่ถูกต้อง วิธีการแก้ไขคือการพัฒนาระบบเลือกคำตอบที่มีประสิทธิภาพและแม่นยำมากขึ้น

คำถามที่ถามบ่อย

1. ชุดข้อมูล WangchanThaiInstruct สร้างโดยใคร?

2. มีทั้งหมดกี่ประเภทของงานในชุดข้อมูล?

3. เว็บไซต์จากที่มาของข้อมูลคืออะไร?

เว็บไซต์ที่เกี่ยวข้อง

1. Facebook: VISTEC

2. HuggingFace

คำค้นหาที่เกี่ยวข้อง

1. การ fine-tuning โมเดล LLM

2. ชุดข้อมูล WangchanThaiInstruct

3. โมเดล LLM

4. การปรับปรุงโมเดล

5. วิธีการจัดหมวดหมู่ข้อมูล

สถาบันวิทยสิริเมธี หรือ VISTEC ประกาศปล่อยชุดข้อมูล WangchanThaiInstruct สำหรับทำ fine-tuning โมเดล LLM ชุดแรก โดยรวม 5,014 ชุด ครอบคลุมทั้งหัวข้อทางการแพทย์, การเงิน, การค้า, และกฎหมาย เป็นชุดข้อมูลที่สร้างโดยมนุษย์ทั้งหมด (human-annotated) พร้อมกับเปิดให้ใช้งานได้เสรีแบบ CC-BY-SA 4.0

ชุดข้อมูลแยกงาน 7 ประเภท ได้แก่ การสรุปข้อความ, ตอบคำถามจากข้อมูลที่ให้ไป, ตอบคำถามจากความรู้ที่รู้อยู่ก่อน, จัดหมวดหมู่ข้อมูล, งานเขียนแบบสร้างสรรค์, การระดมความคิด, และการเลือกคำตอบจากตัวเลือก ชุดคำถามนี้อาศัยผู้เชี่ยวชาญเฉพาะทาง ได้แก่ InnovestX, SCB10X, คณะนิติศาสตร์ มหาวิทยาลัยธรรมศาสตร์, และมหาวิทยาลัยมหิดล

คาดว่าจะเพิ่มชุดข้อมูลทุกเดือนจนครบ 40,000 รายการ

ที่มา – Facebook: VISTEC, HuggingFace

No Description


[ad_2]
Source link

https://www.blognone.com/node/140752