กูเกิลเปิดให้ใช้งาน Gemini 1.5 Pro ขนาดอินพุต 2 ล้านโทเคน พร้อมเพิ่ม Context Caching เพื่อลดราคาอินพุต ให้ไม่เกิน 15 คำ

[ad_1]

บทเรียนที่ควรรู้

บทเรียนที่ควรรู้
- 1. ความสำคัญของความยาวอินพุตในโมเดล Gemini 1.5 Pro
  - 2. วิธีการใช้งาน Gemini API ในการลดค่าใช้จ่าย
ปัญหาและวิธีการแก้ไข
- 1. ปัญหาค่าใช้จ่ายเพิ่มขึ้นจากการใช้งานโมเดล Gemini 1.5 Pro
  - 2. ปัญหาการจำค่าจ่ายในการแคชข้อมูล
คำถามที่ถามบ่อย
- 1. ค่าใช้จ่ายในการใช้งานโมเดล Gemini 1.5 Pro มีผลต่อการพัฒนาโมเดลหรือไม่?
  - 2. วิธีการกำหนดจำนวนและระยะเวลาในการแคชข้อมูลใน Gemini API เป็นไปอย่างไร?
  - 3. อินพุตที่ถูกแคชแล้วจะมีผลต่อประสิทธิภาพการประมวลผลข้อมูลหรือไม่?
เวปไซท์ที่เกี่ยวข้อง
คำค้นหาที่เกี่ยวข้อง
สรุป

1. ความสำคัญของความยาวอินพุตในโมเดล Gemini 1.5 Pro

บทความนี้เผยแพร่ข้อมูลเกี่ยวกับการเปิดให้นักพัฒนาใช้งานโมเดล Gemini 1.5 Pro ที่มีความยาวอินพุต 2 ล้านโทเคน ซึ่งเป็นเส้นทางใหม่ที่ช่วยประมวลผลข้อมูลที่ซับซ้อนได้มากยิ่งขึ้น

2. วิธีการใช้งาน Gemini API ในการลดค่าใช้จ่าย

โดยการใช้งาน context caching ผู้ใช้สามารถลดค่าใช้จ่ายในการป้อนข้อมูลที่มีความยาวอินพุตใหญ่ขึ้นลงโดยอัตโนมัติ

ปัญหาและวิธีการแก้ไข

1. ปัญหาค่าใช้จ่ายเพิ่มขึ้นจากการใช้งานโมเดล Gemini 1.5 Pro

การเพิ่มความยาวของอินพุตอาจทำให้ค่าใช้จ่ายเพิ่มขึ้น อย่างไรก็ตามการใช้งาน context caching จะช่วยลดค่าใช้จ่ายลงได้

2. ปัญหาการจำค่าจ่ายในการแคชข้อมูล

ความยาวของอินพุตที่ถูกแคชจะมีราคาถูกกว่าอินพุตใหม่ ผู้ใช้สามารถกำหนดจำนวนและระยะเวลาในการแคชเพื่อลดค่าใช้จ่าย

คำถามที่ถามบ่อย

1. ค่าใช้จ่ายในการใช้งานโมเดล Gemini 1.5 Pro มีผลต่อการพัฒนาโมเดลหรือไม่?

ค่าใช้จ่ายมีผลมากน้อยต่อการพัฒนาโมเดล โดยเฉพาะเมื่อใช้งาน context caching

2. วิธีการกำหนดจำนวนและระยะเวลาในการแคชข้อมูลใน Gemini API เป็นไปอย่างไร?

ผู้ใช้สามารถกำหนดจำนวนโทเคนและระยะเวลาในการแคชได้ตามต้องการ

3. อินพุตที่ถูกแคชแล้วจะมีผลต่อประสิทธิภาพการประมวลผลข้อมูลหรือไม่?

อินพุตที่ถูกแคชจะช่วยลดค่าใช้จ่ายและเพิ่มประสิทธิภาพการประมวลผลข้อมูล

เวปไซท์ที่เกี่ยวข้อง

คำค้นหาที่เกี่ยวข้อง

โมเดล Gemini 1.5 Pro
ความยาวอินพุตในโมเดล AI
context caching ใน Gemini API
ค่าใช้จ่ายในการใช้งานโมเดล AI
วิธีการเพิ่มประสิทธิภาพการประมวลผลข้อมูล

สรุป

บทความนี้เสนอข้อมูลเกี่ยวกับการใช้งานโมเดล Gemini 1.5 Pro ที่เปิดตัวในงาน Google I/O 2024 โดยมีความยาวอินพุต 2 ล้านโทเคน และการใช้งาน context caching เพื่อลดค่าใช้จ่ายในการป้อนข้อมูลที่ซับซ้อนให้โมเดล

กูเกิลเปิดให้นักพัฒนาทั่วไปใช้งานโมเดล Gemini 1.5 Pro ความยาวอินพุต 2 ล้านโทเคน ที่เปิดตัวในงาน Google I/O 2024 เมื่อเดือนพฤษภาคม

การที่ความยาวอินพุต (context window) ใหญ่ขึ้นมาก ทำให้เราสามารถป้อนข้อมูลที่ซับซ้อน เช่น หนังสือทั้งเล่ม หรือไฟล์เอกสารจำนวนมากขององค์กร เข้าไปให้โมเดลช่วยประมวลผลได้เยอะขึ้น (ตัวอย่างการใช้งานคือการสร้างฐานความรู้ขององค์กร เพื่อให้พนักงานเข้ามาสอบถามจากบ็อทได้) อย่างไรก็ตาม สิ่งที่ต้องแลกมาคือค่าใช้จ่ายที่เพิ่มขึ้นจากอินพุตที่ยาวขึ้น ทำให้กูเกิลเพิ่มตัวช่วยคือ context caching เข้ามาใน Gemini API (รองรับทั้ง Gemini 1.5 Pro และ 1.5 Flash) เพื่อลดจำนวนอินพุตที่ซ้ำซ้อนลง อินพุตที่ถูกแคชไว้แล้วจะตั้งราคาถูกกว่าอินพุตใหม่ โดยนักพัฒนาสามารถตั้งค่าจำนวนโทเคนที่ต้องการแคช และระยะเวลาที่ต้องการแคชได้เอง

ตัวอย่างราคาบนหน้าเว็บ Gemini API

อินพุตปกติ = 3.5 ดอลลาร์ต่อ 1 ล้านโทเคน (พรอมต์ยาวไม่เกิน 128K)
อินพุตแคช = 0.875 ดอลลาร์ต่อ 1 ล้านโทเคน (พรอมต์ยาวไม่เกิน 128K)

ที่มา – Google

No Description

[ad_2]
Source link

https://www.blognone.com/node/140635

ล่าสุด