เริ่มต้นใช้งาน AI ในตัว

เผยแพร่เมื่อวันที่ 12 ธันวาคม 2024

AI ในตัวช่วยให้เว็บแอปพลิเคชันทำงานที่ทำงานด้วยระบบ AI ได้โดยไม่ต้องติดตั้งใช้งานหรือจัดการโมเดล AI ของตนเอง ทีม AI ของ Chrome กำลังพัฒนา API แพลตฟอร์มเว็บและฟีเจอร์เบราว์เซอร์สำหรับงานเฉพาะซึ่งผสานรวมโมเดล AI ในเบราว์เซอร์ เรามุ่งมั่นที่จะทำให้ API เหล่านี้ทำงานได้เมื่อติดตั้งใช้งานในเบราว์เซอร์บนอุปกรณ์ของผู้ใช้

ข้อกำหนด

ขณะนี้คุณใช้ API เหล่านี้ได้ใน Chrome เท่านั้น แต่เรามุ่งมั่นที่จะทำให้ API เหล่านี้เป็นมาตรฐานเดียวกันในเบราว์เซอร์ต่างๆ

โมเดล

Prompt API, Summarizer API, Writer API และ Rewriter API จะดาวน์โหลด Gemini Nano ซึ่งออกแบบมาเพื่อทำงานแบบออฟไลน์ในคอมพิวเตอร์เดสก์ท็อปและแล็ปท็อป API เหล่านี้ไม่ทำงานในอุปกรณ์เคลื่อนที่

ปัจจุบัน API เหล่านี้รองรับเฉพาะรูปแบบข้อความเป็นข้อความเท่านั้น

ฮาร์ดแวร์

API การตรวจจับภาษาและการแปลภาษาใช้งานได้ใน Chrome บนเดสก์ท็อปและอุปกรณ์ Android

Prompt API, Summarizer API, Writer API และ Rewriter API จะทำงานใน Chrome ได้เมื่อมีคุณสมบัติตรงตามเงื่อนไขต่อไปนี้

  • ระบบปฏิบัติการ: Windows 10 หรือ 11, macOS 13 ขึ้นไป (Ventura ขึ้นไป) หรือ Linux API ที่ Gemini Nano รองรับยังไม่รองรับ Chrome สำหรับ Android, iOS และ ChromeOS
  • พื้นที่เก็บข้อมูล: อย่างน้อย 22 GB ในวอลุ่มที่มีโปรไฟล์ Chrome
  • GPU: VRAM มากกว่า 4 GB เท่านั้น
  • เครือข่าย: อินเทอร์เน็ตแบบไม่จำกัดหรือการเชื่อมต่อแบบไม่จำกัดปริมาณ

ข้อกำหนดเหล่านี้มีไว้สำหรับคุณในกระบวนการพัฒนาและผู้ใช้ที่ทำงานกับฟีเจอร์ที่คุณสร้างขึ้น

เริ่มสร้าง

มี AI API ในตัวหลายรายการที่พร้อมใช้งานในขั้นตอนการพัฒนาที่แตกต่างกัน บางรายการพร้อมให้บริการแก่นักพัฒนาแอปทุกรายในโปรแกรมทดลองใช้เวอร์ชันต้นทาง ขณะที่รายการอื่นๆ พร้อมให้บริการแก่ผู้เข้าร่วมโปรแกรมทดลองใช้ก่อนเปิดตัวเท่านั้น

API แต่ละรายการมีชุดวิธีการเริ่มต้นใช้งานและดาวน์โหลดโมเดลของตนเอง ทั้งสําหรับการสร้างต้นแบบในเครื่องและในสภาพแวดล้อมเวอร์ชันที่ใช้งานจริงด้วย Origin Trial

แม้ว่า Prompt API จะพร้อมใช้งานในเครื่องและส่วนขยาย Chrome เท่านั้น แต่ API อื่นๆ จะใช้งานได้กับเว็บไซต์และส่วนขยาย Chrome

ใช้ API ใน localhost

API ทั้งหมดมีให้บริการใน localhost ใน Chrome โปรดทำตามขั้นตอนต่อไปนี้

  1. ไปที่ chrome://flags/#prompt-api-for-gemini-nano
  2. เลือกเปิดใช้
  3. คลิกเปิดใหม่หรือรีสตาร์ท Chrome

หากต้องการยืนยันว่า Gemini Nano ดาวน์โหลดและทํางานได้ตามที่ต้องการ ให้เปิดเครื่องมือสําหรับนักพัฒนาซอฟต์แวร์และพิมพ์ await ai.languageModel.availability(); ลงในคอนโซล การดำเนินการนี้ควรแสดงผลเป็น available

แก้ปัญหา localhost

หาก Gemini Nano ไม่ทำงานตามที่คาดไว้ ให้ทำตามขั้นตอนต่อไปนี้

  1. รีสตาร์ท Chrome
  2. ไปที่ chrome://components
  3. ตรวจสอบว่ามีคู่มือการเพิ่มประสิทธิภาพสำหรับรุ่นอุปกรณ์ ซึ่งหมายความว่า Gemini Nano พร้อมใช้งานหรือกำลังดาวน์โหลด
    • หากไม่มีหมายเลขเวอร์ชันแสดงอยู่ ให้คลิกตรวจหาการอัปเดตเพื่อบังคับดาวน์โหลด
  4. เปิดเครื่องมือสำหรับนักพัฒนาเว็บและพิมพ์ ai.languageModel.availability(); ในคอนโซล ซึ่งจะแสดงผลเป็น available

หากจำเป็น ให้รอสักครู่แล้วทำตามขั้นตอนเหล่านี้ซ้ำ

กระบวนการด้านมาตรฐาน

เรากำลังดำเนินการกำหนดมาตรฐาน API เหล่านี้เพื่อให้ใช้งานได้กับเบราว์เซอร์ทุกรุ่น ซึ่งหมายความว่าเราได้เสนอ API ดังกล่าวต่อชุมชนแพลตฟอร์มเว็บและย้าย API ไปยังกลุ่มชุมชน Web Incubator ของ W3C เพื่อพูดคุยกันต่อ

เรากำลังขอความคิดเห็นจาก W3C, Mozilla และ WebKit สำหรับ API แต่ละรายการ

ดูข้อมูลเพิ่มเติมเกี่ยวกับกระบวนการนี้สําหรับ API แต่ละรายการได้ในเอกสารประกอบที่เกี่ยวข้อง

มีส่วนร่วมและแชร์ความคิดเห็น

หากลองใช้ AI ในตัวแล้วมีความคิดเห็น เรายินดีรับฟัง