منتشر شده: ۲۸ آوریل ۲۰۲۵، آخرین بهروزرسانی: ۲۱ مه ۲۰۲۵

تکامل سریع هوش مصنوعی، به ویژه با ظهور قابلیتهای روی دستگاه، مرزهای جدیدی را برای برنامههای وب باز میکند. ببینید که چگونه CyberAgent، یک شرکت اینترنتی پیشرو ژاپنی، از هوش مصنوعی داخلی کروم و Prompt API برای بهبود تجربه وبلاگنویسی در پلتفرم خود، Ameba Blog، استفاده میکند.
ما اهداف آنها، مزایای کار با هوش مصنوعی داخلی، چالشهایی که با آنها روبرو بودند و بینشهای ارزشمندی را برای سایر توسعهدهندگانی که از هوش مصنوعی داخلی استفاده میکنند، به اشتراک میگذاریم.
رابط برنامهنویسی کاربردی (API) پرومپ چیست؟
| توضیح دهنده | وب | افزونهها | وضعیت کروم | قصد |
|---|---|---|---|---|
| گیتهاب | مشاهده | قصد آزمایش |
API Prompt به توسعهدهندگان کمک میکند تا از مدلهای زبانی بزرگ برای افزودن مستقیم ویژگیهای هوش مصنوعی به برنامههای خود استفاده کنند. با تعریف اعلانهای سفارشی، برنامهها میتوانند وظایفی مانند استخراج دادهها، تولید محتوا و پاسخهای شخصیسازیشده را انجام دهند. در کروم، API Prompt با Gemini Nano استنتاج سمت کلاینت را انجام میدهد. این پردازش محلی، صرف نظر از اینکه از چه مدلی استفاده میشود، حریم خصوصی دادهها و سرعت پاسخ را افزایش میدهد. هر مدلی که استفاده شود، سرعت پاسخ کلاینت را افزایش میدهد.
کمک هوش مصنوعی برای نویسندگان وبلاگ Ameba
CyberAgent یک نقطه درد مشترک برای نویسندگان را تشخیص داد: فرآیند اغلب زمانبر تولید محتوای جذاب، به ویژه عناوین. آنها فرض کردند که ادغام عملکردهای مبتنی بر هوش مصنوعی در رابط کاربری ایجاد وبلاگ میتواند کیفیت و کارایی تولید محتوا را به میزان قابل توجهی بهبود بخشد. هدف آنها ارائه ابزارهایی بود که الهامبخش باشند و به وبلاگنویسان خود در ایجاد محتوای جذاب کمک کنند.
CyberAgent یک افزونه کروم با رابط برنامهنویسی کاربردی Prompt توسعه داد. این افزونه مجموعهای از ویژگیهای مبتنی بر هوش مصنوعی را ارائه میدهد که برای کمک به نویسندگان وبلاگ Ameba در ایجاد عناوین و سرتیترها، پاراگرافهای بعدی و بهبودهای کلی در متن طراحی شدهاند.
CyberAgent به دنبال انعطافپذیری در قابلیتها بود که مستقیماً به Prompt API منجر شد. با امکانات بینهایت در یک API، CyberAgent توانست دقیقاً مشخص کند که چه چیزی برای نویسندگان Ameba بهترین عملکرد را دارد و مفیدترین است.
CyberAgent این افزونه را با تعدادی از وبلاگنویسان منتخب آزمایش کرد که بینشهای ارزشمندی در مورد عملی بودن عملکردهای ارائه شده ارائه داد. بازخوردها به CyberAgent کمک کرد تا کاربردهای بهتری را برای کمک هوش مصنوعی شناسایی کند و طراحی افزونه را اصلاح کند. بر اساس نتایج مثبت و بازخوردها، CyberAgent به دنبال انتشار این ویژگی در آینده است و قدرت هوش مصنوعی سمت کلاینت را مستقیماً به جامعه وبلاگنویسی خود میآورد.
بیایید نگاهی دقیقتر به این ویژگیها بیندازیم.
عنوانها و تیترهای بهتری بنویسید
این افزونه بر اساس محتوای کامل وبلاگ، چندین پیشنهاد عنوان ارائه میدهد. نویسندگان وبلاگ میتوانند این پیشنهادها را با گزینههایی مانند «بازسازی»، «مودبتر»، «غیررسمیتر» یا «ایجاد عناوین مشابه» و موارد دیگر، بیشتر اصلاح کنند.
CyberAgent رابط کاربری را به طور خاص طراحی کرده است تا کاربران مجبور به نوشتن هیچ دستورالعملی نباشند. به این ترتیب، هر کاربری که با مهندسی دستورالعمل ناآشنا باشد نیز میتواند از قدرت هوش مصنوعی بهرهمند شود.
این افزونه همچنین میتواند برای بخشهای مختلف وبلاگ، سربرگهای جذابی ایجاد کند که نویسندگان میتوانند با انتخاب متن مربوطه برای هر سربرگ، درخواست آن را بدهند.
کدی که برای تولید عنوان با استفاده از Prompt API استفاده میشود، شامل یک اعلان اولیه و یک اعلان کاربر است. اعلان اولیه زمینه و دستورالعملهایی را برای دریافت نوع خاصی از خروجی ارائه میدهد، در حالی که اعلانهای کاربر از مدل میخواهند که با آنچه کاربر مینویسد، تعامل داشته باشد. برای اطلاعات بیشتر در مورد کد آنها به Deploy AI assistance مراجعه کنید.
پاراگرافهای بعدی را ایجاد کنید
این افزونه با تولید پاراگرافهای بعدی بر اساس متن انتخابشده، به وبلاگنویسان کمک میکند تا بر بنبست نویسندگی غلبه کنند. هوش مصنوعی با استفاده از متن پاراگراف قبلی، ادامه پاراگراف را پیشنویس میکند و به نویسندگان اجازه میدهد جریان خلاقانه خود را حفظ کنند.
بهبود و ویرایش متن
جمینی نانو متن انتخابشده را تجزیه و تحلیل میکند و میتواند پیشنهادهایی برای بهبود آن ارائه دهد. کاربران میتوانند با یادداشتهای اضافی در مورد لحن و انتخاب زبان، بهبودها را بازسازی کنند تا متن «جذابتر» یا «سادهتر» شود.
استقرار کمک هوش مصنوعی
CyberAgent کد افزونه خود را به سه مرحله تقسیم کرد: ایجاد جلسه، فعالسازی و فراخوانی مدل.
ابتدا، آنها با مرورگر بررسی میکنند که آیا هوش مصنوعی داخلی در دسترس و پشتیبانی میشود یا خیر. اگر بله، یک جلسه با پارامترهای پیشفرض ایجاد میکنند.
if (!LanguageModel) {
// Detect the feature and display "Not Supported" message as needed
return;
}
// Define default values for topK and temperature within the application
const DEFAULT_TOP_K = 3;
const DEFAULT_TEMPERATURE = 1;
let session = null;
async function createAISession({ initialPrompts, topK, temperature } = {}) {
const { available, defaultTopK, maxTopK, defaultTemperature } =
await LanguageModel.availability();
// "readily", "after-download", or "no"
if (available === "no") {
return Promise.reject(new Error('AI not available'));
}
const params = {
monitor(monitor) {
monitor.addEventListener('downloadprogress', event => {
console.log(`Downloaded: ${event.loaded} of ${event.total} bytes.`);
});
},
initialPrompts: initialPrompts || '',
topK: topK || defaultTopK,
temperature: temperature || defaultTemperature,
};
session = await LanguageModel.create(params);
return session;
}
هر ویژگی یک تابع کمکی دارد که توسط کاربر فعال میشود. پس از فعال شدن، وقتی کاربر روی دکمه مربوطه کلیک میکند، جلسه (session) را بر اساس آن بهروزرسانی میکند.
async function updateSession({ initialPrompts, topK, temperature } = {
topK: DEFAULT_TOP_K,
temperature: DEFAULT_TEMPERATURE,
}) {
if (session) {
session.destroy();
session = null;
}
session = await createAISession({
initialPrompts,
topK,
temperature,
});
}
پس از بهروزرسانی جلسه، آنها مدل را طبق تابع فراخوانی میکنند. برای مثال، در اینجا کدی برای تولید یک عنوان و بازسازی عنوان با لحنی رسمیتر آمده است.
async function generateTitle() {
// Initialize the model session
await updateSession({
initialPrompts: [
{ role: 'system',
content: `Create 3 titles suitable for the blog post's content,
within 128 characters, and respond in JSON array format.`,
}
]
});
const prompt = `Create a title for the following
blog post.${textareaEl.textContent}`;
const result = await session.prompt(prompt);
try {
const fixedJson = fixJSON(result);
// display result
displayResult(fixedJSON);
} catch (error) {
// display error
displayError();
}
}
async function generateMoreFormalTitle() {
// Do not execute updateSession to reuse the session during regeneration
const prompt = 'Create a more formal title.';
const result = await session.prompt(prompt);
...
}
مزایای هوش مصنوعی داخلی
هوش مصنوعی داخلی نوعی هوش مصنوعی سمت کلاینت است، به این معنی که استنتاج در دستگاه کاربر رخ میدهد. CyberAgent به دلیل مزایای قانعکنندهای که Gemini Nano برای توسعهدهندگان برنامه و کاربران ارائه میدهد، تصمیم به استفاده از APIهای هوش مصنوعی داخلی گرفته است.
مزایای کلیدی که CyberAgent بر آنها تمرکز دارد عبارتند از:
- امنیت و حریم خصوصی
- هزینه
- پاسخگویی و قابلیت اطمینان
- سهولت توسعه
امنیت و حریم خصوصی
قابلیت اجرای مدلهای هوش مصنوعی به طور مستقیم روی دستگاه کاربر بدون انتقال دادهها به سرورهای خارجی بسیار مهم است. پیشنویسهای وبلاگ قرار نیست توسط عموم دیده شوند و بنابراین، CyberAgent نمیخواهد این پیشنویسها را به یک سرور شخص ثالث ارسال کند.
هوش مصنوعی داخلی، Gemini Nano را روی دستگاههای کاربر دانلود میکند و نیاز به ارسال و دریافت دادهها از سرورها را از بین میبرد. این امر به ویژه هنگام نوشتن مفید است، زیرا پیشنویسها ممکن است شامل اطلاعات محرمانه یا عبارات ناخواسته باشند. هوش مصنوعی داخلی، محتوای اصلی و تولید شده را به جای ارسال به سرور، در محل خود نگه میدارد که میتواند امنیت را افزایش داده و از حریم خصوصی محتوا محافظت کند.
صرفهجویی در هزینهها
یکی از مزایای اصلی استفاده از هوش مصنوعی داخلی این است که مرورگر شامل Gemini Nano میشود و استفاده از APIها رایگان است. هیچ هزینه اضافی یا پنهانی وجود ندارد.
هوش مصنوعی داخلی به طور قابل توجهی هزینههای سرور را کاهش میدهد و میتواند هزینههای مرتبط با استنتاج هوش مصنوعی را به طور کامل حذف کند. این راهکار میتواند به سرعت برای یک پایگاه کاربری بزرگ قابل مقیاسبندی باشد و به کاربران اجازه میدهد تا بدون متحمل شدن هزینههای اضافی، درخواستهای متوالی برای اصلاح خروجیها ارسال کنند.
پاسخگویی و قابلیت اطمینان
هوش مصنوعی داخلی، زمان پاسخگویی ثابت و سریعی را مستقل از شرایط شبکه فراهم میکند. این امر به کاربران امکان میدهد بارها و بارها محتوا تولید کنند، که این امر امتحان کردن ایدههای جدید و ایجاد نتیجه نهایی رضایتبخش را برای کاربران بسیار آسانتر میکند.
سهولت توسعه
هوش مصنوعی داخلی کروم با ارائه یک API در دسترس، فرآیند توسعه را ساده میکند. توسعهدهندگان از سهولت ایجاد ویژگیهای مبتنی بر هوش مصنوعی برای برنامه خود بهرهمند میشوند.
Gemini Nano و APIهای هوش مصنوعی داخلی آن در کروم نصب شدهاند، بنابراین نیازی به تنظیمات اضافی یا مدیریت مدل نیست. APIها مانند سایر APIهای مرورگر از جاوا اسکریپت استفاده میکنند و نیازی به تخصص در یادگیری ماشین ندارند.
پیمایش چالشها برای نتایج بهتر
سفر CyberAgent با Prompt API درسهای ارزشمندی در مورد ظرافتهای کار با LLM های سمت کلاینت ارائه داد.
- پاسخهای متناقض : مانند سایر LLMها، Gemini Nano خروجیهای یکسان را برای یک درخواست یکسان تضمین نمیکند. CyberAgent با پاسخهایی در قالبهای غیرمنتظره (مانند Markdown و JSON نامعتبر) مواجه شد. حتی با وجود دستورالعملها، ممکن است نتایج بسیار متفاوت باشند. هنگام پیادهسازی هر برنامه یا افزونه Chrome با هوش مصنوعی داخلی، اضافه کردن یک راه حل برای اطمینان از اینکه خروجی همیشه در قالب صحیح است، میتواند مفید باشد.
- محدودیت توکن : مدیریت استفاده از توکن بسیار مهم است. CyberAgent از ویژگیها و متدهایی مانند
inputUsage،inputQuotaوmeasureInputUsage()برای مدیریت جلسات ، حفظ زمینه و کاهش مصرف توکن استفاده میکرد. این امر به ویژه هنگام اصلاح عناوین اهمیت داشت. - محدودیتهای اندازه مدل : از آنجایی که مدل دانلود شده و روی دستگاه کاربر قرار میگیرد، به طور قابل توجهی کوچکتر از یک مدل مبتنی بر سرور است. این بدان معناست که ارائه زمینه کافی در اعلان برای دستیابی به نتایج رضایتبخش، به ویژه برای خلاصهسازی، بسیار مهم است. درباره درک اندازههای LLM بیشتر بدانید.
CyberAgent تأکید میکند که اگرچه مدلهای سمت کلاینت هنوز به طور جهانی در همه مرورگرها و دستگاهها در دسترس نیستند و مدلهای کوچکتر محدودیتهایی دارند، اما همچنان میتواند عملکرد چشمگیری را برای وظایف خاص ارائه دهد. توانایی تکرار سریع و آزمایش بدون هزینههای سمت سرور، آن را به ابزاری ارزشمند تبدیل میکند.
آنها توصیه میکنند که تعادل برقرار شود، و اذعان دارند که دستیابی به پاسخهای بینقص با هر نوع هوش مصنوعی، چه سمت سرور و چه سمت کلاینت، دشوار است. در نهایت، آنها آیندهای را میبینند که در آن یک رویکرد ترکیبی، با ترکیب نقاط قوت هوش مصنوعی سمت سرور و سمت کلاینت، پتانسیل حتی بیشتری را آزاد خواهد کرد.
با نگاهی به آینده
کاوش CyberAgent در هوش مصنوعی داخلی، امکانات هیجانانگیز ادغامهای یکپارچه هوش مصنوعی را برای بهبود تجربیات کاربر به نمایش میگذارد. افزونهای که برای کار با Ameba Blog ساخته شده است، نشان میدهد که چگونه میتوان این فناوریها را عملاً برای حل مشکلات دنیای واقعی به کار برد و درسهای ارزشمندی را برای جامعه گستردهتر توسعه وب ارائه میدهد.
با بلوغ فناوری و گسترش پشتیبانی از مرورگرها و دستگاهها، انتظار داریم شاهد کاربردهای نوآورانهتری از هوش مصنوعی داخلی و سایر اشکال هوش مصنوعی سمت کلاینت باشیم.
منابع
- درباره API سریع بیشتر بدانید
- شروع به استفاده از APIهای داخلی در کروم کنید
- مطالعه موردی CyberAgent در مورد هوش مصنوعی وب ، که همین موضوع را پوشش میدهد.
- تماشا کنید: آینده هوش مصنوعی همین الان است ، مطالعات موردی CyberAgent در مورد هوش مصنوعی سمت کلاینت
تقدیرنامهها
با تشکر از وبلاگنویسان Ameba، ao ، Nodoka ، Erin ، Chiaki و socchi که بازخورد خود را ارائه دادند و به بهبود افزونه کمک کردند. با تشکر از Thomas Steiner ، Alexandra Klepper و Sebastian Benz برای کمکشان در نوشتن و بررسی این پست وبلاگ.