توانمندسازی وبلاگ نویسان: چگونه CyberAgent هوش مصنوعی داخلی را برای افزایش تولید محتوا به کار گرفت

یوریکو هیروتا
Yuriko Hirota
کازوناری هارا
Kazunari Hara

منتشر شده: ۲۸ آوریل ۲۰۲۵، آخرین به‌روزرسانی: ۲۱ مه ۲۰۲۵

تکامل سریع هوش مصنوعی، به ویژه با ظهور قابلیت‌های روی دستگاه، مرزهای جدیدی را برای برنامه‌های وب باز می‌کند. ببینید که چگونه CyberAgent، یک شرکت اینترنتی پیشرو ژاپنی، از هوش مصنوعی داخلی کروم و Prompt API برای بهبود تجربه وبلاگ‌نویسی در پلتفرم خود، Ameba Blog، استفاده می‌کند.

ما اهداف آنها، مزایای کار با هوش مصنوعی داخلی، چالش‌هایی که با آنها روبرو بودند و بینش‌های ارزشمندی را برای سایر توسعه‌دهندگانی که از هوش مصنوعی داخلی استفاده می‌کنند، به اشتراک می‌گذاریم.

رابط برنامه‌نویسی کاربردی (API) پرومپ چیست؟

توضیح دهنده وب افزونه‌ها وضعیت کروم قصد
گیت‌هاب محاکمه مبدا محاکمه مبدا کروم ۱۳۸ مشاهده قصد آزمایش

API Prompt به توسعه‌دهندگان کمک می‌کند تا از مدل‌های زبانی بزرگ برای افزودن مستقیم ویژگی‌های هوش مصنوعی به برنامه‌های خود استفاده کنند. با تعریف اعلان‌های سفارشی، برنامه‌ها می‌توانند وظایفی مانند استخراج داده‌ها، تولید محتوا و پاسخ‌های شخصی‌سازی‌شده را انجام دهند. در کروم، API Prompt با Gemini Nano استنتاج سمت کلاینت را انجام می‌دهد. این پردازش محلی، صرف نظر از اینکه از چه مدلی استفاده می‌شود، حریم خصوصی داده‌ها و سرعت پاسخ را افزایش می‌دهد. هر مدلی که استفاده شود، سرعت پاسخ کلاینت را افزایش می‌دهد.

کمک هوش مصنوعی برای نویسندگان وبلاگ Ameba

CyberAgent یک نقطه درد مشترک برای نویسندگان را تشخیص داد: فرآیند اغلب زمان‌بر تولید محتوای جذاب، به ویژه عناوین. آنها فرض کردند که ادغام عملکردهای مبتنی بر هوش مصنوعی در رابط کاربری ایجاد وبلاگ می‌تواند کیفیت و کارایی تولید محتوا را به میزان قابل توجهی بهبود بخشد. هدف آنها ارائه ابزارهایی بود که الهام‌بخش باشند و به وبلاگ‌نویسان خود در ایجاد محتوای جذاب کمک کنند.

CyberAgent یک افزونه کروم با رابط برنامه‌نویسی کاربردی Prompt توسعه داد. این افزونه مجموعه‌ای از ویژگی‌های مبتنی بر هوش مصنوعی را ارائه می‌دهد که برای کمک به نویسندگان وبلاگ Ameba در ایجاد عناوین و سرتیترها، پاراگراف‌های بعدی و بهبودهای کلی در متن طراحی شده‌اند.

CyberAgent به دنبال انعطاف‌پذیری در قابلیت‌ها بود که مستقیماً به Prompt API منجر شد. با امکانات بی‌نهایت در یک API، CyberAgent توانست دقیقاً مشخص کند که چه چیزی برای نویسندگان Ameba بهترین عملکرد را دارد و مفیدترین است.

CyberAgent این افزونه را با تعدادی از وبلاگ‌نویسان منتخب آزمایش کرد که بینش‌های ارزشمندی در مورد عملی بودن عملکردهای ارائه شده ارائه داد. بازخوردها به CyberAgent کمک کرد تا کاربردهای بهتری را برای کمک هوش مصنوعی شناسایی کند و طراحی افزونه را اصلاح کند. بر اساس نتایج مثبت و بازخوردها، CyberAgent به دنبال انتشار این ویژگی در آینده است و قدرت هوش مصنوعی سمت کلاینت را مستقیماً به جامعه وبلاگ‌نویسی خود می‌آورد.

بیایید نگاهی دقیق‌تر به این ویژگی‌ها بیندازیم.

عنوان‌ها و تیترهای بهتری بنویسید

این افزونه بر اساس محتوای کامل وبلاگ، چندین پیشنهاد عنوان ارائه می‌دهد. نویسندگان وبلاگ می‌توانند این پیشنهادها را با گزینه‌هایی مانند «بازسازی»، «مودب‌تر»، «غیررسمی‌تر» یا «ایجاد عناوین مشابه» و موارد دیگر، بیشتر اصلاح کنند.

CyberAgent رابط کاربری را به طور خاص طراحی کرده است تا کاربران مجبور به نوشتن هیچ دستورالعملی نباشند. به این ترتیب، هر کاربری که با مهندسی دستورالعمل ناآشنا باشد نیز می‌تواند از قدرت هوش مصنوعی بهره‌مند شود.

نویسندگان می‌توانند عناوین را طوری بازسازی کنند که رسمی‌تر، غیررسمی‌تر یا با همان لحن قبلی باشند.

این افزونه همچنین می‌تواند برای بخش‌های مختلف وبلاگ، سربرگ‌های جذابی ایجاد کند که نویسندگان می‌توانند با انتخاب متن مربوطه برای هر سربرگ، درخواست آن را بدهند.

با انتخاب متن، نویسندگان می‌توانند سرفصل‌های مختص آن بخش را ایجاد کنند.

کدی که برای تولید عنوان با استفاده از Prompt API استفاده می‌شود، شامل یک اعلان اولیه و یک اعلان کاربر است. اعلان اولیه زمینه و دستورالعمل‌هایی را برای دریافت نوع خاصی از خروجی ارائه می‌دهد، در حالی که اعلان‌های کاربر از مدل می‌خواهند که با آنچه کاربر می‌نویسد، تعامل داشته باشد. برای اطلاعات بیشتر در مورد کد آنها به Deploy AI assistance مراجعه کنید.

پاراگراف‌های بعدی را ایجاد کنید

این افزونه با تولید پاراگراف‌های بعدی بر اساس متن انتخاب‌شده، به وبلاگ‌نویسان کمک می‌کند تا بر بن‌بست نویسندگی غلبه کنند. هوش مصنوعی با استفاده از متن پاراگراف قبلی، ادامه پاراگراف را پیش‌نویس می‌کند و به نویسندگان اجازه می‌دهد جریان خلاقانه خود را حفظ کنند.

نویسنده می‌تواند برای نوشتن پاراگراف بعدی، با توجه به متن پاراگراف قبلی، درخواست کمک کند.

بهبود و ویرایش متن

جمینی نانو متن انتخاب‌شده را تجزیه و تحلیل می‌کند و می‌تواند پیشنهادهایی برای بهبود آن ارائه دهد. کاربران می‌توانند با یادداشت‌های اضافی در مورد لحن و انتخاب زبان، بهبودها را بازسازی کنند تا متن «جذاب‌تر» یا «ساده‌تر» شود.

یک نسخه بهبود یافته از متن انتخاب شده را به همراه توضیحی در مورد اینکه مدل چه چیزی را بهبود بخشیده است، تولید کنید.

استقرار کمک هوش مصنوعی

CyberAgent کد افزونه خود را به سه مرحله تقسیم کرد: ایجاد جلسه، فعال‌سازی و فراخوانی مدل.

ابتدا، آنها با مرورگر بررسی می‌کنند که آیا هوش مصنوعی داخلی در دسترس و پشتیبانی می‌شود یا خیر. اگر بله، یک جلسه با پارامترهای پیش‌فرض ایجاد می‌کنند.

if (!LanguageModel) {
  // Detect the feature and display "Not Supported" message as needed
  return;
}
// Define default values for topK and temperature within the application
const DEFAULT_TOP_K = 3;
const DEFAULT_TEMPERATURE = 1;
let session = null;

async function createAISession({ initialPrompts, topK, temperature } = {}) {
  const { available, defaultTopK, maxTopK, defaultTemperature } =
    await LanguageModel.availability();
  // "readily", "after-download", or "no"
  if (available === "no") {
    return Promise.reject(new Error('AI not available'));
  }
  const params = {
    monitor(monitor) {
      monitor.addEventListener('downloadprogress', event => {
        console.log(`Downloaded: ${event.loaded} of ${event.total} bytes.`);
      });
    },
    initialPrompts: initialPrompts || '',
    topK: topK || defaultTopK,
    temperature: temperature || defaultTemperature,
  };
  session = await LanguageModel.create(params);
  return session;
}

هر ویژگی یک تابع کمکی دارد که توسط کاربر فعال می‌شود. پس از فعال شدن، وقتی کاربر روی دکمه مربوطه کلیک می‌کند، جلسه (session) را بر اساس آن به‌روزرسانی می‌کند.

async function updateSession({ initialPrompts, topK, temperature } = {
  topK: DEFAULT_TOP_K,
  temperature: DEFAULT_TEMPERATURE,
}) {
  if (session) {
    session.destroy();
    session = null;
  }
  session = await createAISession({
    initialPrompts,
    topK,
    temperature,
  });
}

پس از به‌روزرسانی جلسه، آنها مدل را طبق تابع فراخوانی می‌کنند. برای مثال، در اینجا کدی برای تولید یک عنوان و بازسازی عنوان با لحنی رسمی‌تر آمده است.

async function generateTitle() {
    // Initialize the model session
    await updateSession({
      initialPrompts: [
        { role: 'system', 
          content: `Create 3 titles suitable for the blog post's content,
          within 128 characters, and respond in JSON array format.`,
        }
      ]
    });
    const prompt = `Create a title for the following
    blog post.${textareaEl.textContent}`;
    const result = await session.prompt(prompt);
    try {
      const fixedJson = fixJSON(result);
      // display result
      displayResult(fixedJSON);
    } catch (error) {
      // display error
      displayError();
    }
  }
  async function generateMoreFormalTitle() {
    // Do not execute updateSession to reuse the session during regeneration
    const prompt = 'Create a more formal title.';
    const result = await session.prompt(prompt);
    ...
 }

مزایای هوش مصنوعی داخلی

هوش مصنوعی داخلی نوعی هوش مصنوعی سمت کلاینت است، به این معنی که استنتاج در دستگاه کاربر رخ می‌دهد. CyberAgent به دلیل مزایای قانع‌کننده‌ای که Gemini Nano برای توسعه‌دهندگان برنامه و کاربران ارائه می‌دهد، تصمیم به استفاده از APIهای هوش مصنوعی داخلی گرفته است.

مزایای کلیدی که CyberAgent بر آنها تمرکز دارد عبارتند از:

  • امنیت و حریم خصوصی
  • هزینه
  • پاسخگویی و قابلیت اطمینان
  • سهولت توسعه

امنیت و حریم خصوصی

قابلیت اجرای مدل‌های هوش مصنوعی به طور مستقیم روی دستگاه کاربر بدون انتقال داده‌ها به سرورهای خارجی بسیار مهم است. پیش‌نویس‌های وبلاگ قرار نیست توسط عموم دیده شوند و بنابراین، CyberAgent نمی‌خواهد این پیش‌نویس‌ها را به یک سرور شخص ثالث ارسال کند.

هوش مصنوعی داخلی، Gemini Nano را روی دستگاه‌های کاربر دانلود می‌کند و نیاز به ارسال و دریافت داده‌ها از سرورها را از بین می‌برد. این امر به ویژه هنگام نوشتن مفید است، زیرا پیش‌نویس‌ها ممکن است شامل اطلاعات محرمانه یا عبارات ناخواسته باشند. هوش مصنوعی داخلی، محتوای اصلی و تولید شده را به جای ارسال به سرور، در محل خود نگه می‌دارد که می‌تواند امنیت را افزایش داده و از حریم خصوصی محتوا محافظت کند.

صرفه‌جویی در هزینه‌ها

یکی از مزایای اصلی استفاده از هوش مصنوعی داخلی این است که مرورگر شامل Gemini Nano می‌شود و استفاده از APIها رایگان است. هیچ هزینه اضافی یا پنهانی وجود ندارد.

هوش مصنوعی داخلی به طور قابل توجهی هزینه‌های سرور را کاهش می‌دهد و می‌تواند هزینه‌های مرتبط با استنتاج هوش مصنوعی را به طور کامل حذف کند. این راهکار می‌تواند به سرعت برای یک پایگاه کاربری بزرگ قابل مقیاس‌بندی باشد و به کاربران اجازه می‌دهد تا بدون متحمل شدن هزینه‌های اضافی، درخواست‌های متوالی برای اصلاح خروجی‌ها ارسال کنند.

پاسخگویی و قابلیت اطمینان

هوش مصنوعی داخلی، زمان پاسخگویی ثابت و سریعی را مستقل از شرایط شبکه فراهم می‌کند. این امر به کاربران امکان می‌دهد بارها و بارها محتوا تولید کنند، که این امر امتحان کردن ایده‌های جدید و ایجاد نتیجه نهایی رضایت‌بخش را برای کاربران بسیار آسان‌تر می‌کند.

سهولت توسعه

هوش مصنوعی داخلی کروم با ارائه یک API در دسترس، فرآیند توسعه را ساده می‌کند. توسعه‌دهندگان از سهولت ایجاد ویژگی‌های مبتنی بر هوش مصنوعی برای برنامه خود بهره‌مند می‌شوند.

Gemini Nano و APIهای هوش مصنوعی داخلی آن در کروم نصب شده‌اند، بنابراین نیازی به تنظیمات اضافی یا مدیریت مدل نیست. APIها مانند سایر APIهای مرورگر از جاوا اسکریپت استفاده می‌کنند و نیازی به تخصص در یادگیری ماشین ندارند.

سفر CyberAgent با Prompt API درس‌های ارزشمندی در مورد ظرافت‌های کار با LLM های سمت کلاینت ارائه داد.

  • پاسخ‌های متناقض : مانند سایر LLMها، Gemini Nano خروجی‌های یکسان را برای یک درخواست یکسان تضمین نمی‌کند. CyberAgent با پاسخ‌هایی در قالب‌های غیرمنتظره (مانند Markdown و JSON نامعتبر) مواجه شد. حتی با وجود دستورالعمل‌ها، ممکن است نتایج بسیار متفاوت باشند. هنگام پیاده‌سازی هر برنامه یا افزونه Chrome با هوش مصنوعی داخلی، اضافه کردن یک راه حل برای اطمینان از اینکه خروجی همیشه در قالب صحیح است، می‌تواند مفید باشد.
  • محدودیت توکن : مدیریت استفاده از توکن بسیار مهم است. CyberAgent از ویژگی‌ها و متدهایی مانند inputUsage ، inputQuota و measureInputUsage() برای مدیریت جلسات ، حفظ زمینه و کاهش مصرف توکن استفاده می‌کرد. این امر به ویژه هنگام اصلاح عناوین اهمیت داشت.
  • محدودیت‌های اندازه مدل : از آنجایی که مدل دانلود شده و روی دستگاه کاربر قرار می‌گیرد، به طور قابل توجهی کوچکتر از یک مدل مبتنی بر سرور است. این بدان معناست که ارائه زمینه کافی در اعلان برای دستیابی به نتایج رضایت‌بخش، به ویژه برای خلاصه‌سازی، بسیار مهم است. درباره درک اندازه‌های LLM بیشتر بدانید.

CyberAgent تأکید می‌کند که اگرچه مدل‌های سمت کلاینت هنوز به طور جهانی در همه مرورگرها و دستگاه‌ها در دسترس نیستند و مدل‌های کوچک‌تر محدودیت‌هایی دارند، اما همچنان می‌تواند عملکرد چشمگیری را برای وظایف خاص ارائه دهد. توانایی تکرار سریع و آزمایش بدون هزینه‌های سمت سرور، آن را به ابزاری ارزشمند تبدیل می‌کند.

آنها توصیه می‌کنند که تعادل برقرار شود، و اذعان دارند که دستیابی به پاسخ‌های بی‌نقص با هر نوع هوش مصنوعی، چه سمت سرور و چه سمت کلاینت، دشوار است. در نهایت، آنها آینده‌ای را می‌بینند که در آن یک رویکرد ترکیبی، با ترکیب نقاط قوت هوش مصنوعی سمت سرور و سمت کلاینت، پتانسیل حتی بیشتری را آزاد خواهد کرد.

با نگاهی به آینده

کاوش CyberAgent در هوش مصنوعی داخلی، امکانات هیجان‌انگیز ادغام‌های یکپارچه هوش مصنوعی را برای بهبود تجربیات کاربر به نمایش می‌گذارد. افزونه‌ای که برای کار با Ameba Blog ساخته شده است، نشان می‌دهد که چگونه می‌توان این فناوری‌ها را عملاً برای حل مشکلات دنیای واقعی به کار برد و درس‌های ارزشمندی را برای جامعه گسترده‌تر توسعه وب ارائه می‌دهد.

با بلوغ فناوری و گسترش پشتیبانی از مرورگرها و دستگاه‌ها، انتظار داریم شاهد کاربردهای نوآورانه‌تری از هوش مصنوعی داخلی و سایر اشکال هوش مصنوعی سمت کلاینت باشیم.

منابع

تقدیرنامه‌ها

با تشکر از وبلاگ‌نویسان Ameba، ao ، Nodoka ، Erin ، Chiaki و socchi که بازخورد خود را ارائه دادند و به بهبود افزونه کمک کردند. با تشکر از Thomas Steiner ، Alexandra Klepper و Sebastian Benz برای کمکشان در نوشتن و بررسی این پست وبلاگ.