Back to feed

Changelog Update

Google/Gemini APIAPIv2.0-generate
  • veo-2.0-generate-001 منتشر شد، یک مدل متن و تصویر به ویدیو (GA) که به طور کلی در دسترس است و قادر به تولید ویدیوهای دقیق و با ظرافت هنری است. برای کسب اطلاعات بیشتر، به اسناد Veo مراجعه کنید.
  • gemini-2.0-flash-live-001 ، یک نسخه پیش‌نمایش عمومی از مدل Live API با قابلیت پرداخت فعال، منتشر شد.

    • مدیریت جلسه پیشرفته و قابلیت اطمینان

      • از سرگیری جلسه: جلسات را در صورت بروز اختلالات موقت شبکه فعال نگه دارید. API اکنون از ذخیره‌سازی وضعیت جلسه در سمت سرور (تا 24 ساعت) پشتیبانی می‌کند و امکان اتصال مجدد و از سرگیری از جایی که قطع شده بود را فراهم می‌کند (session_resumption).
      • جلسات طولانی‌تر از طریق فشرده‌سازی متن: تعاملات طولانی‌تر را فراتر از محدودیت‌های زمانی قبلی فعال کنید. فشرده‌سازی پنجره متن را با مکانیزم پنجره کشویی پیکربندی کنید تا به طور خودکار طول متن را مدیریت کند و از خاتمه ناگهانی به دلیل محدودیت‌های متن جلوگیری کند.
      • اعلان قطع اتصال با ظرافت: یک پیام از سرور GoAway دریافت کنید که نشان می‌دهد چه زمانی اتصال در شرف بسته شدن است و امکان مدیریت دقیق قبل از خاتمه را فراهم می‌کند.
    • کنترل بیشتر بر دینامیک تعامل

    • تشخیص فعالیت صوتی قابل تنظیم (VAD): سطوح حساسیت را انتخاب کنید یا VAD خودکار را به طور کامل غیرفعال کنید و از رویدادهای جدید کلاینت ( activityStart ، activityEnd ) برای کنترل دستی چرخش استفاده کنید.

    • مدیریت وقفه‌های قابل تنظیم: تصمیم بگیرید که آیا ورودی کاربر باید پاسخ مدل را قطع کند یا خیر.

    • پوشش نوبت قابل تنظیم: انتخاب کنید که آیا API تمام ورودی‌های صوتی و تصویری را به طور مداوم پردازش کند یا فقط زمانی که کاربر نهایی در حال صحبت تشخیص داده شود، آن را ضبط کند.

    • وضوح رسانه قابل تنظیم: با انتخاب وضوح رسانه ورودی، کیفیت یا استفاده از توکن را بهینه کنید.

    • خروجی و ویژگی‌های غنی‌تر

    • گزینه‌های گسترده‌تر صدا و زبان: از بین دو صدای جدید و ۳۰ زبان جدید برای خروجی صدا انتخاب کنید. زبان خروجی اکنون در speechConfig قابل تنظیم است.

    • پخش متن: پاسخ‌های متنی را به صورت تدریجی و همزمان با تولید دریافت کنید و امکان نمایش سریع‌تر به کاربر را فراهم کنید.

    • گزارش میزان استفاده از توکن: با استفاده از تعداد دقیق توکن‌های ارائه شده در فیلد usageMetadata پیام‌های سرور، که بر اساس روش و مراحل اعلان یا پاسخ تفکیک شده‌اند، در مورد میزان استفاده از توکن‌ها اطلاعات کسب کنید.