Changelog Update
- أطلقنا
veo-2.0-generate-001، وهو نموذج متوفر للجمهور العام (GA) يحوّل النصوص والصور إلى فيديوهات، ويمكنه إنشاء فيديوهات مفصّلة ودقيقة من الناحية الفنية. لمزيد من المعلومات، يُرجى الاطّلاع على مستندات Veo. تم إصدار
gemini-2.0-flash-live-001، وهو إصدار تجريبي عام من نموذج Live API مع تفعيل الفوترة.إدارة الجلسات والموثوقية المحسّنة
- استئناف الجلسة: إبقاء الجلسات نشطة عند حدوث انقطاعات مؤقتة في الشبكة تتيح واجهة برمجة التطبيقات الآن تخزين حالة الجلسة من جهة الخادم (لمدة تصل إلى 24 ساعة) وتوفّر معرّفات (session_resumption) لإعادة الاتصال ومواصلة العمل من حيث توقّفت.
- جلسات أطول من خلال ضغط السياق: يمكنك تفعيل تفاعلات ممتدة تتجاوز الحدود الزمنية السابقة. ضبط ضغط قدرة استيعاب باستخدام آلية النافذة المنزلقة لإدارة طول السياق تلقائيًا، ما يمنع عمليات الإنهاء المفاجئة بسبب حدود السياق
- إشعار قطع الاتصال السلس: يمكنك تلقّي رسالة من الخادم
GoAwayتشير إلى الوقت الذي سيتم فيه إغلاق الاتصال، ما يتيح لك التعامل مع الأمر بسلاسة قبل إنهاء الاتصال.
مزيد من التحكّم في ديناميكية التفاعل
ميزة "رصد النشاط الصوتي" (VAD) القابلة للإعداد: يمكنك اختيار مستويات الحساسية أو إيقاف ميزة "رصد النشاط الصوتي" التلقائية بالكامل واستخدام أحداث العميل الجديدة (
activityStartوactivityEnd) للتحكّم اليدوي في التشغيل.التعامل القابل للإعداد مع المقاطعات: يمكنك تحديد ما إذا كان يجب أن تؤدي بيانات أدخلها المستخدم إلى مقاطعة استجابة النموذج.
تغطية قابلة للإعداد: اختَر ما إذا كانت واجهة برمجة التطبيقات تعالج كل بيانات الإدخال الصوتية والمرئية بشكل مستمر أو تسجّلها فقط عندما يتم رصد المستخدم النهائي وهو يتحدث.
دقة الوسائط القابلة للضبط: يمكنك تحسين الجودة أو استخدام الرموز المميزة من خلال اختيار دقة الوسائط المُدخَلة.
ميزات ونتائج أكثر ثراءً
خيارات موسّعة للغة والصوت: يمكنك الاختيار من بين صوتَين جديدَين و30 لغة جديدة لإخراج الصوت. يمكنك الآن ضبط لغة الإخراج ضمن
speechConfig.البث النصي: يمكنك تلقّي الردود النصية بشكل تدريجي أثناء إنشائها، ما يتيح عرضها بشكل أسرع للمستخدم.
تقارير استخدام الرموز المميزة: يمكنك الحصول على إحصاءات حول الاستخدام من خلال أعداد الرموز المميزة المفصّلة المقدَّمة في الحقل
usageMetadataضمن رسائل الخادم، مع تقسيمها حسب نوع البيانات ومراحل الطلب أو الرد.