Changelog Update
-
veo-2.0-generate-001প্রকাশ করা হয়েছে, যা একটি সর্বজনীনভাবে উপলব্ধ (GA) টেক্সট ও ইমেজ-টু-ভিডিও মডেল এবং এটি বিস্তারিত ও শৈল্পিকভাবে সূক্ষ্ম ভিডিও তৈরি করতে সক্ষম। আরও জানতে, Veo ডক্স দেখুন। বিলিং সক্ষম করা লাইভ এপিআই মডেলের একটি পাবলিক প্রিভিউ সংস্করণ,
gemini-2.0-flash-live-001, প্রকাশ করা হয়েছে।উন্নত সেশন ব্যবস্থাপনা এবং নির্ভরযোগ্যতা
- সেশন পুনরায় চালু করা: সাময়িক নেটওয়ার্ক বিঘ্নের সময়েও সেশন সচল রাখুন। এপিআই এখন সার্ভার-সাইড সেশন স্টেট স্টোরেজ (২৪ ঘন্টা পর্যন্ত) সমর্থন করে এবং পুনরায় সংযোগ স্থাপন ও আপনি যেখান থেকে ছেড়ে গিয়েছিলেন সেখান থেকে আবার শুরু করার জন্য হ্যান্ডেল (session_resumption) প্রদান করে।
- কনটেক্সট কম্প্রেশনের মাধ্যমে দীর্ঘতর সেশন: পূর্ববর্তী সময়সীমার বাইরেও বর্ধিত ইন্টারঅ্যাকশন সক্ষম করুন। কনটেক্সটের দৈর্ঘ্যের স্বয়ংক্রিয় ব্যবস্থাপনার জন্য একটি স্লাইডিং উইন্ডো মেকানিজমের সাহায্যে কনটেক্সট উইন্ডো কম্প্রেশন কনফিগার করুন, যা কনটেক্সটের সীমাবদ্ধতার কারণে আকস্মিক সমাপ্তি রোধ করে।
- সুষ্ঠু সংযোগ বিচ্ছিন্নকরণ বিজ্ঞপ্তি: সংযোগ বন্ধ হওয়ার আগে একটি
GoAwayসার্ভার বার্তা গ্রহণ করুন, যা সংযোগ বিচ্ছিন্ন হওয়ার পূর্বে সুষ্ঠুভাবে তা পরিচালনা করার সুযোগ দেয়।
মিথস্ক্রিয়ার গতিশীলতার উপর আরও নিয়ন্ত্রণ
কনফিগারযোগ্য ভয়েস অ্যাক্টিভিটি ডিটেকশন (VAD): সংবেদনশীলতার মাত্রা বেছে নিন অথবা স্বয়ংক্রিয় VAD সম্পূর্ণরূপে নিষ্ক্রিয় করে ম্যানুয়াল টার্ন নিয়ন্ত্রণের জন্য নতুন ক্লায়েন্ট ইভেন্ট (
activityStart,activityEnd) ব্যবহার করুন।কনফিগারযোগ্য বাধা পরিচালনা: ব্যবহারকারীর ইনপুট মডেলের প্রতিক্রিয়াকে বাধা দেবে কিনা তা নির্ধারণ করুন।
কনফিগারযোগ্য টার্ন কভারেজ: বেছে নিন এপিআই সমস্ত অডিও এবং ভিডিও ইনপুট অবিচ্ছিন্নভাবে প্রসেস করবে, নাকি শুধুমাত্র ব্যবহারকারীকে কথা বলতে শনাক্ত করার সময় তা ক্যাপচার করবে।
পরিবর্তনযোগ্য মিডিয়া রেজোলিউশন: ইনপুট মিডিয়ার জন্য রেজোলিউশন নির্বাচন করে গুণমান বা টোকেন ব্যবহার অপ্টিমাইজ করুন।
আরও সমৃদ্ধ আউটপুট এবং বৈশিষ্ট্য
বর্ধিত ভয়েস ও ভাষার বিকল্প: অডিও আউটপুটের জন্য দুটি নতুন ভয়েস এবং ৩০টি নতুন ভাষা থেকে বেছে নিন। আউটপুট ভাষা এখন
speechConfigমধ্যে কনফিগার করা যাবে।টেক্সট স্ট্রিমিং: টেক্সট প্রতিক্রিয়াগুলো তৈরি হওয়ার সাথে সাথে পর্যায়ক্রমে গ্রহণ করা, যা ব্যবহারকারীকে দ্রুত প্রদর্শন করতে সক্ষম করে।
টোকেন ব্যবহারের প্রতিবেদন: সার্ভার মেসেজের
usageMetadataফিল্ডে প্রদত্ত বিস্তারিত টোকেন সংখ্যার মাধ্যমে ব্যবহার সম্পর্কে ধারণা লাভ করুন, যা মোডালিটি এবং প্রম্পট বা রেসপন্স পর্যায় অনুযায়ী বিভক্ত থাকে।