Changelog Update
- 推出正式發布版
veo-2.0-generate-001,這項文字和圖像轉影片模型可生成細緻且充滿藝術感的影片。詳情請參閱 Veo 說明文件。 發布
gemini-2.0-flash-live-001,這是啟用計費功能的 Live API 模型公開預先發布版。強化工作階段管理和穩定性
- 工作階段續傳:即使網路暫時中斷,工作階段仍會持續運作。這項 API 現在支援伺服器端工作階段狀態儲存 (最多 24 小時),並提供控點 (session_resumption) 以重新連線,並從上次中斷的地方繼續。
- 透過脈絡壓縮延長對話時間:啟用這項功能後,對話時間將不受限制,使用滑動視窗機制設定內容視窗壓縮,自動管理內容長度,避免因內容限制而突然終止。
- 正常中斷連線通知:接收
GoAway伺服器訊息,瞭解連線即將關閉的時間,以便在終止前正常處理。
進一步掌控互動動態
可設定的語音活動偵測 (VAD):選擇靈敏度等級,或完全停用自動 VAD,並使用新的用戶端事件 (
activityStart、activityEnd) 手動控制通話。可設定的中斷處理方式:決定使用者輸入內容是否應中斷模型的回覆。
可設定的 Turn 涵蓋範圍:選擇 API 要持續處理所有音訊和視訊輸入內容,還是只在偵測到使用者說話時擷取內容。
可設定的媒體解析度:選取輸入媒體的解析度,以盡量提高品質或減少權杖用量。
更豐富的輸出內容和功能
擴充語音和語言選項:選擇兩種新語音和 30 種新語言,做為音訊輸出內容的語音。現在可以在
speechConfig中設定輸出語言。文字串流:逐步接收生成的文字回覆,以便更快向使用者顯示內容。
權杖用量報表:透過伺服器訊息
usageMetadata欄位中提供的詳細權杖計數,深入瞭解用量,並依模式和提示或回應階段細分。