AI Changelog Aggregator

推出正式發布版 veo-2.0-generate-001，這項文字和圖像轉影片模型可生成細緻且充滿藝術感的影片。詳情請參閱 Veo 說明文件。
發布 gemini-2.0-flash-live-001，這是啟用計費功能的 Live API 模型公開預先發布版。
- 強化工作階段管理和穩定性
  - 工作階段續傳：即使網路暫時中斷，工作階段仍會持續運作。這項 API 現在支援伺服器端工作階段狀態儲存 (最多 24 小時)，並提供控點 (session_resumption) 以重新連線，並從上次中斷的地方繼續。
  - 透過脈絡壓縮延長對話時間：啟用這項功能後，對話時間將不受限制，使用滑動視窗機制設定內容視窗壓縮，自動管理內容長度，避免因內容限制而突然終止。
  - 正常中斷連線通知：接收 GoAway 伺服器訊息，瞭解連線即將關閉的時間，以便在終止前正常處理。
- 進一步掌控互動動態
- 可設定的語音活動偵測 (VAD)：選擇靈敏度等級，或完全停用自動 VAD，並使用新的用戶端事件 (activityStart、activityEnd) 手動控制通話。
- 可設定的中斷處理方式：決定使用者輸入內容是否應中斷模型的回覆。
- 可設定的 Turn 涵蓋範圍：選擇 API 要持續處理所有音訊和視訊輸入內容，還是只在偵測到使用者說話時擷取內容。
- 可設定的媒體解析度：選取輸入媒體的解析度，以盡量提高品質或減少權杖用量。
- 更豐富的輸出內容和功能
- 擴充語音和語言選項：選擇兩種新語音和 30 種新語言，做為音訊輸出內容的語音。現在可以在 speechConfig 中設定輸出語言。
- 文字串流：逐步接收生成的文字回覆，以便更快向使用者顯示內容。
- 權杖用量報表：透過伺服器訊息 usageMetadata 欄位中提供的詳細權杖計數，深入瞭解用量，並依模式和提示或回應階段細分。