關於 Gemini 模型的監督式微調

如果您的任務明確,且可提供已加上標籤的資料,就很適合使用監督式微調功能。在特定領域的應用實例中,如果大型模型的語言或生成內容,與最初的訓練資料大相徑庭,則這項工具的成效將格外顯著。您可以調整文字圖片音訊文件資料類型。

監督式微調功能會運用加上標籤的資料集來調整模型運作方式。這個程序會調整模型權重,盡可能減少預測結果和實際標籤間的差異。舉例來說,這樣當執行下列類型的任務時,便可提升模型效能:

  • 分類
  • 摘要
  • 擷取式問題回答
  • 即時通訊

如要瞭解最常見的調整用途,請參閱「數百家機構正在微調 Gemini 模型以下是他們最喜歡的用途

詳情請參閱「何時應使用 Gemini 的受控微調」。

支援的模型

下列 Gemini 模型支援監督式調整:

  • Gemini 2.0 Flash-Lite
  • Gemini 2.0 Flash

限制

Gemini 2.0 Flash-Lite

規格
輸入和輸出訓練符記數量上限 131,072
輸入和輸出供應符記數量上限 與 Gemini 基礎模型相同
驗證資料集大小上限 5000 個示例
訓練資料集檔案大小上限 JSONL:1 GB
訓練資料集大小上限 100 萬個純文字示例或 30 萬個多模態示例
轉接器大小 支援的值為 1、2、4 和 8。

Gemini 2.0 Flash

規格
輸入和輸出訓練符記數量上限 131,072
輸入和輸出供應符記數量上限 與 Gemini 基礎模型相同
驗證資料集大小上限 5000 個示例
訓練資料集檔案大小上限 JSONL:1 GB
訓練資料集大小上限 100 萬個純文字示例或 30 萬個多模態示例
轉接器大小 支援的值為 1、2、4 和 8。

已知問題

  • 無法從 Vertex AI Model Registry 刪除經過調整的 Gemini 模型。不過,只要處於閒置狀態,就不會產生推論費用。
  • 向經過調整的 Gemini 模型提交推論要求時,如果套用受控產生功能,可能會因為在調整和推論期間資料不一致,導致模型品質下降。在調整期間,系統不會套用控制生成內容,因此經過調整的模型無法在推論期間妥善處理控制生成內容。監督式微調可有效自訂模型,產生結構化輸出內容。因此,在對經過調整的模型提出推論要求時,您不需要套用控制生成功能。

使用監督式精修的用途

當預期的輸出內容或工作可在提示中清楚且簡潔地定義,且提示一律產生預期的輸出內容時,基礎模型就會運作良好。如果您希望模型學習與一般模式偏離的特定領域或特定知識,建議您考慮微調該模型。舉例來說,您可以使用模型調整功能,教導模型下列事項:

  • 產生輸出的特定結構或格式。
  • 特定行為,例如何時提供簡短或詳細的輸出內容。
  • 針對特定類型的輸入內容提供特定自訂輸出內容。

以下範例是僅使用提示操作說明就難以擷取的用途:

  • 分類:預期的回應是特定字詞或詞組。

    調整模型有助於避免模型產生冗長的回覆。

  • 摘要:摘要會以特定格式顯示。舉例來說,您可能需要移除即時通訊摘要中的個人識別資訊 (PII)。

    這個以 #Person1#Person2 取代講者名稱的格式並不容易描述,基礎模型可能無法自然產生這類回應。

  • 擷取問題解答:問題與內容相關,答案是內容的子字串。

    「Last Glacial Maximum」回應是內容中的特定詞組。

  • Chat:您需要自訂模型回應,以便遵循人物角色、角色或角色。

您也可以在下列情況下調整模型:

  • 提示無法持續產生預期結果。
  • 任務過於複雜,無法在提示中定義。舉例來說,您希望模型針對難以在提示中表達的行為執行行為複製功能。
  • 您對某項工作有複雜的直覺,但難以在提示中正式表達。
  • 您想移除少量範例,縮短背景資訊長度。

設定微調工作區

使用者資料 (例如轉換後的資料集和經過調整的模型) 會儲存在調整工作區域。在調整期間,運算作業可以卸載至其他 USEU 區域,以便使用可用的加速器。使用者會清楚看到卸載作業。

  • 如果您使用 Vertex AI SDK,可以在初始化時指定區域。例如:

    import vertexai
    vertexai.init(project='myproject', location='us-central1')
    
  • 如果您使用 tuningJobs.create 方法傳送 POST 要求來建立監督式精細調整作業,則可使用網址指定調整作業執行的地區。舉例來說,在下列網址中,您可以將兩個 TUNING_JOB_REGION 例項替換為工作執行的區域,藉此指定區域。

     https://TUNING_JOB_REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/TUNING_JOB_REGION/tuningJobs
    
  • 如果您使用 Google Cloud 主控台,可以在「Model details」頁面的「Region」下拉式選單欄位中選取區域名稱。這個頁面與您選取基礎模型和調整後的模型名稱的頁面相同。

配額

並行調整工作數量會受到配額限制。每個專案都會附帶至少一個調校工作作業的預設配額。這是全域配額,適用於所有可用區域和支援的模型。如果您想同時執行更多工作,請Global concurrent tuning jobs 申請額外配額

定價

如要瞭解 Gemini 監督式精修的定價,請參閱「Vertex AI 定價」一文。

訓練符記數量計算方式為訓練資料集中的符記數量乘以訓練週期數。調整完成後,系統仍會針對經調整的模型收取推論 (預測要求) 費用。每個 Gemini 穩定版的推論定價皆相同。詳情請參閱「可用的 Gemini 穩定版模型版本」。

後續步驟