自 2025 年 4 月 29 日起，Gemini 1.5 Pro 和 Gemini 1.5 Flash 模型將無法用於先前未使用這些模型的專案，包括新專案。詳情請參閱「模型版本和生命週期」。

本頁面由 Cloud Translation API 翻譯而成。

關於 Gemini 模型的監督式微調
透過集合功能整理內容你可以依據偏好儲存及分類內容。

如果您的任務明確，且可提供已加上標籤的資料，就很適合使用監督式微調功能。在特定領域的應用實例中，如果大型模型的語言或生成內容，與最初的訓練資料大相徑庭，則這項工具的成效將格外顯著。您可以調整文字、圖片、音訊和文件資料類型。

監督式微調功能會運用加上標籤的資料集來調整模型運作方式。這個程序會調整模型權重，盡可能減少預測結果和實際標籤間的差異。舉例來說，這樣當執行下列類型的任務時，便可提升模型效能：

分類
摘要
擷取式問題回答
即時通訊

如要瞭解最常見的調整用途，請參閱「數百家機構正在微調 Gemini 模型以下是他們最喜歡的用途。

詳情請參閱「何時應使用 Gemini 的受控微調」。

支援的模型

下列 Gemini 模型支援監督式調整：

Gemini 2.0 Flash-Lite
Gemini 2.0 Flash

限制

Gemini 2.0 Flash-Lite

規格	值
輸入和輸出訓練符記數量上限	131,072
輸入和輸出供應符記數量上限	與 Gemini 基礎模型相同
驗證資料集大小上限	5000 個示例
訓練資料集檔案大小上限	JSONL：1 GB
訓練資料集大小上限	100 萬個純文字示例或 30 萬個多模態示例
轉接器大小	支援的值為 1、2、4 和 8。

Gemini 2.0 Flash

規格	值
輸入和輸出訓練符記數量上限	131,072
輸入和輸出供應符記數量上限	與 Gemini 基礎模型相同
驗證資料集大小上限	5000 個示例
訓練資料集檔案大小上限	JSONL：1 GB
訓練資料集大小上限	100 萬個純文字示例或 30 萬個多模態示例
轉接器大小	支援的值為 1、2、4 和 8。

已知問題

無法從 Vertex AI Model Registry 刪除經過調整的 Gemini 模型。不過，只要處於閒置狀態，就不會產生推論費用。
向經過調整的 Gemini 模型提交推論要求時，如果套用受控產生功能，可能會因為在調整和推論期間資料不一致，導致模型品質下降。在調整期間，系統不會套用控制生成內容，因此經過調整的模型無法在推論期間妥善處理控制生成內容。監督式微調可有效自訂模型，產生結構化輸出內容。因此，在對經過調整的模型提出推論要求時，您不需要套用控制生成功能。

使用監督式精修的用途

當預期的輸出內容或工作可在提示中清楚且簡潔地定義，且提示一律產生預期的輸出內容時，基礎模型就會運作良好。如果您希望模型學習與一般模式偏離的特定領域或特定知識，建議您考慮微調該模型。舉例來說，您可以使用模型調整功能，教導模型下列事項：

產生輸出的特定結構或格式。
特定行為，例如何時提供簡短或詳細的輸出內容。
針對特定類型的輸入內容提供特定自訂輸出內容。

以下範例是僅使用提示操作說明就難以擷取的用途：

分類：預期的回應是特定字詞或詞組。

提示： 將下列文字歸類至下列其中一個類別： [business, entertainment]。文字：多元化投資組合

回覆： business

調整模型有助於避免模型產生冗長的回覆。

摘要：摘要會以特定格式顯示。舉例來說，您可能需要移除即時通訊摘要中的個人識別資訊 (PII)。

提示： 摘要： Jessica：聽起來不錯！我們在時代廣場見！Alexander：我們 10 點見！

回覆： #Person1 和 #Person2 同意上午 10:00 在時代廣場見面。

這個以 #Person1 和 #Person2 取代講者名稱的格式並不容易描述，基礎模型可能無法自然產生這類回應。

擷取問題解答：問題與內容相關，答案是內容的子字串。

提示： 背景：有證據顯示，亞馬遜雨林的植被在過去 21,000 年期間，經歷了從「最後一次冰河期」(LGM) 到後續消融的重大變化。問題：LGM 代表什麼？

回覆： 最後一次冰河時期的極大冰期

「Last Glacial Maximum」回應是內容中的特定詞組。

Chat：您需要自訂模型回應，以便遵循人物角色、角色或角色。

提示： 使用者：今天的天氣如何？

回覆： Google 助理：我是 Example Organization 的虛擬店主，我只能協助你購買商品和運送商品。

您也可以在下列情況下調整模型：

提示無法持續產生預期結果。
任務過於複雜，無法在提示中定義。舉例來說，您希望模型針對難以在提示中表達的行為執行行為複製功能。
您對某項工作有複雜的直覺，但難以在提示中正式表達。
您想移除少量範例，縮短背景資訊長度。

設定微調工作區

使用者資料 (例如轉換後的資料集和經過調整的模型) 會儲存在調整工作區域。在調整期間，運算作業可以卸載至其他 US 或 EU 區域，以便使用可用的加速器。使用者會清楚看到卸載作業。

如果您使用 Vertex AI SDK，可以在初始化時指定區域。例如：

import vertexai
vertexai.init(project='myproject', location='us-central1')

如果您使用 tuningJobs.create 方法傳送 POST 要求來建立監督式精細調整作業，則可使用網址指定調整作業執行的地區。舉例來說，在下列網址中，您可以將兩個 TUNING_JOB_REGION 例項替換為工作執行的區域，藉此指定區域。
```
 https://TUNING_JOB_REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/TUNING_JOB_REGION/tuningJobs
```
如果您使用 Google Cloud 主控台，可以在「Model details」頁面的「Region」下拉式選單欄位中選取區域名稱。這個頁面與您選取基礎模型和調整後的模型名稱的頁面相同。

配額

並行調整工作數量會受到配額限制。每個專案都會附帶至少一個調校工作作業的預設配額。這是全域配額，適用於所有可用區域和支援的模型。如果您想同時執行更多工作，請為 Global concurrent tuning jobs 申請額外配額。

定價

如要瞭解 Gemini 監督式精修的定價，請參閱「Vertex AI 定價」一文。

訓練符記數量計算方式為訓練資料集中的符記數量乘以訓練週期數。調整完成後，系統仍會針對經調整的模型收取推論 (預測要求) 費用。每個 Gemini 穩定版的推論定價皆相同。詳情請參閱「可用的 Gemini 穩定版模型版本」。

後續步驟

準備監督式微調資料集。
瞭解如何部署經過調整的 Gemini 模型。