如果您的任務明確,且可提供已加上標籤的資料,就很適合使用監督式微調功能。在特定領域的應用實例中,如果大型模型的語言或生成內容,與最初的訓練資料大相徑庭,則這項工具的成效將格外顯著。您可以調整文字、圖片、音訊和文件資料類型。
監督式微調功能會運用加上標籤的資料集來調整模型運作方式。這個程序會調整模型權重,盡可能減少預測結果和實際標籤間的差異。舉例來說,這樣當執行下列類型的任務時,便可提升模型效能:
- 分類
- 摘要
- 擷取式問題回答
- 即時通訊
如要瞭解最常見的調整用途,請參閱「數百家機構正在微調 Gemini 模型以下是他們最喜歡的用途。
詳情請參閱「何時應使用 Gemini 的受控微調」。
支援的模型
下列 Gemini 模型支援監督式調整:
Gemini 2.0 Flash-Lite
Gemini 2.0 Flash
限制
Gemini 2.0 Flash-Lite
規格 | 值 |
---|---|
輸入和輸出訓練符記數量上限 | 131,072 |
輸入和輸出供應符記數量上限 | 與 Gemini 基礎模型相同 |
驗證資料集大小上限 | 5000 個示例 |
訓練資料集檔案大小上限 | JSONL:1 GB |
訓練資料集大小上限 | 100 萬個純文字示例或 30 萬個多模態示例 |
轉接器大小 | 支援的值為 1、2、4 和 8。 |
Gemini 2.0 Flash
規格 | 值 |
---|---|
輸入和輸出訓練符記數量上限 | 131,072 |
輸入和輸出供應符記數量上限 | 與 Gemini 基礎模型相同 |
驗證資料集大小上限 | 5000 個示例 |
訓練資料集檔案大小上限 | JSONL:1 GB |
訓練資料集大小上限 | 100 萬個純文字示例或 30 萬個多模態示例 |
轉接器大小 | 支援的值為 1、2、4 和 8。 |
已知問題
- 無法從 Vertex AI Model Registry 刪除經過調整的 Gemini 模型。不過,只要處於閒置狀態,就不會產生推論費用。
- 向經過調整的 Gemini 模型提交推論要求時,如果套用受控產生功能,可能會因為在調整和推論期間資料不一致,導致模型品質下降。在調整期間,系統不會套用控制生成內容,因此經過調整的模型無法在推論期間妥善處理控制生成內容。監督式微調可有效自訂模型,產生結構化輸出內容。因此,在對經過調整的模型提出推論要求時,您不需要套用控制生成功能。
使用監督式精修的用途
當預期的輸出內容或工作可在提示中清楚且簡潔地定義,且提示一律產生預期的輸出內容時,基礎模型就會運作良好。如果您希望模型學習與一般模式偏離的特定領域或特定知識,建議您考慮微調該模型。舉例來說,您可以使用模型調整功能,教導模型下列事項:
- 產生輸出的特定結構或格式。
- 特定行為,例如何時提供簡短或詳細的輸出內容。
- 針對特定類型的輸入內容提供特定自訂輸出內容。
以下範例是僅使用提示操作說明就難以擷取的用途:
分類:預期的回應是特定字詞或詞組。
調整模型有助於避免模型產生冗長的回覆。
摘要:摘要會以特定格式顯示。舉例來說,您可能需要移除即時通訊摘要中的個人識別資訊 (PII)。
這個以
#Person1
和#Person2
取代講者名稱的格式並不容易描述,基礎模型可能無法自然產生這類回應。擷取問題解答:問題與內容相關,答案是內容的子字串。
「Last Glacial Maximum」回應是內容中的特定詞組。
Chat:您需要自訂模型回應,以便遵循人物角色、角色或角色。
您也可以在下列情況下調整模型:
- 提示無法持續產生預期結果。
- 任務過於複雜,無法在提示中定義。舉例來說,您希望模型針對難以在提示中表達的行為執行行為複製功能。
- 您對某項工作有複雜的直覺,但難以在提示中正式表達。
- 您想移除少量範例,縮短背景資訊長度。
設定微調工作區
使用者資料 (例如轉換後的資料集和經過調整的模型) 會儲存在調整工作區域。在調整期間,運算作業可以卸載至其他 US
或 EU
區域,以便使用可用的加速器。使用者會清楚看到卸載作業。
如果您使用 Vertex AI SDK,可以在初始化時指定區域。例如:
import vertexai vertexai.init(project='myproject', location='us-central1')
如果您使用
tuningJobs.create
方法傳送 POST 要求來建立監督式精細調整作業,則可使用網址指定調整作業執行的地區。舉例來說,在下列網址中,您可以將兩個TUNING_JOB_REGION
例項替換為工作執行的區域,藉此指定區域。https://TUNING_JOB_REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/TUNING_JOB_REGION/tuningJobs
如果您使用 Google Cloud 主控台,可以在「Model details」頁面的「Region」下拉式選單欄位中選取區域名稱。這個頁面與您選取基礎模型和調整後的模型名稱的頁面相同。
配額
並行調整工作數量會受到配額限制。每個專案都會附帶至少一個調校工作作業的預設配額。這是全域配額,適用於所有可用區域和支援的模型。如果您想同時執行更多工作,請為 Global concurrent tuning jobs
申請額外配額。
定價
如要瞭解 Gemini 監督式精修的定價,請參閱「Vertex AI 定價」一文。
訓練符記數量計算方式為訓練資料集中的符記數量乘以訓練週期數。調整完成後,系統仍會針對經調整的模型收取推論 (預測要求) 費用。每個 Gemini 穩定版的推論定價皆相同。詳情請參閱「可用的 Gemini 穩定版模型版本」。
後續步驟
- 準備監督式微調資料集。
- 瞭解如何部署經過調整的 Gemini 模型。