Copilotシークレットスキャンを使用したジェネリックシークレットの責任ある検出

Copilot シークレットスキャンが責任を持って AI を使用し、パスワードなどの非構造化シークレットをスキャンしてアラートを作成する方法について説明します。

この機能を使用できるユーザーについて

Copilot シークレットスキャンは、次のリポジトリの種類で使用できます。

GitHub Secret Protection が有効になっている GitHub Team 上の organization 所有リポジトリ

この記事の内容

Copilot シークレットスキャンを使用したジェネリックシークレットの検出について

Copilot シークレットスキャンのジェネリックシークレットの検出は、AI の搭載により、ソースコード内の非構造化シークレット (パスワード) を識別してアラートを生成する、secret scanning の拡張です。

メモ

Copilot シークレットスキャンのジェネリックシークレットの検出を使用するには、GitHub Copilot のサブスクリプションは必要ありません。 Copilot シークレットスキャン機能は、GitHub Secret Protection のライセンスを持つ organization と Enterprise が所有するリポジトリで使用できます。

GitHub Secret Protection ユーザーは、ソースコード内で見つかったパートナーまたはカスタムパターンのシークレットスキャンニングアラートを既に受信できますが、非構造化シークレットは簡単に検出できません。 Copilot シークレットスキャンは、大きな言語モデル (LLM) を使用してこの種類のシークレットを識別します。

パスワードが検出されると、secret scanning アラートの "汎用" 一覧 (リポジトリ、organization、または Enterprise の [Security] タブの下) にアラートが表示されます。メンテナとセキュリティマネージャーはここでアラートをレビューし、必要に応じて資格情報を削除したり、修正を実装したりすることができます。

GitHub Enterprise Cloud を使うユーザーの場合、Enterprise 所有者は、まず organization 内のリポジトリに対してジェネリックシークレットの検出を有効または無効にできるかどうかを制御するポリシーを Enterprise レベルで設定する必要があります。既定では、このポリシーは "許可" に設定されています。その後、リポジトリと組織に対して、この機能を有効にする必要があります。

入力処理

入力は、ユーザーがリポジトリにチェックインしたテキスト (通常はコード) に制限されます。システムはこのテキストを LLM に��供し、さらにメタプロンプトを提供して、入力のスコープにおいてパスワードの検索を要求します。ユーザーが直接 LLM と対話することはありません。

LLM を使用してシステムがパスワードをスキャンします。既存の secret scanning 機能によって既に収集されているデータ以外に、システムが追加でデータを収集することはありません。

出力と表示

LLM はパスワードに似ている文字列をスキャンし、結果として見つかった文字列が、入力に実際に存在するかどうかを確認します。

こうして検出された文字列は、secret scanning アラートページにアラートとして表示されますが、通常のシークレットスキャンニングアラートとは別の追加リストに表示されます。別のリストにしておくことで、検出結果の妥当性がより精密に確認され、トリアージされることを意図しています。各アラートは、AI を使用して検出されたことを示しています。汎用シークレットのアラートを表示する方法については、「シークレットスキャンからのアラートの表示とフィルター処理」を参照してください。

ジェネリックシークレットの検出のパフォーマンスの向上

ジェネリックシークレットの検出のパフォーマンスを向上させるには、誤検知アラートを適切に閉じることをお勧めします。

アラートの精度を確認し、必要に応じてクローズする

Copilot シークレットスキャンのジェネリックシークレットの検出は、パートナーパターンの既存の secret scanning 機能よりも多くの誤検知を生成する可能性があるため、これらのアラートの精度を確認することが重要です。アラートが誤検知だと確認した場合は、必ずアラートをクローズし、GitHub UI で理由を「誤検知」としてマークしてください。 GitHub 開発チームは、誤検知のボリュームと検出の場所に関する情報を使用してモデルを改善します。 GitHub は、シークレットリテラル自体にはアクセスできません。

Copilot シークレットスキャンは、明らかに偽のパスワードやテストパスワード、または低エントロピのパスワードであるシークレットを検出しません。
Copilot シークレットスキャンは、プッシュあたり最大 100 個のパスワードしか検出しません。
1 つのファイル内で検出された 5 つ以上のシークレットが誤検知としてマークされている場合、Copilot シークレットスキャンは、そのファイルの新しいアラートの生成を停止します。
Copilot シークレットスキャンは、生成されたファイルまたはベンダー化されたファイル内のシークレットを検出しません。
Copilot シークレットスキャンは、暗号化されたファイル内のシークレットを検出しません。
Copilot シークレットスキャンは、ファイルの種類 (SVG、PNG、JPEG、CSV、TXT、SQLまたは ITEM) のシークレットを検出しません。
Copilot シークレットスキャンは、テストコードのシークレットを検出しません。次の両方の条件を満たしている場合、Copilot シークレットスキャンは検出をスキップします。
- ファイルパスに、"test"、"mock"、または "spec" が含まれている、かつ
- ファイル拡張子が .cs、.go、.java、.js、.kt、.php、.py、.rb、.scala、.swiftまたは.tsである。

シークレットスキャンについて

Copilotシークレットスキャンを使用したジェネリックシークレットの責任ある検出

この機能を使用できるユーザーについて

この記事の内容

Copilot シークレットスキャンを使用したジェネリックシークレットの検出について

入力処理

出力と表示

ジェネリックシークレットの検出のパフォーマンスの向上

アラートの精度を確認し、必要に応じてクローズする

ジェネリックシークレットの検出の制限事項

制限付きのスコープ

誤検知のアラートである可能性

不完全なレポートである可能性

設計上の制限事項

ジェネリックシークレットの検出の評価

次のステップ

参考資料