リソースを検索
Dataplex ユニバーサル カタログ検索を使用して、BigQuery 内にあるリソース(BigQuery データセットやテーブルなど)を検索します。 Google Cloud
Dataplex ユニバーサル カタログ検索は、自然言語検索クエリ(セマンティック検索クエリとも呼ばれます)をサポートしています。これにより、日常的な言葉でリソースを検索できます。
自然言語検索では、キーワード検索と同様にリソースの検出に重点を置いており、そのために、組織内のリソースに関連付けられているメタデータを分析します。検索では、作成したメタデータなど、リソースを記述する幅広いメタデータが考慮されます。
自然言語検索は、適合率ではなく再現率の向上に重点を置いています。
BigQuery でテーブルデータを検索する方法の詳細については、BigQuery での検索の概要をご覧ください。
登録してプレビューする
プレビュー版に登録するには、Google アカウント担当者が登録フォームに記入してリクエストを送信する必要があります。フォームを送信すると、BigQuery チームから次の手順についてご連絡いたします。
始める前に
BigQuery で自然言語検索を使用してGoogle Cloud リソースを検索する前に、このセクションのタスクを完了します。
必要なロール
リソースを検索するには、検索に使用するプロジェクトで、Dataplex Catalog 管理者、Dataplex Catalog 編集者、または Dataplex Catalog 閲覧者のいずれかの Dataplex ユニバーサル カタログ IAM ロールが必要です。検索結果に対する権限は、選択したプロジェクトとは別にチェックされます。
BigQuery の検索結果は、基盤となるリソースに対する IAM 権限に従ってスコープが設定されます。BigQuery でリソースを検索するには、対応するリソースにアクセスする権限が必要です。詳細については、このドキュメントの検索範囲をご覧ください。
たとえば、BigQuery のデータセット、テーブル、ビュー、モデルを検索するには、それらのリソースにアクセスするためのそれぞれの権限が必要です。詳細については、BigQuery の権限をご覧ください。次のリストに、最低限必要な権限を示します。
- テーブルを検索するには、そのテーブルに対する
bigquery.tables.get
権限が必要です。 - データセットを検索するには、そのデータセットに対する
bigquery.datasets.get
権限が必要です。
BigQuery メタデータ閲覧者のロール(roles/bigquery.metadataViewer
)には、bigquery.tables.get
権限と bigquery.datasets.get
権限の両方が含まれており、任意の BigQuery リソースを検索できます。
ロールの付与の詳細については、アクセスの管理をご覧ください。
必要な権限は、カスタムロールや他の事前定義ロールから取得することもできます。
API を有効にする
検索を使用するには、Dataplex API が有効になっていることを確認します。BigQuery を使用するすべての新しい Google Cloud プロジェクトで、Dataplex API が自動的に有効になります。プロジェクトで Dataplex API が有効になっていない場合は、Dataplex ユニバーサル カタログを有効にするをご覧ください。
リソースを検索
Google Cloud コンソールで、BigQuery の [検索] ページに移動します。
検索フィールドに、自然言語でクエリを入力し、Enter キーを押します。次のクエリはサンプルです。
Show me the datasets that contain taxi information
Find data on vaccine distribution across different countries
Get tables with historical temperature data for major world cities
Search for hurricane tracking and storm activity datasets
Population data by country
検索結果をフィルタするには、[フィルタ] をクリックします。次のフィルタを使用できます。
- スコープ: 組織全体(デフォルト)、現在のプロジェクト、またはスターを付けたリソースのみを検索します。詳細については、このドキュメントの検索範囲をご覧ください。
- システム: リソースが属するサービス(BigQuery など)。 Google Cloud Dataplex ユニバーサル カタログ システムには、エントリ グループが含まれています。
- プロジェクト: 検索するプロジェクト。
- タイプ: BigQuery 接続、Cloud Storage バケット、データベースなどのリソースタイプ。リソースタイプに応じて、接続タイプや SQL 言語など、サブタイプでフィルタすることもできます。
- 地域を選択: 検索する地域。
- データセットを選択: 選択した BigQuery データセットに属する BigQuery リソースに検索結果を限定します。[Type to filter] フィールドに、データセットの名前を入力します。
- アノテーション: 検索対象のリソースに関連付けられている Dataplex ユニバーサル カタログのアスペクト タイプ。アスペクト値でフィルタするには、[アノテーション値でフィルタ] をクリックして値を選択します。
フィルタを削除するには、削除する特定のフィルタの横にある
[クリア] をクリックします。すべてのフィルタを削除するには、[フィルタをクリア] をクリックします。フィルタの評価方法の詳細については、このドキュメントのフィルタをご覧ください。
省略可: リソースの詳細を表示するには、検索結果でリソース名をクリックします。
リソースの概要が分割ペインで開きます。以下のいずれかの操作を行います。
- リソースが属するサービスでリソースを開くには、リソースの [PRODUCT_NAME で開く] をクリックします。たとえば、BigQuery Studio で BigQuery データセットを開くには、[Studio で開く] をクリックします。使用できるオプションはリソースによって異なります。
- リソースに関連付けられている Dataplex ユニバーサル カタログ メタデータを表示するには、リソースの [Dataplex Catalog で開く] をクリックします。
- ブックマークに追加したい重要な検索結果がある場合は、スターを付けることができます。リソースの スターアイコ��をクリックします。スターを付けたリソースは BigQuery Studio で表示できます。
- 分割ペインでリソースの概要を閉じるには、 [閉じる] をクリックします。
フィルタ
フィルタを使用すると、検索結果を絞り込むことができます。
複数のセクションでフィルタを指定すると、フィルタは AND
論理演算子を使用して評価されます。検索結果には、選択したすべてのセクションの少なくとも 1 つの条件に一致するリソースが含まれます。たとえば、BigQuery システムと dataset
リソースタイプを選択すると、検索結果に BigQuery データセットは含まれますが、Vertex AI データセットは含まれません。
1 つのセクション内で複数のフィルタを選択すると、フィルタは OR
論理演算子を使用して評価されます。たとえば、dataset
リソースタイプと table
リソースタイプを選択すると、検索結果にデータセットとテーブルの両方が含まれます。
検索範囲
組織に属するプロジェクトの場合、検索はその組織のスコープ内で実行されます。 Google Cloud
検索結果には、リソースに対する権限が適用されます。たとえば、リソースに対する BigQuery メタデータの読み取りアクセス権を持っている場合、そのリソースは検索結果に表示されます。BigQuery テーブルにアクセスできるものの、そのテーブルを含むデータセットへのアクセス権がない場合でも、テーブルは検索結果で想定どおりに表示されます。
検索結果には、検索が実行されるプロジェクトと同じ VPC Service Controls 境界に属するリソースのみが表示されます。 Google Cloud コンソールを使用する場合、これはコンソールで選択したプロジェクトです。
次のステップ
- BigQuery Studio でデータを分析する方法を学習する。
- Dataplex Universal Catalog でキーワード検索を使用する方法を確認する。