Rechercher des ressources

Utilisez la recherche dans Dataplex Universal Catalog pour trouver des ressources Google Cloud dans BigQuery, telles que des ensembles de données et des tables BigQuery.

La recherche dans Dataplex Universal Catalog est compatible avec les requêtes de recherche en langage naturel (également appelées requêtes de recherche sémantique), qui vous permettent de rechercher des ressources en utilisant un langage courant.

Comme la recherche par mots clés, la recherche en langage naturel met l'accent sur la découverte de ressources en analysant les métadonnées associées aux ressources de votre organisation. La recherche prend en compte un large éventail de métadonnées qui décrivent les ressources, y compris les métadonnées que vous créez.

La recherche en langage naturel vise à améliorer le rappel plutôt que la précision.

Pour en savoir plus sur la recherche de données de table dans BigQuery, consultez la page Présentation de la recherche dans BigQuery.

S'inscrire pour obtenir la version bêta

Pour s'inscrire à la version Preview, votre responsable de compte Google doit envoyer une demande en remplissant le formulaire d'inscription. Une fois le formulaire envoyé, l'équipe BigQuery vous contactera pour vous indiquer la marche à suivre.

Avant de commencer

Avant d'utiliser la recherche dans le langage naturel dans BigQuery pour rechercher des ressourcesGoogle Cloud , effectuez les tâches de cette section.

Rôles requis

Pour rechercher des ressources, vous devez disposer d'au moins un des rôles IAM du catalogue Dataplex Universal Catalog suivants sur le projet utilisé pour la recherche: administrateur du catalogue Dataplex, éditeur du catalogue Dataplex ou lecteur du catalogue Dataplex. Les autorisations sur les résultats de recherche sont vérifiées indépendamment du projet sélectionné.

Les résultats de recherche dans BigQuery sont limités en fonction de vos autorisations IAM sur les ressources sous-jacentes. Pour rechercher une ressource dans BigQuery, vous devez disposer des autorisations nécessaires pour y accéder. Pour en savoir plus, consultez la section Champ d'application de la recherche de ce document.

Par exemple, pour rechercher des ensembles de données, des tables, des vues et des modèles BigQuery, vous devez disposer des autorisations correspondantes pour accéder à ces ressources. Pour en savoir plus, consultez la section Autorisations BigQuery. La liste suivante décrit les autorisations minimales requises:

  • Pour rechercher une table, vous devez disposer de l'autorisation bigquery.tables.get pour celle-ci.
  • Pour rechercher un ensemble de données, vous devez disposer de l'autorisation bigquery.datasets.get pour cet ensemble de données.

Le rôle Lecteur de métadonnées BigQuery (roles/bigquery.metadataViewer) inclut les autorisations bigquery.tables.get et bigquery.datasets.get, et vous permet de rechercher n'importe quelle ressource BigQuery.

Pour en savoir plus sur l'attribution de rôles, consultez la section Gérer les accès.

Vous pouvez également obtenir les autorisations requises via des rôles personnalisés ou d'autres rôles prédéfinis.

Activer l'API

Pour utiliser la recherche, assurez-vous d'avoir activé l'API Dataplex. L'API Dataplex est automatiquement activée pour tous les nouveaux Google Cloud projets avec BigQuery. Si l'API Dataplex n'est pas activée dans votre projet, consultez la page Activer le catalogue universel Dataplex.

  1. Dans la console Google Cloud , accédez à la page Recherche de BigQuery.

    Accéder à la recherche

  2. Dans le champ de recherche, saisissez votre requête en langage naturel, puis appuyez sur Entrée. Voici quelques exemples de requêtes:

    • Show me the datasets that contain taxi information
    • Find data on vaccine distribution across different countries
    • Get tables with historical temperature data for major world cities
    • Search for hurricane tracking and storm activity datasets
    • Population data by country
  3. Pour filtrer votre recherche, cliquez sur Filtres. Les filtres suivants sont disponibles:

    • Champ d'application: recherche dans l'organisation (par défaut), dans le projet en cours ou uniquement pour les ressources épinglées. Pour en savoir plus, consultez la section Champ d'application de la recherche de ce document.
    • Systèmes: Google Cloud service auquel la ressource appartient, comme BigQuery. Le système Dataplex Universal Catalog contient des groupes d'entrées.
    • Projets: projets dans lesquels effectuer la recherche.
    • Type: type de ressource, par exemple connexion BigQuery, bucket Cloud Storage ou base de données. Selon le type de ressource, vous pouvez également filtrer par sous-type, comme le type de connexion ou le dialecte SQL.
    • Sélectionner des zones géographiques: zones géographiques dans lesquelles effectuer la recherche.
    • Sélectionner des ensembles de données: cette option limite les résultats de recherche aux ressources BigQuery appartenant aux ensembles de données BigQuery sélectionnés. Dans le champ Saisir pour filtrer, saisissez le nom de l'ensemble de données.
    • Annotations: types d'aspects du catalogue universel Dataplex associés à la ressource que vous recherchez. Pour filtrer par valeurs d'aspect, cliquez sur Filtrer sur les valeurs d'annotation, puis sélectionnez les valeurs.

    Pour supprimer un filtre, cliquez sur Effacer à côté du filtre spécifique que vous souhaitez supprimer. Pour supprimer tous les filtres, cliquez sur Effacer les filtres.

    Pour en savoir plus sur l'évaluation des filtres, consultez la section Filtres de ce document.

  4. Facultatif: Pour afficher plus d'informations sur une ressource, cliquez sur son nom dans les résultats de recherche.

    Un résumé des ressources s'ouvre dans un volet fractionné. Effectuez l'une des actions suivantes :

    • Pour ouvrir la ressource dans le service auquel elle appartient, cliquez sur Ouvrir dans PRODUCT_NAME pour la ressource. Par exemple, pour ouvrir un ensemble de données BigQuery dans BigQuery Studio, cliquez sur Ouvrir dans Studio. Les options disponibles dépendent de la ressource.
    • Pour afficher les métadonnées Dataplex Universal Catalog associées à une ressource, cliquez sur Ouvrir dans le catalogue Dataplex pour la ressource.
    • Si vous souhaitez ajouter des résultats de recherche importants à vos favoris, vous pouvez les ajouter à vos favoris. Cliquez sur Ajouter aux favoris pour la ressource. Vous pouvez afficher les ressources épinglées dans BigQuery Studio.
    • Pour fermer le résumé des ressources dans le volet fractionné, cliquez sur  Fermer.

Filtres

Les filtres vous permettent d'affiner les résultats de recherche.

Lorsque vous fournissez des filtres dans plusieurs sections, ils sont évalués à l'aide de l'opérateur logique AND. Les résultats de recherche contiennent des ressources correspondant à au moins une condition de chaque section sélectionnée. Par exemple, si vous sélectionnez le système BigQuery et le type de ressource dataset, les résultats de recherche incluent les ensembles de données BigQuery, mais pas les ensembles de données Vertex AI.

Si vous sélectionnez plusieurs filtres dans une même section, ils sont évalués à l'aide de l'opérateur logique OR. Par exemple, si vous sélectionnez le type de ressource dataset et le type de ressource table, les résultats de recherche incluent à la fois des ensembles de données et des tables.

Portée de la recherche

Pour les projets appartenant à une organisation, la recherche s'effectue dans le champ d'application de cette organisation. Google Cloud

Les résultats de recherche respectent les autorisations que vous avez sur les ressources. Par exemple, si vous disposez d'un accès en lecture aux métadonnées BigQuery pour une ressource, cette ressource s'affiche dans vos résultats de recherche. Si vous avez accès à une table BigQuery, mais pas à l'ensemble de données contenant cette table, celle-ci apparaît toujours comme prévu dans les résultats de recherche.

Les résultats de recherche n'incluent que les ressources appartenant au même périmètre VPC Service Controls que le projet pour lequel la recherche est effectuée. Lorsque vous utilisez la console Google Cloud , il s'agit du projet sélectionné dans la console.

Étape suivante