Buscar recursos
Usa la búsqueda del catálogo universal de Dataplex para encontrar Google Cloud recursos desde BigQuery, como conjuntos de datos y tablas de BigQuery.
La búsqueda de Dataplex Universal Catalog admite búsquedas en lenguaje natural (también conocidas como búsquedas semánticas), que te permiten buscar recursos con lenguaje cotidiano.
Al igual que la búsqueda de palabras clave, la búsqueda en lenguaje natural enfatiza el descubrimiento de recursos a través del análisis de los metadatos asociados con los recursos de tu organización. La búsqueda tiene en cuenta una amplia variedad de metadatos que describen los recursos, incluidos los metadatos que creas.
La búsqueda por lenguaje natural se enfoca en mejorar la recuperación en lugar de la precisión.
Si deseas obtener más información para buscar datos de tablas en BigQuery, consulta Introducción a la búsqueda en BigQuery.
Regístrate para la versión preliminar
Para registrarse en la versión preliminar, el representante de tu Cuenta de Google debe enviar una solicitud completando el formulario de registro. Después de que envíes el formulario, el equipo de BigQuery se comunicará contigo para indicarte los próximos pasos.
Antes de comenzar
Antes de usar la búsqueda de lenguaje natural en BigQuery para buscar recursos deGoogle Cloud , completa las tareas de esta sección.
Roles obligatorios
Para buscar recursos, necesitas tener al menos uno de los siguientes roles de IAM de Dataplex Universal Catalog en el proyecto que se usa para la búsqueda: Administrador de Dataplex Catalog, Editor de Dataplex Catalog o Visualizador de Dataplex Catalog. Los permisos de los resultados de la búsqueda se verifican independientemente del proyecto seleccionado.
El alcance de los resultados de la búsqueda en BigQuery se define según tus permisos de IAM sobre los recursos subyacentes. Para buscar un recurso en BigQuery, debes tener permisos para acceder al recurso correspondiente. Para obtener más información, consulta la sección Alcance de la búsqueda de este documento.
Por ejemplo, para buscar conjuntos de datos, tablas, vistas y modelos de BigQuery, necesitas los permisos correspondientes para acceder a esos recursos. Para obtener más información, consulta Permisos de BigQuery. En la siguiente lista, se describen los permisos mínimos necesarios:
- Para buscar una tabla, necesitas el permiso
bigquery.tables.get
para esa tabla. - Para buscar un conjunto de datos, necesitas el permiso
bigquery.datasets.get
para ese conjunto de datos.
El rol de visualizador de metadatos de BigQuery (roles/bigquery.metadataViewer
) incluye los permisos bigquery.tables.get
y bigquery.datasets.get
, y te permite buscar cualquier recurso de BigQuery.
Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso.
También puedes obtener los permisos necesarios a través de roles personalizados o cualquier otro rol predefinido.
Habilita la API
Para usar la búsqueda, asegúrate de haber habilitado la API de Dataplex. La API de Dataplex se habilita automáticamente para todos los proyectos Google Cloud nuevos con BigQuery. Si la API de Dataplex no está habilitada en tu proyecto, consulta Habilita el catálogo universal de Dataplex.
Buscar recursos
En la consola de Google Cloud , ve a la página Búsqueda de BigQuery.
En el campo de búsqueda, ingresa tu consulta en lenguaje natural y, luego, presiona Intro. Estas son algunas consultas de ejemplo:
Show me the datasets that contain taxi information
Find data on vaccine distribution across different countries
Get tables with historical temperature data for major world cities
Search for hurricane tracking and storm activity datasets
Population data by country
Para filtrar la búsqueda, haz clic en Filtros. Los siguientes filtros están disponibles:
- Alcance: Busca en toda la organización (predeterminada), en el proyecto actual o solo en los recursos destacados. Para obtener más información, consulta la sección Alcance de la búsqueda de este documento.
- Sistemas: Es el Google Cloud servicio al que pertenece el recurso, como BigQuery. El sistema de Dataplex Universal Catalog contiene grupos de entradas.
- Proyectos: Son los proyectos en los que se realizará la búsqueda.
- Tipo: Es el tipo de recurso, como la conexión de BigQuery, el bucket de Cloud Storage o la base de datos. Según el tipo de recurso, también puedes filtrar por subtipo, como el tipo de conexión o el dialecto SQL.
- Seleccionar ubicaciones: Son las ubicaciones en las que se realizará la búsqueda.
- Selecciona conjuntos de datos: Esta opción limita los resultados de la búsqueda a los recursos de BigQuery que pertenecen a los conjuntos de datos de BigQuery seleccionados. En el campo Escribe para filtrar, ingresa el nombre del conjunto de datos.
- Anotaciones: Los tipos de aspecto del catálogo universal de Dataplex que están asociados con el recurso que buscas. Para filtrar por valores de aspecto, haz clic en Filtrar los valores de anotación y, luego, selecciona los valores.
Para quitar un filtro, haz clic en
Borrar junto al filtro específico que deseas quitar. O bien, para quitar todos los filtros, haz clic en Borrar filtros.Para obtener más información sobre cómo se evalúan los filtros, consulta la sección Filtros de este documento.
Opcional: Para ver más información sobre un recurso, haz clic en su nombre en los resultados de la búsqueda.
Se abrirá un resumen de recursos en un panel dividido. Sigue uno de estos pasos:
- Para abrir el recurso en el servicio al que pertenece, haz clic en Abrir en PRODUCT_NAME. Por ejemplo, para abrir un conjunto de datos de BigQuery en BigQuery Studio, haz clic en Abrir en Studio. Las opciones disponibles dependen del recurso.
- Para ver los metadatos del catálogo universal de Dataplex asociados con un recurso, haz clic en Abrir en Dataplex Catalog.
- Si tienes resultados de la búsqueda importantes que quieres agregar a favoritos, puedes marcarlos. Haz clic en Destacar para el recurso. Puedes ver los recursos destacados en BigQuery Studio.
- Para cerrar el resumen de recursos en el panel dividido, haz clic en Cerrar.
Filtros
Los filtros te permiten acotar los resultados de la búsqueda.
Cuando proporcionas filtros en varias secciones, estos se evalúan con el operador lógico AND
. Los resultados de la búsqueda contienen recursos que coinciden con al menos una condición de cada sección seleccionada. Por ejemplo, si seleccionas el
sistema BigQuery y el tipo de recurso dataset
, los resultados de la búsqueda
incluyen conjuntos de datos de BigQuery, pero no de Vertex AI.
Si seleccionas varios filtros dentro de una sola sección, estos se
evalúan con el operador lógico OR
. Por ejemplo, si seleccionas el tipo de recurso dataset
y el tipo de recurso table
, los resultados de la búsqueda incluyen conjuntos de datos y tablas.
Alcance de la búsqueda
En el caso de los proyectos que pertenecen a una Google Cloud organización, la búsqueda opera dentro del alcance de esa organización.
Los resultados de la búsqueda respetan los permisos que tienes sobre los recursos. Por ejemplo, si tienes acceso de lectura de metadatos de BigQuery a un recurso, ese recurso aparecerá en los resultados de la búsqueda. Si tienes acceso a una tabla de BigQuery, pero no al conjunto de datos que contiene esa tabla, la tabla seguirá apareciendo como se espera en los resultados de la búsqueda.
Los resultados de la búsqueda solo incluyen los recursos que pertenecen al mismo perímetro de Controles del servicio de VPC que el proyecto en el que se realiza la búsqueda. Cuando usas la consola de Google Cloud , este es el proyecto que se selecciona en la consola.
¿Qué sigue?
- Aprende a analizar datos en BigQuery Studio.
- Obtén información para usar la búsqueda de palabras clave en el catálogo universal de Dataplex.