OpenWebinars

Explorando metadatos de conjuntos de datos entre proyectos con Data Catalog

Aprende a utilizar Data Catalog, una herramienta del ecosistema GCP, para explorar metadatos de conjuntos de datos entre proyectos gracias a esta formación práctica.


Icono de la tecnología

La metodología y plataforma de formación que se adapta al tamaño y ritmo de tu empresa.

Cuéntanos tu caso

Curso impartido por

Avatar:Jorge López Blasco

Jorge López Blasco

Experto en Cloud Computing, Machine Learning y Big Data.

Contenido de la formación

3 Secciones · 4 Lecciones · 42 min. en total

Introducción

9 min.

Explorar metadatos de conjuntos de datos entre proyectos con Data Catalog

30 min.

Conclusiones

2 min.

Habilidades que obtendrás

  • Explorar en torno empresarial simulado.
  • Navegar manualmente por tabla BigQuery.
  • Ejecutar consultas para entender columnas sensibles.
  • Usar Data Catalog para buscar conjuntos de datos.

Requisitos mínimos

Para realizar este curso es recomendable estar familiarizado con una variedad de servicios de Google Cloud como BigQuery, así como tener una comprensión básica de los conceptos y términos relacionados con los metadatos y la gestión de plantillas.
 

Completa tu formación con estos contenidos

Preguntas frecuentes

Resuelve tus dudas o contacta con nosotros para más información.

Cuéntanos tu caso
Efectivamente, una vez superada cada formación, podrás descargarte el diploma acreditativo de cada una de ellas. Añádelas a tu CV y mejora tu perfil para las empresas. También podrás obtener un diploma de nivel superior al superar todas las formaciones de la ruta.

En OpenWebinars las formaciones no tienen fecha de inicio y de final.

Cada curso tiene una fecha de publicación y desde ese día estarán 100% disponible todos los contenidos del curso para los usuarios suscritos a alguno de nuestros planes.

En OpenWebinars no vendemos formaciones.

Tenemos diferentes tipos de suscripciones, que te dará acceso completo a todas las formaciones de la plataforma y a las nuevas que vamos lanzando, siempre y cuando tu suscripción esté activa (como Spotify con la música o Netflix con las películas y series).

¿Eres una empresa? Tenemos planes especiales para ti. Consúltanos aquí.

Data Catalog es un servicio de administración de metadatos escalable y completamente administrado que pertenece a la familia de productos de análisis de datos de Google Cloud Platform.

Esta herramienta ofrece la posibilidad de tener un lugar centralizado en el que las organizaciones pueden encontrar, seleccionar y describir sus recursos de datos, ya que administrar los recursos de datos requiere de mucho tiempo, además de ser un proceso costoso si no se tienen las herramientas adecuadas.

Para realizar esta formación de forma adecuada se requieren conocimientos previos sobre Google Cloud Platform y sus servicios, en este caso concreto, sobre BigQuery. También se deben tener nociones sobre cloud computing y de los conceptos y términos relacionados con los metadatos y la gestión de plantillas.

En el transcurso de este curso práctico exploraremos un entorno empresarial simulado con 2 proyectos, 2 conjuntos de datos y 2 cuentas de usuario, en primer lugar, lo haremos usando un rol de propietario, y después lo haremos accediendo con el rol de usuario restringido.

Como exploración de los proyectos realizaremos la navegación por una tabla de BigQuery de forma manual en la IU y ejecutaremos consultas para comprender mejor las columnas de datos sensibles que queremos etiquetar más adelante. Como conclusión de esta formación usaremos Data Catalog para buscar conjuntos de datos existentes en los proyectos utilizados.