Recientemente nos hemos convertido en parte del grupo de Select Partners de Snowflake, una noticia que recibimos con mucha ilusión por todas las posibilidades que nos brinda aliarnos con una de las plataformas líderes en Data Warehouse para seguir prestando el mejor servicio a nuestros clientes.
Snowflake es una plataforma SaaS basada en el concepto Data Cloud que proporciona una arquitectura de datos compartidos multi-cluster que permite ejecutar cualquier tipo de carga de trabajo sobre los mismos datos sin cambiar de entorno.
La plataforma introduce funcionalidades únicas como Time-Travel y Zero-Copy-Cloning, que facilitan el trabajo de los ingenieros de datos en desarrollos Agile, además de proporcionar múltiples mecanismos de acceso a los datos y la plataforma, convirtiéndose en un punto único de acceso via UI con su interfaz Snowsight o drivers y conectores como ODBC/JDBC, Node .js, Go, .NET, Kafka, Spark y Python.
Arquitecturade Snowflake
Snowflake consta de tres capas. Las tres se benefician de las características de entornos cloud proporcionando elasticidad, fiabilidad, agilidad, seguridad y reducción de costes, ya que Snowflake se encarga del mantenimiento y actualización continua de la plataforma, que requieren los sistemas tradicionales.
Capa “Cloud Services”
Esta capa es la que se caracteriza por ser el “cerebro” de Snowflake. Es la que controla la autenticación y autorización de los usuarios, optimización de queries, transacciones, metadatos, seguridad/gobernanza de los datos y gestión de la infrastructura. Además, Snowflake introduce el servicio de Data Exchange que permite compartir datos de forma sencilla y transparente, con poco mantenimiento y de forma segura.
Capa “Multi-Cluster Compute”
Esta capa es la que proporciona el motor de procesamiento de datos, llamados Virtual Warehouses. Ofrece opciones flexibles que cubren las necesidades generadas por concurrencia como puede ser en escenarios de Business Inteligencie o Reporting o bien el proceso de gran volumen de datos en escenarios como Data Science y Data Analytics.
Capa “Centralized Storage”
Esta es la capa de Almacenamiento de datos. Snowflake guarda los datos en el sistema de archivos del proveedor cloud elegido, que puede ser Google Cloud (GCP), Amazon Web Services (AWS) o Microsoft Azure.
Los datos se guardan de forma optimizada para permitir su rápido acceso, de forma comprimida y encriptada. No hay limitaciones en la cantidad de datos que se guardan y es totalmente independiente de la capa de procesamiento, por lo que se pueden acceder a los datos simultáneamente desde distintos Virtual Warehouses.