Celia Lozano Grijalba, Tech Lead Data Scientist en Bosonit, nos comparte el proyecto Sktime, orientado a la resolución de problemas con las series temporales de ciencia de datos en Python.
Resolver problemas de Data Science con series temporales en Python es un desafío. ¿Por qué? Las herramientas existentes no se adaptan bien a las tareas de series de tiempo y tampoco se integran fácilmente. Los modelos del paquete scikit-learn asumen que los datos están estructurados en un formato tabular. También asume que cada columna es id, suposiciones que no se aplican a los datos de series de tiempo. Los paquetes que contienen módulos de aprendizaje de series temporales, como modelos de estadísticas, no se integran bien entre sí.
Además, muchas operaciones esenciales de series de tiempo, como la división de datos en conjuntos de pruebas y trenes a lo largo del tiempo, no están disponibles en los paquetes de Python existentes. Para abordar estos desafíos, se creó Sktime.
Sktime es un proyecto impulsado por la comunidad financiado por el Consejo de Investigación Económica y Social del Reino Unido, el Centro de Investigación de Datos del Consumidor y el Instituto Alan Turing (donde Celia tuvo la oportunidad de trabajar durante su estancia en Manchester).
Este proyecto extiende y la API scikit-learn a tareas de series de tiempo. Proporciona los algoritmos y las herramientas de transformación necesarios para resolver eficazmente las tareas de clasificación, pronóstico y regresión de series de tiempo.
Si quieres conocer más información sobre Sktime. En el siguiente enlace podrás averiguar más sobre Sktime:
Autora: Celia Lozano Grijalba, Tech Lead Data Scientist en Bosonit.