Ce travail traite du développement de méthodes de « Data Science » (machine learning, fouille de données, intelligence artificielle, big data) pour améliorer la gestion et la production d’énergies renouvelables. Il s’agit plus précisément de s’intéresser aux problèmes de la prévision des pannes des éoliennes et de la prévision du flux solaire pour des fermes photovoltaïques, des enjeux importants pour la production et l’intégration de ces énergies renouvelables. Même si les problématiques sont très différentes, les données générées partagent beaucoup de points communs ce qui laisse envisager la mise en place d’approches génériques pouvant bénéficier aux deux. Dans ces deux applications, une très grande quantité de données est enregistrée quotidiennement pour suivre l’évolution de la production, du matériel et des conditions météos. Ces données se présentent sous la forme de séries temporelles multivariées (numériques et symboliques). Les méthodes existantes sont limitées face à la complexité de telles données spatio-temporelles volumineuses, hétérogènes, et bruitées.
L’objectif de cette thèse est de développer de nouvelles méthodes/algorithmes pour faire de la prédiction à partir de telles données. Nous nous intéresserons plus particulièrement aux approches de classification supervisée à partir de motifs, une classe de méthodes ayant reçu une attention croissante de la communauté ces dernières années.