TiDE l’MLP ‘imbarazzantemente’ semplice che batte i Transformers

TiDE l'MLP una semplicità 'imbarazzante' che batte i Transformers

Un’esplorazione approfondita di TiDE, la sua implementazione utilizzando Darts e un confronto con DeepAR in un caso d’uso reale (un’architettura Transformer)

Mentre le industrie continuano a evolversi, l’importanza di una previsione accurata diventa un asset non negoziabile, che tu lavori nel settore dell’e-commerce, della sanità, del commercio al dettaglio o persino nell’agricoltura. La capacità di prevedere ciò che accadrà e pianificare di conseguenza per affrontare le sfide future è ciò che può farti andare oltre la concorrenza e prosperare in un’economia in cui i margini sono ridotti e i clienti sono più esigenti che mai.

Le architetture dei Transformer sono state il tema caldo nel campo dell’IA negli ultimi anni, specialmente per il loro successo nel Natural Language Processing (NLP), come ad esempio il chatGPT che ha attirato l’attenzione di tutti, sia che tu fossi un appassionato di IA o meno. Ma il NLP non è l’unico ambito in cui i Transformer hanno dimostrato di superare le soluzioni di stato dell’arte, anche nel Computer Vision, come ad esempio con Stable Diffusion e le sue varianti.

Ma i Transformer possono superare i modelli di stato dell’arte nella previsione delle serie temporali? Nonostante siano stati fatti molti sforzi per sviluppare i Transformer per la previsione delle serie temporali, sembra che per orizzonti a lungo termine, modelli lineari semplici possano superare diversi approcci basati sui Transformer.

In questo articolo esplorerò TiDE, un semplice modello di apprendimento profondo in grado di superare le architetture dei Transformer nella previsione a lungo termine. Fornirò inoltre un’implementazione passo-passo di TiDE per la previsione delle vendite settimanali utilizzando Darts, una libreria per la previsione in Python. Infine,confronterò le performance di TiDE e DeepAR in un caso d’uso reale della mia azienda.

Figura 1: TiDE, un nuovo modello di previsione che è sorprendentemente semplice, MLP per superare i Transformer (fonte)

Come sempre, il codice è disponibile su Github.

Modello Encoder-Dense per Serie Temporali (TiDE)

TiDE è un nuovo modello codificatore-decodificatore per serie temporali che ha dimostrato di superare i modelli dei Transformer di stato dell’arte nella previsione a lungo termine [1]. È un modello di serie temporali multivariato in grado di utilizzare covariate statiche (ad esempio il marchio di un prodotto) e covariate dinamiche (ad esempio il prezzo di un prodotto) che possono essere…