Trasformatori di Frasi nell’Hugging Face Hub

'Transformers in Hugging Face Hub'

Nelle ultime settimane, abbiamo instaurato collaborazioni con molti framework Open Source nell’ecosistema del machine learning. Uno che ci entusiasma particolarmente è Sentence Transformers.

Sentence Transformers è un framework per l’embedding di frasi, paragrafi e immagini. Questo consente di ottenere embedding semanticamente significativi (1), utili per applicazioni come la ricerca semantica o la classificazione multilingue a zero shot. Come parte del rilascio di Sentence Transformers v2, ci sono molte nuove funzionalità interessanti:

  • Facilità di condivisione dei modelli nel Hub.
  • Widget e API di inferenza per l’embedding delle frasi e la similarità delle frasi.
  • Modelli di embedding delle frasi migliori disponibili (benchmark e modelli nel Hub).

Con oltre 90 modelli preaddestrati di Sentence Transformers per più di 100 lingue nel Hub, chiunque può trarne vantaggio e utilizzarli facilmente. I modelli preaddestrati possono essere caricati e utilizzati direttamente con poche righe di codice:

from sentence_transformers import SentenceTransformer
sentences = ["Hello World", "Hallo Welt"]

model = SentenceTransformer('sentence-transformers/paraphrase-MiniLM-L6-v2')
embeddings = model.encode(sentences)
print(embeddings)

Ma non solo questo. Le persone probabilmente vorranno anche dimostrare i propri modelli o giocare con altri modelli facilmente, quindi siamo felici di annunciare il rilascio di due nuovi widget nel Hub! Il primo è il widget feature-extraction che mostra l’embedding della frase.