Jeff Kofman, Fondatore e CEO di Trint – Serie di interviste

Jeff Kofman, Fondatore e CEO di Trint - Una serie di interviste

Jeff Kofman è il fondatore e CEO di Trint, dopo una carriera di 30 anni con ABC, CBS e CBC News, Jeff si è stancato di sbattere contro il muro della trascrizione manuale e di vedere ogni storia fermarsi inutilmente. Nel 2014, Jeff e un team di sviluppatori hanno sfruttato l’intelligenza artificiale per svolgere il lavoro pesante, e Trint è nato.

Oggi Trint è una piattaforma SaaS alimentata da intelligenza artificiale che va oltre la trascrizione per migliorare ogni fase del flusso di lavoro nella creazione di contenuti.

Dalla trascrizione agli strumenti editoriali, dalla collaborazione in tempo reale all’esportazione e pubblicazione; rendendo ogni passo più facile per redazioni giornalistiche, podcaster, piccole imprese e organizzazioni globali per condividere storie più velocemente e facilmente che mai.

Hai avuto una carriera di 30 anni di successo con ABC, CBS e CBC News, quali sono state alcune delle sfide che hai incontrato con la trascrizione manuale tradizionale?

Ho vissuto il dolore della trascrizione manuale ogni giorno come giornalista. Molto tempo prima che avessi l’idea di inventare e costruire Trint, mi chiedevo perché non ci fosse un modo migliore.

La trascrizione manuale è sempre stata il collo di bottiglia nel mio flusso di lavoro come reporter televisivo. Facevo le mie interviste, ascoltavo una conferenza stampa, leggevo le mie ricerche, guardavo le mie riprese e POI…io e il mio produttore sparivamo nel Buco Nero della Trascrizione.

Non posso scrivere la mia storia televisiva finché non ho trascrizioni precise delle citazioni o dei frammenti sonori che voglio utilizzare. Ho bisogno di sapere cosa è stato detto e quanto dura quel frammento sonoro. Questo significava stare in una sala di proiezione o alla nostra scrivania con le cuffie, premere PLAY e poi PAUSA. Poi digitare alcune parole. Poi PLAY. PAUSA. E ripetere. Poteva richiedere ore. Così noioso. Così essenziale.

Trint è stato lanciato nel 2014, puoi parlare di come è nata l’idea?

Non avrei mai immaginato di diventare un esperto di tecnologia. Non faceva parte dei miei piani di vita. E’ successo per caso.

Ho avuto una conversazione informale con alcuni sviluppatori di software che avevano fatto alcuni esperimenti rudimentali con audio e testo (non trascrizioni) nel 2013.

All’epoca ho chiesto ingenuamente: perché non posso utilizzare una conversione automatica del parlato in testo per trascrivere le mie interviste?

Ricordo che uno di loro mi ha chiesto: perché vorresti farlo?

Ho risposto: perché la trascrizione manuale è il punto critico del mio lavoro come reporter, lo odio.

Siamo rimasti in contatto e abbiamo fatto alcuni esperimenti. È diventato subito chiaro che avevamo inventato il futuro. Un anno dopo ho lasciato il mio lavoro come corrispondente a Londra per ABC News e abbiamo iniziato a costruire Trint.

Quali sono state alcune delle sfide nel lanciare un servizio di trascrizione in quei primi giorni?

La trascrizione automatica è un problema distinto. Le persone che non vivono il flusso di lavoro dei reporter e dei creatori di contenuti non hanno idea di come si creano le storie. Ricordo di aver incontrato alcuni investitori privati molto ricchi nei primi giorni e non riuscivano proprio a capire perché reporter come me avessero bisogno di trascrizioni. Ci è voluto molto tempo per spiegare loro come lavora un reporter.

Credo che oggi sia più facile. Siamo tutti creatori di contenuti.

Quali sono gli algoritmi di machine learning attualmente utilizzati in Trint?

Abbiamo un gruppo di ingegneri e scienziati dei dati molto competenti che sperimentano costantemente con tutto ciò su cui possono mettere le mani e fino a dove la loro immaginazione li può portare. Come puoi immaginare, il nostro focus è su come la trascrizione automatica possa velocizzare i flussi di lavoro per i nostri clienti nel settore dei media, il che significa che lavoriamo costantemente sul parlato, gli oratori, le lingue e le acustiche. L’elaborazione del linguaggio naturale e gli algoritmi di elaborazione del parlato sono parte della nostra routine quotidiana, ma indagheremo qualsiasi modo creativo di utilizzare l’intelligenza artificiale per aiutare i giornalisti ad estrarre informazioni da video, audio e immagini. Tramite una trascrizione accurata possiamo fornire più contesto al loro contenuto, renderlo tutto più ricercabile e, in definitiva, consentire loro di trovare i momenti che contano davvero e farli arrivare al loro pubblico il più velocemente possibile.

Quali lingue vengono attualmente offerte e ci sono differenze di qualità di trascrizione tra le diverse lingue?

Offriamo circa 45 lingue che è possibile trascrivere e stiamo sempre aggiungendone altre. Alcune sono in fase di “beta” e altre sono molto più mature, e questo dipende dalla quantità di dati di addestramento che aiutano a costruire i modelli. Misuriamo costantemente l’accuratezza dei nostri modelli per ogni lingua al fine di svilupparli costantemente e migliorarne le prestazioni.

Siamo sempre alla ricerca dei nuovi modelli disponibili per vedere se possiamo integrarli nel nostro ambiente di elaborazione ASR sicuro.

Ma non si tratta solo delle lingue che trascriviamo: i nostri clienti possono anche tradurre la trascrizione in quasi tutte le lingue.

Oltre alla trascrizione, Trint è una piattaforma SaaS basata sull’IA progettata per migliorare il flusso di lavoro di creazione dei contenuti, puoi parlare di alcuni degli altri strumenti offerti?

Anche se al centro di Trint c’è la nostra trascrizione basata sull’IA, ciò su cui ci concentriamo è il motivo per cui queste trascrizioni sono utili ai nostri utenti e come possiamo aiutarli a ottenere valore il più rapidamente e facilmente possibile. Ciò significa avere una profonda comprensione dei loro flussi di lavoro, in modo da poter rendere ogni passaggio il più semplice possibile.

In definitiva, vogliamo che possano registrare qualsiasi conferenza stampa, intervista o evento ovunque, in qualsiasi momento, in qualsiasi lingua e utilizzarla mentre accade. Ciò significa renderlo facile per loro o per il loro team verificare e utilizzare la trascrizione in tempo reale, verificare, condividere e tradurre citazioni chiave pochi secondi dopo che vengono pronunciate.

La nostra app mobile permette che ciò accada anche se hai solo un telefono con te e garantisce che tutto venga trasmesso in modo sicuro al tuo team, anche quando la connessione è instabile.

Il nostro Story Builder è progettato per consentirti di individuare i momenti chiave di tutti i tuoi contenuti e trasformarli in una nuova narrazione che può essere esportata in altri strumenti chiave nel tuo flusso di lavoro di produzione dei contenuti. Che si tratti di un montaggio grezzo per il montaggio video, di una trascrizione per un podcast o di un articolo. Se hai bisogno di utilizzare il testo dell’audio come didascalie, il nostro editor collaborativo può aiutarti anche in questo caso.

Hai anche un podcast che conduci personalmente chiamato StoryTech, che esamina come la tecnologia dia forma alle storie. Puoi spiegarci di cosa si tratta questo podcast, cosa si dovrebbe aspettare come ascoltatori e perché dovrebbero sintonizzarsi?

StoryTech rappresenta davvero l’intersezione delle mie due carriere: giornalista e inventore tecnologico. Esamina come la tecnologia e l’innovazione danno forma al modo in cui vengono raccontate le storie.

Gli episodi iniziali si concentrano su come la CGI è stata utilizzata per abbattere il muro di ghiaccio ne Il Trono di Spade e su come l’invenzione della fotocamera Leica da 35 mm negli anni ’20 ha portato alla diffusione del fotogiornalismo e alla creazione di LIFE magazine.

Sono affascinato dall’impatto dell’innovazione sulla narrazione. Ecco di cosa tratta StoryTech.

Qual è la tua visione per il futuro di Trint?

Questo è la sfida che ogni innovatore sta affrontando oggi. Come può il ritmo veloce dell’innovazione aprire opportunità per il mio prodotto?

I nostri clienti desiderano un prodotto che crei efficienze semplici e intuitive che si integri in modo impeccabile nel loro flusso di lavoro. Ciò significa andare ben oltre la semplice trascrizione.

Trint userà l’IA per fare cose che fino a qualche anno fa erano impensabili: identificare voci, volti, sentimenti, contesto, fatti e falsità. Questo accadrà in qualsiasi lingua, traducendo simultaneamente. La chiave è fare tutto questo e molto altro ancora in modo che si integri con altri prodotti per creare un flusso di lavoro senza problemi.

Non vedo Trint come una sostituzione di giornalisti, scrittori e creatori di contenuti. Si tratta di liberarli dalla fatica del loro lavoro e consentire loro di concentrarsi sulla creatività. È eccitante immaginare il futuro. Non mentirò: è anche spaventoso.

Grazie per l’intervista fantastica, i lettori che desiderano saperne di più possono visitare il sito Trint o guardare il podcast StoryTech.