Il cambiamento di rotta di StackOverflow dalla disruptzione all’opportunità

StackOverflow's shift from disruption to opportunity

OverFlowAI prende il core asset dell’azienda, espone le risposte in un’interfaccia utilizzabile e crea un loop di gen AI per creare nuovi contenuti

Foto di Pakata Goh su Unsplash

Con l’emergere di modelli altamente efficaci come GPT4 che potenziano l’IA generativa, come i professionisti dei dati possono fornire valore a lungo termine alle organizzazioni di cui fanno parte sta evolvendo. Il vero valore deriverà non solo dall’essere la persona tecnicamente più competente nella stanza, ma anche dalla capacità di plasmare come ciò influisce sui prodotti e sui risultati aziendali. Ciò include la capacità di guidare la propria organizzazione verso la giusta strategia dei dati e di plasmare come i prodotti dati si integrano senza soluzione di continuità nelle esperienze dei prodotti. L’analisi in questo articolo sulla trasformazione di StackOverflow rappresenta uno studio di caso convincente verso tale obiettivo.

StackOverflow, la piattaforma più comunemente utilizzata dagli sviluppatori di software per il supporto alla programmazione, ha attraversato un periodo difficile di recente. Se non hai mai utilizzato StackOverflow prima, si tratta di un forum di domande e risposte simile a Quora / Reddit in cui è possibile porre domande relative alla programmazione. Sono passati diversi anni da quando ho scritto codice di qualità di produzione, ma quando lo facevo, StackOverflow era incredibile. Ad esempio, se ti imbattessi negli errori più oscuri durante la compilazione del tuo codice e ricevevi un messaggio di errore che non riuscivi a capire, lo inserivi nella ricerca di Google. Molto spesso, trovavi una pagina di StackOverflow in cui qualcuno aveva posto la stessa domanda e aveva ricevuto una risposta. Meno spesso, trovavi un’altra persona che aveva lo stesso problema oscuro esatto come te ma non aveva ricevuto risposta, in tal caso, buona fortuna. Più precisamente, il 69% delle domande su StackOverflow riceve una risposta, il che è piuttosto impressionante.

Pagina iniziale di StackOverflow

Recentemente, tuttavia, il traffico di StackOverflow è diminuito. I dati di Similarweb mostrano che il loro traffico è diminuito del 14% anno su anno (StackOverflow afferma che è più vicino al 5%). Tuttavia, il trend è al ribasso ed è spiegato principalmente dall’emergere di prodotti di codifica AI come ChatGPT e GitHub Copilot. Questi prodotti hanno capacità significative di scrittura del codice e sono quindi in grado di fornire supporto alla programmazione, almeno in parte, tanto quanto fa StackOverflow. Ironia della sorte, diversi dei grandi modelli di linguaggio (LLM) dietro questi prodotti di intelligenza artificiale sono stati addestrati utilizzando dati di StackOverflow raccolti in modo automatizzato.

L’azienda ha ricevuto una copertura mediatica piuttosto dura con questi sviluppi. Business Insider, nel loro articolo Death by LLM, ha scritto:

Benvenuti nel futuro di Internet in un mondo di intelligenza artificiale. Le comunità online come Stack Overflow e Wikipedia prosperavano come centri per esperti e curiosi che si univano e condividevano liberamente informazioni. Ora questi luoghi di incontro digitali vengono saccheggiati dalle grandi aziende tecnologiche alla ricerca di dati umani per addestrare i loro grandi modelli di linguaggio.

I nuovi prodotti che emergono da questo boom di IA generativa mettono in dubbio il futuro di questi forum online. I chatbot rispondono alle domande in modo chiaro, automatico e spesso piacevole, quindi gli esseri umani non hanno bisogno di interagire con altri esseri umani per ottenere informazioni.

In mezzo a tutta questa attenzione, StackOverflow ha mantenuto una posizione stabile e ha espresso il loro approccio a due punte per affrontare questa sfida:

  1. Alcune settimane fa, hanno annunciato che inizieranno a addebitare ai grandi sviluppatori di intelligenza artificiale che utilizzano le 50 milioni di domande e risposte della piattaforma per l’addestramento dei modelli (abbiamo approfondito questa questione nell’articolo sullo scraping dei dati)
  2. La scorsa settimana, hanno lanciato il prodotto OverflowAI, che è un insieme di funzionalità di intelligenza artificiale generativa effettivamente utili che possono contribuire a dare il via alla loro seconda fase – ci concentreremo su questo oggi

In questo articolo, approfondiremo:

  • Strumenti di scrittura del codice AI che stanno sconvolgendo StackOverflow
  • Cosa fa OverflowAI
  • Tendenze sottostanti della strategia di StackOverflow

Strumenti di scrittura del codice AI che stanno sconvolgendo StackOverflow

Oggi sul mercato ci sono diversi strumenti di scrittura e modifica del codice basati su intelligenza artificiale. Questi sono prodotti indipendenti (come OpenAI Codex, ChatGPT, Google Bard) o prodotti integrati nativamente all’interno di piattaforme esistenti (come GitHub Copilot, Replit Ghostwriter, Amazon CodeWhisperer). Hanno una vasta gamma di funzionalità, tra cui generazione di codice, modifica del codice, completamento automatico e debug.

I prodotti che hanno una distribuzione nativa (come GitHub Copilot) hanno un grande vantaggio perché possono funzionare senza problemi all’interno degli ambienti che i programmatori utilizzano già oggi, e vedremo sempre più prodotti che cercano di collegarsi agli ambienti esistenti. Ad esempio, CodeGPT ha un plugin che consente agli sviluppatori di utilizzare il prodotto all’interno di Visual Studio Code (uno strumento popolare per la modifica del codice).

Gli strumenti esistenti per la scrittura di codice con intelligenza artificiale sono bravi in determinati compiti. Ad esempio, questo thread di Reddit raccoglie feedback da diversi sviluppatori web su GitHub Copilot – il tema principale è che il prodotto è utile in un sottoinsieme di situazioni in cui gli sviluppatori devono scrivere codice completamente nuovo e non vogliono perdere tempo a scriverlo da zero. Anche in queste situazioni, spesso è un colpo di fortuna.

La ragione non sorprende. Concettualmente, i grandi modelli di linguaggio (LLM) prendono una quantità enorme di dati e generano un’output sulla base di questa costruzione: in un determinato contesto, per la domanda che hai fatto, qual è la parola / testo più probabile da seguire alla parola precedente. Calcola essenzialmente la probabilità di una parola che segue un’altra e genera un’output basato su questo. Nonostante questa costruzione, date le quantità di dati utilizzate per addestrare questi modelli, i risultati per i casi d’uso più generali di ChatGPT (come scrivere una e-mail o riassumere una pagina) sono stati impressionanti. Ma è importante ricordare che i modelli di linguaggio, per loro natura, hanno capacità analitiche / matematiche limitate. In altre parole, quando chiedi al modello “quanto fa 2+2”, potrebbe darti la risposta corretta – non perché conosce la matematica, ma perché ha visto quel modello di testo nei suoi dati di addestramento.

Allo stesso modo, quando si tratta di generazione di codice, il modello non “conosce” davvero i concetti fondamentali della programmazione, ma predice i risultati in base al suo addestramento con una grande quantità di dati di testo. La conseguenza di questo è il feedback su GitHub Copilot sopra menzionato – a volte è bravo a generare il codice di base di cui hai bisogno, ma la sua capacità di capire realmente il codice, debuggare e fornire spiegazioni è limitata. Questo migliorerà nel tempo, ma è difficile dire se raggiungerà mai un alto livello di accuratezza e affidabilità.

Il CEO di StackOverflow, Prashanth Chandrasekar, lo descrive in modo succinto:

Un problema dei moderni sistemi LLM è che forniscono risposte errate con la stessa fiducia di quelle corrette e “allucinano” fatti e cifre se ritengono che si adattino al modello della risposta cercata dall’utente.

Arriverà il momento in cui dovrai sapere cosa stai costruendo. Potresti doverlo debuggare e non avere idea di cosa sia appena stato creato ed è difficile saltare il percorso di apprendimento prendendo scorciatoie.

Questa è l’opportunità per StackOverflow: la diminuzione del traffico potrebbe essere permanente ed è molto probabile che i programmatori si rivolgano a StackOverflow meno spesso per domande più semplici (ad esempio, potrebbero non visitare più StackOverflow per un algoritmo di ordinamento già pronto). Ma dove il prodotto può brillare è: 1) fornire risposte ad alta accuratezza / alta affidabilità a domande più complesse che i modelli di linguaggio potrebbero non essere in grado di rispondere e 2) fornire risposte a domande su nuove tecnologie / spazi problemi su cui i modelli non hanno avuto dati precedenti su cui addestrarsi. OverflowAI è progettato per sfruttare direttamente questa opportunità.

Cosa fa OverflowAI

Ci sono tre aspetti chiave su cui puntano: risposte dirette alle domande, utilizzabilità all’interno degli ambienti di sviluppo e potenziamento delle conoscenze all’interno delle aziende.

OverflowAI Search fornisce risposte dirette agli utenti in formato Q&A (simile a ChatGPT), ma fornisce anche diversi link a post di StackOverflow reali. Oltre ad aiutare a creare fiducia, ciò offre agli utenti l’opportunità di approfondire l’argomento quando la risposta fornita dall’IA non risolve completamente il problema dell’utente. Questo trova un equilibrio delicato tra fornire una risposta diretta quando la domanda è semplice, ma anche guidare l’utente lungo un percorso più esplorativo per domande difficili.

OverflowAI Search (Source: captured from OverflowAI demo video)

Se l’utente non è soddisfatto delle risposte, può accedere a una interfaccia simile a una chat per fare domande di approfondimento. Se nessuna delle risposte è soddisfacente, può chiedere a StackOverflow di redigere una domanda per suo conto, pronta per essere pubblicata sul forum Q&A. Questa esperienza salva anche gli utenti dalla situazione spesso ricorrente in cui la domanda che fanno è già stata risposta in precedenza.

Bozza automatica di domande (fonte: catturata dal video dimostrativo di OverflowAI)

Il prodotto punta anche sull’usabilità mettendo a disposizione tutte queste funzionalità tramite un’estensione in Visual Studio Code. Ciò aiuta StackOverflow a competere in modo più efficace con gli assistenti di codifica integrati nativamente, consentendo agli sviluppatori di ottenere risposte all’interno del loro ambiente di sviluppo (anziché dover passare a un browser per fare una ricerca).

Estensione all'interno di Visual Studio Code (fonte: catturata dal video dimostrativo di OverflowAI)

Inoltre, per i clienti enterprise, OverflowAI sta creando la possibilità di collegare diverse fonti di informazione all’interno di un’azienda (Q&A interne, pagine wiki, repository di documenti) per offrire un’esperienza Q&A coerente per gli sviluppatori. Poter utilizzare i dati interni e quelli di StackOverflow, e soprattutto esporli facilmente in un’interfaccia di tipo Q&A, può essere un grande impulso per la produttività delle organizzazioni di ingegneria. Hanno anche l’intenzione di lanciare un’integrazione con Slack come interfaccia senza soluzione di continuità per sfruttare queste funzionalità.

Ciò che è impressionante nell’approccio al prodotto di OverflowAI è che prende l’elemento centrale dell’azienda (risposte a domande difficili), espone le risposte in un’interfaccia altamente utilizzabile ovunque si trovino gli utenti (sia su Slack che all’interno degli ambienti di sviluppo) e crea un ciclo in cui gli utenti possono sfruttare l’IA generativa per inviare nuove domande.

StackOverflow non è esattamente un’azienda pubblica – è di proprietà di Prosus, che a sua volta fa parte di un’azienda madre più grande, Naspers, che è quotata in borsa. Pertanto, è difficile ottenere dati di fatturato precisi, ma un rapporto di Prosus pubblicato nel maggio 2022 fornisce alcune indicazioni:

  • L’azienda ha generato circa 89 milioni di dollari di ricavi nel 2022, suddivisi al 50-50 tra il prodotto enterprise StackOverflow for Teams e i prodotti Reach (pubblicità e branding aziendale)
  • Dal 2021 al 2022, i ricavi di StackOverflow for Teams sono aumentati del 69%, mentre i ricavi dei prodotti Reach sono diminuiti del 12% (potrebbero esserci stati fattori esterni che hanno influenzato il fatturato del 2022, come una riduzione delle assunzioni)
Numeri di fatturato dal proprietario di StackOverflow Prosus (dati di maggio 2022)

Questi dati di fatturato combinati con ciò che fa il prodotto OverflowAI indicano alcune tendenze chiare riguardo a dove si sta dirigendo StackOverflow nel mondo dell’IA generativa (queste tendenze possono essere estese anche ad altre piattaforme Q&A):

  1. Il loro business pubblicitario, il cui successo dipende direttamente dal traffico, è in declino. Questo non è necessariamente un problema e indica semplicemente una tendenza più ampia: ci saranno probabilmente meno visualizzazioni di pagine perché i consumatori otterranno direttamente risposte a domande più facili (cosa positiva) e quindi la pubblicità diventa una fonte di ricavi meno critica.
  2. StackOverflow continuerà ad essere una fonte preziosa di risposte a domande difficili, e il volume di domande e risposte continuerà a crescere grazie all’impulso dell’IA generativa dell’azienda per la stesura / invio automatico di domande. Inoltre, è anche probabile che se StackOverflow riesce a mantenere in funzione il motore di contenuti, la qualità dei contenuti sulla piattaforma migliorerà, poiché le domande ripetitive / facili non saranno più la maggior parte dei contenuti.
  3. StackOverflow si impegnerà a costruire esperienze in cui può offrire il massimo valore agli utenti (come OverflowAI Search e l’estensione Visual Studio Code), e si concentrerà su linee di prodotto in cui i clienti sono disposti a pagare per queste esperienze superiori (ad esempio StackOverflow for Teams).
  4. I programmi di licenza dei dati, in cui addebitano alle aziende di intelligenza artificiale la formazione sui loro dati, accelereranno

Tutte le tendenze indicano una direzione in cui StackOverflow sta riuscendo a fare una transizione verso la prossima fase dell’azienda, e l’azienda ha fatto gli investimenti giusti in prodotti / business per far fronte a quella che poteva essere una possibile interruzione. Inoltre, hanno anche svolto un prezioso servizio alla comunità e hanno delineato una strategia per consentire ad altre piattaforme Q&A di trarne vantaggio. Nel complesso, sono ottimista riguardo alla direzione in cui si stanno dirigendo e penso che ciò darà vita a un ecosistema di contenuti prospero in futuro.

🚀 Se hai apprezzato questo articolo, considera di iscriverti alla mia newsletter settimanale. Ogni settimana, pubblico un’analisi approfondita su un argomento tecnologico / strategia di prodotto attuale sotto forma di una lettura di 10 minuti. Cordiali saluti, Viggy.