Top 5 API di diffusione stabili per un’integrazione semplice dell’app

Top 5 API di distribuzione stabili per una facile integrazione dell'app

Introduzione

Le API sono la soluzione in quest’era dell’Intelligenza Artificiale, in cui una delle sfide più significative per le aziende è gestire le elevate esigenze di calcolo dei modelli di IA quando li si integra nel software e nelle applicazioni. La soluzione a questo problema sono le interfacce di programmazione delle applicazioni (API). Le API ti risparmiano dai problemi di manutenzione, consentendoti di concentrarti sulla logica aziendale e sull’esperienza utente. Ciò significa che chiunque può sfruttare queste API per costruire e commercializzare app. Questo articolo approfondirà le Stable Diffusion APIs, un set di modelli di AI generativi focalizzati sulla generazione di immagini, che sono diventati cruciali per varie applicazioni.

Inizieremo vedendo l’API Segmind, un’opzione molto efficiente ed efficace. Queste API hanno rivoluzionato il modo in cui gli sviluppatori, i designer e i creatori affrontano la generazione di contenuti visivi. Esploreremo le migliori 5 Stable Diffusion APIs, mettendo in evidenza le loro caratteristiche, casi d’uso, prezzi e altro ancora.

Obiettivi di apprendimento

  • Acquisire conoscenze sui modelli di Stable Diffusion.
  • Comprendere i fondamenti dei modelli di Stable Diffusion, inclusa la loro applicazione.
  • Comprendere le API nello sviluppo software moderno.
  • Esplorare come le API svolgono un ruolo cruciale nella semplificazione dello sviluppo di software e app.

Questo articolo è stato pubblicato come parte del Data Science Blogathon.

Comprensione dei modelli di Stable Diffusion

Cosa sono i modelli di Stable Diffusion?

I modelli di Stable Diffusion sono una classe di modelli di AI generativi che si concentrano sulla generazione di immagini di alta qualità. Questi modelli sono progettati per produrre immagini realistiche ad alta risoluzione con varie applicazioni. Si caratterizzano per la loro stabilità e affidabilità, che sono utili per compiti come la sintesi di immagini, il trasferimento di stile e l’aumento dei dati.

I modelli di Stable Diffusion utilizzano un processo di diffusione per generare immagini, in cui il rumore viene aggiunto gradualmente a un’immagine fino a evolversi in un output complesso e coerente. Questo processo garantisce che le immagini generate siano di alta qualità e presentino dettagli accurati.

Cosa sono le API?

Le API, o Interfacce di Programmazione delle Applicazioni, sono un insieme di regole e protocolli che consentono a un’applicazione software di interagire e utilizzare le funzionalità o i dati di un’altra applicazione, servizio o piattaforma. Le API sono intermediari, consentendo l’integrazione tra software.

Nello sviluppo software, le API forniscono un modo per i programmatori di accedere a funzioni, servizi o dati da fonti, tra cui servizi cloud, basi di dati o modelli di AI, senza dover comprendere le complessità sottostanti. Ciò semplifica lo sviluppo e accelera la creazione di applicazioni ricche di funzionalità.

Le API possono assumere diverse forme, tra cui API RESTful, API gRPC e API WebSocket, ognuna adattata a specifici casi d’uso. Svolgono un ruolo fondamentale nel software moderno, consentendo agli sviluppatori di sfruttare la potenza di servizi e funzionalità di terze parti concentrandosi sulla logica di base dell’applicazione.

Le migliori 5 Stable Diffusion APIs

Analizziamo le migliori Stable Diffusion APIs nella nostra lista, a cominciare dalla user-friendly API Segmind.

1. API Segmind Stable Diffusion

In cima alla nostra lista c’è l’API Segmind, nota per la sua facilità d’uso e installazione minima. Se hai esperienza nell’utilizzo di strumenti API standard come Postman, non è necessario imparare nulla di nuovo. Vedremo brevemente come fare. Puoi fare riferimento a questo articolo https://www.analyticsvidhya.com/blog/2023/09/genai-app-integration-using-segmind-api-and-postman/ per un approccio dettagliato all’utilizzo di Segmind e Postman.

Il GenAI API di Segmind fornisce molti scopi, capacità e vantaggi. Alcuni includono il riconoscimento delle immagini nel settore dell’e-commerce, della moda, dell’architettura come DvArch, dell’animazione, della rimozione dello sfondo, ecc. I modelli di intelligenza artificiale di Segmind sono disponibili tramite l’API e il playground sul sito web all’indirizzo https://www.segmind.com/models.

Perché Segmind APIs?

Ci sono molte ragioni per cui Segmind si trova in cima alla nostra lista qui.

  • Velocità: Segmind fornisce agli sviluppatori accesso alle API di Diffusione Stabile Senza Server più veloci.
  • Accessibilità: Le ottimizzazioni di Segmind ti aiutano a ottenere le inferenze più convenienti in base al numero di chiamate API.
  • Semplicità di utilizzo: Deploya i loro API ad alte prestazioni con una semplice integrazione API con un solo clic e scala senza problemi.
  • Scalabilità: Segmind scala automaticamente per gestire la domanda. Paghi solo per le chiamate API.

Demo con Segmind API Playground

Il playground API rende molto facile utilizzare i modelli in pochi secondi. Per dimostrare come funziona facilmente il playground API, considereremo i nuovi potenti modelli di diffusione stabile chiamati “Dreamshaper SDXL”. Hai solo bisogno di un account, che puoi impostare in pochi minuti. Vai su https://www.segmind.com/ per registrarti. Dopo esserti registrato, vai alla pagina dei modelli e cerca ‘Dreamshaper SDXL’, un nuovo rilascio. Oppure segui questo link https://www.segmind.com/models/sdxl1.0-dreamshaper. Una volta cliccato sul modello, vedrai il playground. Oltre al playground, conoscerai l’interfaccia di chiamata API, come mostrato nella schermata sottostante.

Per provare l’immagine sopra, ecco il prompt che ho usato:

Svelare un ritratto cinematografico: il Gatto Brontolone 1.25 in una tuta spaziale, sfondo città di Cyberpunk 2077, capolavoro 2D di John Wilhelm, Grumpy 1.2, Cyberpunk 1.4, foto realistica, rendering Octane, HDR, neon, lens flares, migliore qualità 1.9, posa asimmetrica attiva, piena d'azione 1.8, tendenza su ArtStation, 8K, fotografia 35mm, film, bokeh, professionale, 4K, altamente dettagliato.

Il precedente approccio è per l’utilizzo del playground, che è direttamente disponibile sul sito web. L’altra opzione disponibile è l’API. Questa è un’opzione potente su Segmind. Qui puoi utilizzare le chiamate API per costruire la tua app e goderti il modello Segmind.

Utilizzo delle chiamate API di Segmind

Le chiamate API eliminano la necessità di ospitare questi modelli di grandi dimensioni e costosi. Non ti preoccupi della manutenzione del server o dell’hosting. Devi avere conoscenze di base sulle funzionalità delle API come l’utilizzo di Postman. L’intero processo rimane lo stesso delle normali chiamate API. Supponendo di utilizzare Javascript per la tua app web, di seguito è riportato lo script per effettuare una richiesta POST su Dreamshaper SDXL. Questo risponderà con un’immagine jpeg.

import requestsapi_key = "YOUR API-KEY"url = "https://api.segmind.com/v1/sdxl1.0-dreamshaper"# Payload della richiestadata = {  "prompt": "cinematic photo of portrait of cyberpunk (the Grumpy Cat:1.25) in a spacesuit, looking with endless sadness at the universe passing by, cyberpunk 2077 city bg,  2d masterpiece by john Wilhelm, (grumpy:1.2), (cyberpunk:1.4), photo-realistic, octane render, hdr, neon, lens flares, ( best quality:1.9), active asymmetrical pose, (action-packed:1.8),  trending on artstation, 8k, 35mm photograph, film, bokeh, professional, 4k, highly detailed",  "negative_prompt": "drawing, painting, crayon, sketch, graphite, impressionist, noisy, blurry, soft, deformed, ugly, [deformed | disfigured], poorly drawn, [bad : wrong] anatomy, [extra | missing | floating | disconnected] limb, (mutated hands and fingers), blurry",  "samples": 1,  "scheduler": "UniPC",  "num_inference_steps": 35,  "guidance_scale": "7",  "seed": "1135424276",  "img_width": "1024",  "img_height": "1024",  "base64": False}response = requests.post(url, json=data, headers={'x-api-key': api_key})print(response)

Segmind ha fatto in modo che ogni modello abbia il suo script di chiamata API sulla pagina come documenti individuali per facilità e accessibilità. Tutto quello che devi fare è fare una richiesta POST da Postman. Supponendo che stai sviluppando con Python, hai lo script per Python come mostrato di seguito:

import requestsapi_key = "LA TUA API-KEY"url = "https://api.segmind.com/v1/sdxl1.0-dreamshaper"# Payload della richiestadata = {  "prompt": "foto cinematografica di un ritratto di cyberpunk (il Gatto Arrabbiato:1.25) in una tuta spaziale, che guarda con tristezza infinita l'universo che passa, sfondo della città di cyberpunk 2077, capolavoro 2D di john Wilhelm, (urrpigno:1.2), (cyberpunk:1.4), fotorealismo, renderizzazione di ottane, hdr, neon, lens flares, (migliore qualità:1.9), posa asimmetrica attiva, (ricca d'azione:1.8), di tendenza su artstation, 8k, fotografia da 35mm, film, bokeh, professionale, 4k, altamente dettagliata",  "negative_prompt": "disegno, pittura, pastello, schizzo, grafiti, impressionista, rumoroso, sfocato, morbido, deformato, brutto, [deformato | sfigurato], disegno mal riuscito, anatomia [errata | sbagliata], [extra | mancante | fluttuante | disconnesso] arto, (mani e dita mutate), sfocato",  "samples": 1,  "scheduler": "UniPC",  "num_inference_steps": 35,  "guidance_scale": "7",  "seed": "1135424276",  "img_width": "1024",  "img_height": "1024",  "base64": False}response = requests.post(url, json=data, headers={'x-api-key': api_key})print(response)

Tutto quello che devi fare è cambiare il tuo prompt nei dati e la risposta che ottieni è l’immagine generata come jpeg. Puoi esplorare ulteriormente o fare riferimento a questo articolo https://www.analyticsvidhya.com/blog/2023/09/genai-app-integration-using-segmind-api-and-postman/ per una guida dettagliata sull’utilizzo di Segmind con Postman o visitare la documentazione o il repository GitHub per ulteriori informazioni. I link sono riportati alla fine dell’articolo. Successivamente, vedremo brevemente altri fornitori di API di SD.

2. Stabilità AI API — Generative AI di origine aperta

Stabilità AI, un leader nell’intelligenza artificiale generativa open-source, è dedicato all’avanzamento dell’infrastruttura e della ricerca. Il loro ethos open-source supporta linguaggio, codice, audio, video, contenuti 3D, design e biotecnologia. Questo mira ad abilitare l’umanità con il potenziale dell’AI.

La API di Stabilità AI offre un approccio flessibile all’autenticazione, ai crediti e alle chiamate API. Gli utenti devono creare un account per ottenere una chiave API, che è essenziale per accedere all’API. I crediti sono necessari per utilizzare l’API di Stabilità, con i nuovi utenti che ricevono 25 crediti gratuiti all’iscrizione.

Utilizzo delle chiamate API

Stabilità AI è un po’ complesso per i principianti poiché fornisce più di un tipo di API. Oltre alla normale REST, forniscono anche un’API gRPC. Puoi dare un’occhiata a GitHub per alcune guide tecniche disponibili qui https://github.com/Stability-AI/. Puoi controllare la documentazione che fornisce tutte le chiamate API ma per effettuare una generazione di testo-immagine, la struttura appare come segue con il linguaggio Python.

import base64import osimport requestsengine_id = "stable-diffusion-xl-1024-v1-0"api_host = os.getenv('API_HOST', 'https://api.stability.ai')api_key = os.getenv("STABILITY_API_KEY")if api_key is None:    raise Exception("Manca la chiave API di Stabilità.")response = requests.post(    f"{api_host}/v1/generation/{engine_id}/text-to-image",    headers={        "Content-Type": "application/json",        "Accept": "application/json",        "Authorization": f"Bearer {api_key}"    },    json={        "text_prompts": [            {                "text": "Un faro su una scogliera"            }        ],        "cfg_scale": 7,        "height": 1024,        "width": 1024,        "samples": 1,        "steps": 30,    },)if response.status_code != 200:    raise Exception("Risposta non 200: " + str(response.text))data = response.json()for i, image in enumerate(data["artifacts"]):    with open(f"./out/v1_txt2img_{i}.png", "wb") as f:        f.write(base64.b64decode(image["base64"]))

Per gli sviluppatori che utilizzano altri linguaggi, esiste uno script sia per Typescript che per Go. Puoi consultare la loro documentazione per ulteriori dettagli. Ora vediamo la prossima API.

3. Hotpot.ai Stable Diffusion API – Personalizzata per le tue esigenze

L’API di Hotpot.ai’s Stable Diffusion offre diverse opzioni per soddisfare requisiti diversi. Progettata con ottimizzazioni proprietarie per aziende e consumatori, offre un modello di diffusione stabile personalizzabile ed economico. Ti permette di generare immagini senza bisogno di registrarti. Utilizzeremo il loro generatore di arte AI per creare un’immagine utilizzando la prima frase del nostro prompt precedente.

Prompt:

Crea un'opera d'arte che fonde gli elementi del cyberpunk e dell'esplorazione spaziale futuristica.

Possiamo facilmente utilizzare il parametro ‘Style’ per regolare l’immagine. Cambiando stile otteniamo l’immagine sottostante.

Prezzi: Il costo dell’API dipende da fattori come il volume mensile, i piani di sottoscrizione e gli sconti di co-marketing. È fondamentale fare attenzione alle offerte che promettono pacchetti illimitati, in quanto potrebbero compromettere affidabilità e latenza. Hotpot.ai garantisce la scalabilità, gestendo milioni di richieste di generazione immagini mantenendo una latenza ridotta e un’alta affidabilità.

Accesso all’API: L’accesso all’API è reso facile grazie all’Editor Online di Stable Diffusion, che offre risultati identici all’API. La differenza principale sta nella velocità, in quanto gli utenti dell’API ottengono accesso a server privati più potenti per una generazione immagini più rapida. Hotpot.ai fornisce persino crediti di prova gratuiti per la loro API di Stable Diffusion, rendendola accessibile agli sviluppatori.

Inoltre, Hotpot.ai si mantiene al passo con le ultime versioni di Stable Diffusion, offrendo attualmente la versione 2.1 con piani di integrazione di Stable Diffusion XL per scopi commerciali.

Vediamo lo script di chiamata API per Hotpot. Hotpot.ai offre l’API di Stable Diffusion come versioni budget, standard e premium. Per utilizzare l’API con Python è necessario installare prima “request”.

!pip3 install requestimport requestsheaders = {  'Authorization': 'API_KEY_HERE',}# cambia con il percorso completo dell'immagine che desideri trasformarebody = {  'image': open('/percorso/completo/all\'immagine.jpg', 'rb'),}response = requests.post('https://api.hotpot.ai/remove-background', headers=headers, files=body)# cambia con il percorso completo dove desideri salvare l'immagine risultantewith open('/percorso/completo/immagine-senzosfondo.jpg', 'wb') as file:  file.write(response.content)

Anche se stai utilizzando il vecchio e affidabile PHP, qui non sei escluso.

<?php$ch = curl_init();// cambia con il percorso completo dell'immagine che desideri trasformare$body = [  'image' => new CurlFile('/percorso/completo/all\'immagine.jpg')];curl_setopt($ch, CURLOPT_URL, 'https://api.hotpot.ai/remove-background');curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);curl_setopt($ch, CURLOPT_POST, 1);curl_setopt($ch, CURLOPT_POSTFIELDS, $body);$headers = array('Authorization: API_KEY_HERE');curl_setopt($ch, CURLOPT_HTTPHEADER, $headers);$response = curl_exec($ch);curl_close($ch);// cambia con il percorso completo dove desideri salvare l'immagine risultantefile_put_contents('/percorso/completo/immagine-senzosfondo.jpg', $response);

Se hai bisogno di ulteriori informazioni, puoi controllare il GitHub qui.

4. ZYLA Stable Diffusion API – Generazione Immagini Ridefinita

L’API Stable Diffusion di ZYLA sfrutta il modello di ultima generazione Stable Diffusion v2.1 per produrre immagini di alta qualità. Questa API offre funzionalità avanzate di generazione immagini, scalabilità e un’interfaccia facile da usare. Sviluppatori, designer e creatori di contenuti possono migliorare i loro progetti con immagini sorprendenti e realistiche. Zyla è come un negozio online di API. Ci concentreremo solo sulle API di Stable Diffusion.

Casi d’uso notevoli per la ZYLA SD API

Design grafico e pubblicità: Ideale per creare grafiche accattivanti per siti web, social media e annunci stampati.

Realtà virtuale e realtà aumentata: Migliora la fedeltà visiva nelle applicazioni VR e AR.

Creazione di contenuti e produzione multimediale: Supporta registi, sviluppatori di giochi e studi di animazione nella produzione di contenuti coinvolgenti.

E-commerce e visualizzazione di prodotti: Migliora l’esperienza di shopping con immagini realistiche dei prodotti.

Esplorazione artistica ed espressione creativa: Incoraggia la creatività e l’esplorazione artistica.

Modifica e miglioramento delle immagini: Fornisce agli editor di immagini strumenti avanzati.

La maggior parte delle API offre una prova gratuita di 7 giorni. Puoi registrararti e verificare se corrisponde alle tue esigenze.

L’API per l’AI, l’API dell’Image Generator, supporta Postman come AI di Segmind. Dopo esserti registrato, riceverai una chiave di accesso personale all’API. Questa viene utilizzata per l’autenticazione con l’API REST dell’AI Image Generator, includendo semplicemente il tuo token di autenticazione nell’header di autorizzazione. La variabile dell’header su Postman è

Authorization

Devi registrarti per accedere all’API. Dopo esserti registrato, cerca “La tua chiave di accesso all’API” e imposta [Obbligatorio] per l’accesso con Bearer access_key.

Bearer access_key

Tieni presente che ZYLA è più simile a un negozio online per API e l’API SD è solo una delle collezioni.

5. API Getimg.ai

Questa API ti consente di generare e modificare immagini utilizzando gli ultimi modelli basati su Stable Diffusion. Puoi utilizzare questa API per flussi di lavoro di generazione di immagini, come conversione di testo in immagine, ControlNet, inpainting, ingrandimento e altro ancora.

Semplificano molto la codifica. Ecco un esempio su come effettuare una richiesta POST all’API Stable Diffusion per la generazione di immagini da testo utilizzando cURL:

curl \-X POST https://api.getimg.ai/v1/stable-diffusion/text-to-image \-H "Authorization: Bearer $ACCESS_TOKEN" \-H "Content-Type: application/json" \-d '{"prompt":"una foto di un astronauta che cavalca un cavallo su Marte"}'

Puoi utilizzare il prompt sopra nel playground per provare il modello. Il campione di seguito genera contemporaneamente 4 immagini. Questo è utile per generare foto di stock.

Puoi personalizzare il prompt per generare immagini diverse in base alle tue esigenze.

Inoltre, getimg.ai offre diverse opzioni di prezzo in base alla dimensione, ai passaggi e ai flussi di lavoro che scegli. Ad esempio, Stable Diffusion XL con una risoluzione di 1024×1024 pixel e 30 passaggi ha un prezzo di $0.00944 per immagine.

Puoi trovare ulteriori informazioni su questa API, i suoi casi d’uso e i prezzi sul sito web getimg.ai, e puoi esplorare le funzionalità e i modelli che offrono per la generazione e l’editing delle immagini. Devi registrarti e ottenere una chiave API per autenticare le tue richieste per utilizzare l’API.

Conclusioni

La generazione di immagini sta evolvendo rapidamente e gli API di Stable Diffusion sono all’avanguardia. Sviluppatori, designer e creatori di contenuti hanno ora a disposizione molte opzioni. Questi API offrono funzioni avanzate, scalabilità e numerosi casi d’uso, rendendoli strumenti indispensabili nel panorama moderno dell’IA. Utilizza questi API per trasformare i tuoi progetti e godere del potere della tecnologia di generazione delle immagini all’avanguardia.

Punti chiave

  • Gli API di Stable Diffusion offrono un approccio senza soluzione di continuità allo sviluppo di IA, consentendo agli sviluppatori di concentrarsi sulla creazione di prodotti IA lasciando la manutenzione della GPU al fornitore del servizio.
  • Molti API di Stable Diffusion offrono un accesso user-friendly attraverso strumenti come Stable Diffusion Online Editors, offrendo risultati identici ai loro API ma con una velocità migliorata.
  • Lo Stability AI API abbraccia un ethos open-source, dando potere agli sviluppatori con un accesso aperto alle più recenti tecnologie di IA in diversi ambiti.

Domande frequenti

  • https://www.segmind.com/
  • https://www.segmind.com/models
  • https://www.segmind.com/models/sdxl1.0-dreamshaper
  • https://platform.stability.ai/docs/getting-started
  • https://platform.stability.ai/docs/api-reference
  • https://hotpot.ai/stable-diffusion-api
  • https://hotpot.ai/art-generator?s=stable-diffusion-api
  • https://zylalabs.com/api-marketplace/tag/stable+diffusion
  • https://stablediffusionapi.com/
  • https://getimg.ai/tools/api

I media mostrati in questo articolo non sono di proprietà di Analytics Vidhya e vengono utilizzati a discrezione dell’autore.