Índex
Enmig de la bomba tendència de les fotos d'estil anime, potser us haureu preguntat: com funciona Xat GPT fa imatges a l'estil de Studio Ghibli? Abans no podia? Bé... resulta que la nova capacitat d'imatge generativa de OpenAI És realment nou i té tot a veure amb un gran canvi en el funcionament del model d'intel·ligència artificial de l'empresa. Comprèn, en aquest text, com Xat GPT va aconseguir replicar l'art de Studio Ghibli i les principals diferències respecte a altres models.
Com crea ChatGPT imatges a l'estil Ghibli?
Per entendre com el Xat GPT va començar a poder generar imatges com les creades a tendència do Studio Ghibli, cal conèixer els principals canvis que comporta OpenAI en el model GPT-4o, llegiu a continuació.
Què ha canviat en el model GPT-4o?
La generació d'imatges al GPT-4o es basa en l'arquitectura transformador, que analitza patrons i associa descripcions textuals amb elements visuals. A diferència dels "models de difusió", que comencen amb una imatge aleatòria i la perfeccionen progressivament, el GPT-4o adopta un mètode autoregressiu, construint la imatge en passos seqüencials, que millora la coherència visual i la fidelitat a l'estil desitjat.
A mesura que millora la precisió i la representació del text dins de les imatges, i la capacitat d'entendre i seguir instruccions detallades millora, Xat GPT ha augmentat la seva capacitat per gestionar el nombre d'objectes diferents en una sola escena (fins a 20, en comparació amb anteriorment entre 5 i 8 objectes) i pot mantenir les relacions correctes entre ells.
En comparació amb models anteriors com ara el DALL-E3, que utilitzava canonades (conjunt de passos o processos) separat per a diferents tipus de suports, el GPT-4o adopta un enfocament unificat, que permet respostes més ràpides i imatges més coherents amb les ordres textuals, eliminant la necessitat de múltiples processos intermedis. Això significa que el model pot interpretar millor els matisos de les indicacions proporcionades pels usuaris, assegurant que la sortida visual estigui més alineada amb la intenció original.
Tot aquest poder ve amb un problema polèmic: amb una major demanda de processament gràfic a causa de l'explosió de la moda a internet, OpenAI necessari per limitar la usabilitat de l'eina durant uns dies, especialment per als usuaris gratuïts de Xat GPT, perquè els seus GPUs s'estaven "fonant", segons el conseller delegat de l'empresa, Sam Altman. Tot i les molèsties, la generació d'imatges avançades ja ha estat llançada per la companyia per als usuaris del pla gratuït, tal com ha anunciat l'executiu.
Com permet l'actualització imatges a l'estil Ghibli?
Però què significa tot això per a la capacitat de l'IA per capturar l'estètica Studio Ghibli? Resulta que amb la nova actualització, el GPT-4o Comença a entendre millor els patrons d'estil, a partir d'exemples massius d'imatges, i aprèn a replicar aquestes característiques a partir de les ordres proporcionades per l'usuari.
Encara que OpenAI no va indicar explícitament si el seu conjunt de dades de formació incloïa obres d'art específiques Studio Ghibli, com El viatge de Chihiro ou El noi i la grua – a cavall d'una bretxa que diferencia la reproducció d'estils d'estudi de les dels artistes vius – la competència del model per replicar l'estètica de l'estudi suggereix fortament que ha estat exposat a un gran nombre d'exemples de pel·lícules i estils relacionats.
A través d'aquesta exposició, el GPT-4o aprendre les principals característiques visuals que defineixen l'estil de Studio Ghibli, incloent: la sensació d'animació dibuixada a mà, que sovint recorda l'animació de paper tradicional; fons que evoquen una sensació de meravella i tranquil·litat; personatges expressius que solen presentar ulls grans i emocionals; una paleta de colors suaus i naturals dominada per tons pastel i suaus; entorns detallats que sovint barregen elements fantàstics amb realisme
A més, el GPT-4o També pot processar imatges com a entrada, permetent als usuaris transformar els elements visuals existents o utilitzar-los com a base per generar contingut nou. D'aquesta manera, a més de no haver de dir tots els detalls sobre l'estil artístic que volen reproduir, els usuaris tampoc necessiten descriure's ni la foto que volen recrear, simplement inserint una foto al xat i demanant a l'IA que la reprodueixi amb l'estil d'animació, com podeu veure al nostre article sobre Com fer imatges d'estil Ghibli amb ChatGPT, amb pistes i indicacions.
Altres IA poden reproduir l'estil de Studio Ghibli?
Crea noves imatges utilitzant xat de xat no és una novetat recent, però, la capacitat que s'aconsegueix amb l'actualització del Xat GPT en analitzar i reproduir els detalls suggerits pel prompt, substitueixen la IA OpenAI per davant dels seus principals competidors, com ara Gemini, fes-ho Google, grokPerquè Xai e Copilot,Perquè Microsoft, pel que fa a la generació d'imatges.
Veure la diferència entre la mateixa imatge transformada en un dibuix amb una línia inspirada en Studio Ghibli seguint la mateixa indicació:
Crie uma imagem, inspirada nessa foto, com base no estilo do Studio Ghibli
A més de captar millor els detalls de la imatge original, un dels majors avenços en imatge generativa GPT-4o Això és evident en la capacitat de reproduir el logotip i les lletres a la samarreta, que és molt difícil en altres models.
Mentre que el grok aconsegueix, en certa manera, recrear característiques de l'estil de Studio Ghibli, tot i que pateix el detall de la imatge, el Gemini va completament a contracorrent, donant lloc a l'art genèric. Val la pena recordar que el Google ja inverteix en una actualització de les imatges generatives de Gemini, permetent la creació d'imatges complexes i l'edició de fotografies, eines que es pot provar mitjançant AI Studio. La Copilot,Perquè Microsoft, no ha pogut respondre a la sol·licitud.
Ja heu provat l'eina per entrar a Tendència de Studio Ghibli? Explica'ns als comentaris.
Veure també
Text revisat per Alexandre Marques el 01/04/2025.
Fonts: The Times of India, Hindustan Times, Temps econòmics
Descobreix més sobre Showmetech
Registra't per rebre les nostres últimes notícies per correu electrònic.