Índex
La generació i edició d'imatges amb IA ja és una realitat en la vida quotidiana de les persones i, finalment, els principals models han posat a la seva disposició eines enfocades a la imatge. xat de xat. Per a aquells que els agrada utilitzar la plataforma Google, o Gemini, també és possible provar la manipulació d'imatges d'IA dins de la plataforma Estudi d'IA, on els usuaris poden explorar moltes de les capacitats que està desenvolupant l'empresa. En aquest article, apreneu com accedir i quines ordres utilitzar per manipular imatges Google AI Studio.
Què és Google AI Studio?
O Google AI Studio és un entorn de desenvolupament integrat (IDE) proporcionat per Google, que ofereix als desenvolupadors i entusiastes l'oportunitat d'experimentar amb els models d'IA generativa de l'empresa, proporcionant una manera ràpida i gratuïta de generar coneixements basats en IA mitjançant la potent família de models de l'empresa. Gemini do Google.
L'eina es posiciona com una opció més fàcil d'utilitzar per a l'exploració inicial i la creació de prototips. En comparació amb plataformes més robustes dirigides al mercat empresarial, com ara Vèrtex AI, també de Google, o Estudi d'IA està dissenyat per a aquells que tot just comencen a provar diferents models, característiques i tècniques d'IA, ja sigui per motius professionals o fins i tot per hobby, sense necessitat de protecció de dades corporatives.
D'aquesta manera, el Estudi d'IA acaba sent la plataforma principal per interactuar i utilitzar la família de models Gemini, inclosos aquells amb capacitats d'edició d'imatges.
Un cop els usuaris estiguin satisfets amb els seus prototips i experiments, el codi es pot exportar (utilitzant el Gemini) per ser integrat a les vostres aplicacions. L'API de Gemini, inclòs, permet als desenvolupadors incorporar la generació de text i imatges a les seves aplicacions mitjançant un únic model.
Com utilitzar Google AI Studio
Pas 1 – Accedir al Google AI Studio i connecteu-vos al vostre compte Google.
Pas 2 – Seleccioneu l'opció per utilitzar el Google AI Studio a Gemini.
Pas 3 – Cerqueu l'opció de selecció de model a la interfície Estudi d'IA i seleccioneu el model Gemini 2.0 Flash Experimental, darrera actualització de la IA de l'empresa.
Als ordinadors de sobretaula, normalment es troba a l' costat dret de la pantalla.
Als telèfons mòbils, està en a menú a la part superior.
Pas 4 – Carregueu la imatge que voleu editar.
La interfície de Estudi d'IA ofereix l'opció de puja la imatge que es modificarà. Podeu penjar fitxers des de l'ordinador, utilitzar fotos de Google Drive o fins i tot fer una foto amb la càmera del dispositiu.
Pas 5 – Utilitzeu ordres per editar la imatge. Exemple: "Converteix aquest cotxe en un descapotable".
Quins indicadors utilitzar per editar imatges?
Igual que amb l'ús d'altres eines per a un ús més específic que el Google ofertes actualment, com ara Recerca profunda do Gemini, l'eficàcia de la modificació d'imatge en Google AI Studio Depèn molt de la qualitat de les indicacions proporcionades.
Per obtenir els millors resultats, heu d'aprendre a estructurar les vostres indicacions de manera concisa. Comenceu descrivint la modificació desitjada d'una manera directa i objectiva. En lloc d'una ordre vaga com "canvia la imatge", sigues específic, com ara "elimina el gos del fons". Quan identifiqueu l'objecte o l'àrea que voleu canviar, sigueu el més precís possible. Per exemple, si hi ha diverses persones a la imatge, especifiqueu "la persona que porta la camisa vermella".
Utilitzeu un llenguatge descriptiu per transmetre el resultat desitjat. En lloc de "millorar la imatge", intenteu "il·luminar la imatge i augmentar el contrast". Detalls com el color, la mida, la posició, l'estil i l'estat d'ànim poden marcar una gran diferència en el resultat final. Un exemple seria: "Afegiu un gerro groc petit i vibrant al costat esquerre de la taula". Per substituir el fons, descriu clarament la nova configuració que voleu, com ara "Substituïu la paret plana per una selva tropical".
És important recordar que la creació d'indicacions efectives és un procés iteratiu. Si el primer resultat no és exactament el que esperàveu, proveu de reformular el missatge o afegir més detalls. No dubteu a provar diferents frases i nivells de detall. Si busqueu resultats d'aspecte realista, penseu a utilitzar modificadors relacionats amb la fotografia com ara "foto d'alta qualitat", "il·luminació d'estudi" o "foto de primer pla".
Per ajudar-vos a entendre millor la importància de ser específic a l'hora de manipular imatges, vegeu l'enorme diferència en la qualitat final de l'edició del cotxe que es mostra al tutorial anterior. Quan se li va demanar que només canviés el color del cotxe al groc, l'eina no va mantenir la pintura amb el mateix detall i va fer distorsions addicionals a la imatge, com una mena d'aleró al cotxe:
Amb una indicació més específica sobre els detalls del vehicle, la qualitat final va ser superior, inclosa la recuperació dels detalls del capó que es van perdre quan el cotxe es va transformar en un descapotable:
Vegeu a continuació per obtenir més possibilitats amb l'eina.
Substitució de fons
PROMPT INICIAL: Substitua o fundo desta imagem por [descrição do novo fundo].
Exemples:
Prompt: "Substitua o fundo desta imagem por uma praia paradisíaca com areia branca e águas cristalinas ao pôr do sol."
Prompt: "Altere o fundo da imagem anexada para um cenário em uma noite estrelada"
I, per descomptat, també és possible fer aquest canvi amb la gent. Utilitza una foto del teu mòbil o fes-ne una nova i demana-ho Gemini canviar la seva ubicació. Mira:
Eliminació d'objectes
PROMPT INICIAL: Remova [descrição do objeto a ser removido] desta imagem.
En alguns casos, amb molts elements a la pantalla, cal ser més específic sobre què hauria d'esborrar l'eina de la imatge. Exemples:
Prompt: Remova o carro vermelho estacionado à esquerda desta imagem.
Prompt: Apague a pessoa vestindo uma camisa azul no canto direito da imagem.
Addició d'objectes
PROMPT INICIAL: Adicione [descrição do objeto a ser adicionado] [posição e detalhes do objeto] nesta imagem.
Per afegir l'objecte, hi ha contextos en què l'eina respondrà millor si es detalla l'objecte i les condicions en què hauria d'estar l'objecte a la imatge. Com a:
Prompt: Adicione um gato preto pequeno dormindo no sofá ao lado da mulher nesta imagem.
Prompt: Adicione uma vaca marrom no lado direito da foto. A vaca deve ser parecida com as outras duas. A vaca deve estar de frente, como as outras. A vaca deve estar na mesma posição e escala que as outras duas. Integre-a corretamente ao ambiente, com luz e sombras condizentes com o resto da imagem
També és possible afegir un conjunt complet d'objectes a una escena, indicant directament en quin tipus d'ubicació s'ha d'inspirar la IA. Per moblar una habitació, per exemple:
Prompt: Transforme este cômodo em uma cozinha
Substitució d'objectes
PROMPT INICIAL: Substitua o [descrição do objeto a ser substituído] por um [descrição do novo objeto] nesta imagem.
Podeu utilitzar ordres que demanen a la IA que substitueixi els objectes de l'escena per altres models o un objecte completament diferent. Utilitzeu indicacions com:
Prompt: Substitua o vaso de flores na mesa por um laptop moderno nesta imagem.
Prompt: Troque o cachorro pequeno na imagem por um gato siamês.
Canvi d'estil
PROMPT INICIAL: Transforme esta imagem no estilo de [estilo artístico desejado].
ou
Aplique o estilo de [estilo artístico desejado] à imagem anexada.
Podeu canviar l'estil artístic d'una imatge, suggerint inspiracions de moviments artístics (com el cubisme, el surrealisme, l'impressionisme...) i les tècniques de pintura.
Prompt: Transforme esta imagem no estilo de uma pintura, utilizando técnica de aquarela.
Expansió de la imatge
PROMPT INICIAL: Expanda esta imagem adicionando conteúdo [direção da expansão] no estilo da imagem original [adicione mais detalhes sobre o que deve ser incluído].
Si heu fet una foto i voleu mostrar una mica més del que està fora del marc, podeu demanar a l'IA que ampliï la imatge. Utilitzeu indicacions com:
Expanda esta imagem adicionando mais céu azul e algumas nuvens na parte superior no estilo da imagem original.
També es pot demanar el Gemini completar un objecte específic que s'ha retallat de la imatge, com a l'exemple següent:
Prompt: Expanda a imagem para a esquerda e reconstrua a outra metade da lamparina, mantendo o estilo e as configurações de iluminação da imagem original
Ajust de color
PROMPT INICIAL: Ajuste as cores desta imagem para torná-la [descrição do ajuste desejado].
Podeu dir directament a l'IA com voleu que s'ajusti la foto, demanant-li que la imatge sigui més o menys saturada, ajustant la temperatura del color, la brillantor, els filtres i molt més.
Encara pel que fa al tema dels colors, l'eina es pot utilitzar per acolorir dibuixos o millorar-los. Mira:
Prompt: Colorize este desenho com tons de vermelho
I, per descomptat, com a eina iterativa, utilitzeu més ordres per millorar les característiques de la pintura. Com a:
Prompt: Faça um sombreamento suave no desenho, considere que o ponto de luz está no canto superior direito
Prompt: Deixe o desenho menos brilhante, simulando uma pintura a mão
A més de les imatges descolorides, també podeu "jugar" una mica amb la coloració de fotos antigues en blanc i negre, amb ordres com "acoloreix aquesta foto". En alguns casos, el Gemini no aplicarà els colors correctament, per la qual cosa és necessari desenvolupar una mica millor l'ordre. Com a:
Prompt: Colorize esta foto antiga com tons historicamente precisos, baseando-se em referências fotográficas da época. Preserve a textura original e evite cores artificiais ou saturadas. Aplique tons realistas.
O Google AI Studio, impulsat per intel·ligència artificial Gemini, obre un ventall de possibilitats per modificar imatges. La capacitat d'utilitzar el llenguatge natural per realitzar transformacions creatives en imatges fa que el procés sigui intuïtiu i accessible, fins i tot per a aquells que no tenen experiència prèvia amb programari d'edició complex.
Però cal reforçar que l'eina serveix com a espai de prova, és a dir, no dependre d'ella per a les edicions professionals. Com a versió experimental, encara és habitual que calgui interactuar amb la plataforma unes quantes vegades per obtenir un resultat proper al desitjat i, tot i així, no és estrany observar distorsions, sobretot a la cara de persones o animals. Utilitzant ordres en anglès, en algunes ocasions, el resultat és millor.
Així com altres models disponibles a Estudi d'IA, s'espera que la possibilitat de modificar les imatges estigui disponible al Gemini en el futur. Expliqueu-nos als comentaris a continuació com voleu utilitzar l'eina.
Més informació sobre Google Gemini:
Text revisat per Alexandre Marques el 20/03/2025.
Fonts: Google, TechCrunch.
Descobreix més sobre Showmetech
Registra't per rebre les nostres últimes notícies per correu electrònic.