Google Gemini

Google Gemini: innovacions presentades a Made By Google 2024

Avatar de João Lucas Batista
Google Gemini, presentat a Made By Google 2024, aporta innovacions impressionants en intel·ligència artificial, oferint una experiència més personalitzada i avançada, prometent revolucionar el mercat de la IA

Durant l'acte Feta per Google, amb seu a San Francisco, Califòrnia, aquest dimarts (13), el gegant tecnològic va revelar notícies importants per al Gemini, la intel·ligència artificial de la companyia, a través de la retransmissió de l'esdeveniment al seu canal YouTube. L'eina promet transformar la interacció dels usuaris amb els seus dispositius, augmentant la creativitat i la productivitat mitjançant un assistent d'IA avançat i encara més polifacètic. Veure els detalls.

Què és Bessons?

Va ser llançat el desembre de l'any passat, el Gemini va substituir Bard i destaca per la seva capacitat per gestionar tasques complexes, des de la codificació fins al raonament lògic avançat. Aquesta intel·ligència artificial està dissenyada per ajudar els usuaris amb una varietat de tasques manipulant i combinant diferents tipus de fitxers i informació, com ara:

  • textos
  • Imatges
  • Àudios
  • Vídeos
  • Llenguatges de programació

Gemini té tres modes de funcionament, cadascun amb característiques específiques:

  • Nan Bessons: Ideal per a tasques en dispositius mòbils, oferint eficiència i practicitat, i permetent realitzar activitats d'IA directament al dispositiu, fins i tot sense accés a Internet. És la versió més democràtica, disponible al major nombre de dispositius.
  • Gemini Ultra: Apte per a tasques molt complexes, amb una major capacitat de processament.
  • Gemini Pro: Perfecte per escalar una àmplia gamma de tasques, i la nova versió Gemini 1.5 Pro promet superar la competència amb les seves capacitats avançades.

Bessons en viu

Assistent d'IA Gemini de Showmetech, innovació tecnològica, aplicacions intel·ligents, assistents virtuals.
Les noves funcions d'IA prometen una millor experiència d'usuari amb la màquina. Foto: reproducció/Getty Images Embed/Analodu)

El punt culminant de l'acte va ser la presentació de la Bessons en viu, una característica que promet fer que la interacció amb l'assistent de Google sigui més natural i fluida. Gemini Live simula el diàleg humà, proporcionant una conversa més quotidiana, amb 10 opcions de veu diferents per personalitzar l'experiència de l'usuari.

Jenny Blackburn, vicepresident d'experiència d'usuari (UX) de Google, va destacar que aquestes millores ajuden els usuaris en les activitats creatives, pluja d'idees, resoldre problemes i oferir un suport valuós per a professors i estudiants, fent que l'aprenentatge sigui més atractiu i divertit.

Notes durant el consum de contingut de vídeo

Una altra innovació important és la nova funció de IA que permet el Gemini llegir la pantalla Android i realitzar accions sense interrompre el que es mostra. Per exemple, l'assistent pot proporcionar informació addicional mentre es reprodueix un vídeo de YouTube, cosa que facilita la comprensió del contingut amb anotacions sobre el que es mostra. Amb l'assistent actiu, es podrà obtenir informació i donar ordres a l'IA des del botó "Pregunta per aquesta pantalla". A més, Gemini ara pot generar i compartir imatges directament en aplicacions com ara correu electrònic i missatgeria.

Transcripció de trucades

Google Gemini: innovacions presentades a Made by Google 2024. Google Gemini, presentada a Made by Google 2024, aporta innovacions impressionants en intel·ligència artificial, oferint una experiència més personalitzada i avançada, prometent revolucionar el mercat de la IA
Les trucades seran transcrites per Gemini (Foto: Divulgació)

Quan feu una trucada al Pixel 9, toqueu el menú desbordant "Més" per accedir a "Notes de trucada". A partir d'aquí, Google informarà als participants de la trucada que la gravació està en curs, i la pantalla indicarà que el procés està en curs. Les trucades han de durar més de 30 segons perquè s'utilitzi la funció de transcripció.

Un cop finalitzada la trucada, les notes de trucades trigarà un moment a generar el resum. Apareixerà a la pestanya "Recents" amb una opció per veure la transcripció completa i escoltar l'àudio, en funció de la funcionalitat de Gemini Nano.

Ara la IA es connecta a les aplicacions de Google

Assistent d'IA de Google Drive centrat en la productivitat i la tecnologia.
Google vol millorar l'ús d'Android mitjançant IA (Foto: Disclosure/Google)

Es va confirmar durant l'esdeveniment que la nova actualització per Gemini permetrà que l'IA es connecti a altres aplicacions de Google, com ara Gmail, calendari, agenda, YouTube, documents, fulls de càlcul, entre d'altres. Aquesta connexió es produeix a partir del Espai de treball de Google, que actuarà precisament per agilitzar els processos durant l'experiència de l'usuari amb la plataforma.

En l'exemple en directe durant la presentació, Google Gemini va poder simplificar l'organització d'un sopar. Només va haver de demanar a la intel·ligència artificial que trobés la recepta de la lasanya a Gmail, afegeixi els ingredients a la llista de la compra de Google Keep i, finalment, fins i tot va crear una llista de reproducció a YouTube Music per a aquesta nit tan especial. Tot això es fa de manera integrada, sense necessitat de canviar entre aplicacions. Aviat, s'espera que les noves extensions permetin una integració encara més gran entre els serveis.

Cerca a partir de captures de pantalla i fotos

Google Gemini: innovacions presentades a Made by Google 2024. Google Gemini, presentada a Made by Google 2024, aporta innovacions impressionants en intel·ligència artificial, oferint una experiència més personalitzada i avançada, prometent revolucionar el mercat de la IA
AI suggereix recepta rere foto amb el menjar trobat a la nevera. Foto: pantalla d'impressió/reproducció/Google/Youtube

Les noves característiques de Gemini permetre que l'IA tingui accés al banc d'imatges del telèfon mòbil, així com a la càmera del dispositiu. Per tant, l'usuari pot fer una fotografia d'un cartell informatiu d'un concert, per exemple, i preguntar a l'assistent sobre les dates que hi consten, per saber si hi ha alguna cita prevista el dia de l'actuació musical.

També serà possible cercar dades de captures de pantalla, captures de pantalla. En funció del contingut que es mostra, es buscarà fàcilment altra informació, amb el camp de cerca del dispositiu accessible, com ara textos, números de telèfon i fins i tot productes.

Pixel Studio i Gemini: creació d'imatges innovadores amb IA

Flamingo amb barret de copa en art digital, estil punk rock, per a productes tecnològics i innovadors.
Gemini crea imatges inusuals en només uns segons. Foto: Reproducció/Google/Youtube

O pixel Studio és una eina innovadora que utilitza IA generativa per crear noves imatges a partir d'ordres de text. Amb Pixel Studio, podeu generar imatges úniques i personalitzades, facilitant la creació de materials visuals com ara invitacions. Durant l'esdeveniment de llançament, la funcionalitat es va demostrar mitjançant la creació d'una invitació, destacant la flexibilitat de l'eina.

Captures de pantalla de píxels
Gemini també podrà crear imatges des de zero, utilitzant ordres de text (Captura de pantalla: Victor Pacheco/Showmetech)

A més de pixel Studio, un Gemini AI també ofereix capacitats avançades d'imatge. Basant-se en instruccions i detalls proporcionats per l'usuari, Gemini pot generar imatges en segons.

Un exemple demostrat al vídeo promocional de Gemini al canal de YouTube de Google va ser la creació d'un flamenc amb barret, amb núvols al fons, que il·lustra la capacitat creativa i atrevida de l'IA per generar imatges personalitzades i complexes.

Disponibilitat i llançament per a tauletes i telèfons intel·ligents

Videotrucada a telèfon intel·ligent amb un fons floral en directe.
Els subscriptors del pla més car de Google One ara poden provar la nova funció (Foto: Reproducció/CNET)

Gemini Live està disponible a partir d'avui per als subscriptors del pla Gemini Advanced, inicialment només en anglès, i s'espera que s'afegeixin idiomes addicionals en les properes setmanes. La funció només està disponible per a telèfons intel·ligents des de Pixel i la línia galàxia. El preu, que també inclou 2 TB d'emmagatzematge a Google Drive, és de R$ 96,99 al mes i la subscripció es pot fer a Lloc web de Google One.

Google també va anunciar que Gemini es llançarà per a tauletes Android en els propers dies, optimitzant l'assistent per treballar de manera eficient tant al núvol com a nivell local, com en el cas de la línia. Pixel 9, que utilitza el model lingüístic Nan Bessons.

Millores a Circle to Search

1. Telèfon mòbil Samsung Galaxy S24 Ultra amb tecnologia de cerca d'imatges.
La funció de cerca d'imatges es va desenvolupar en col·laboració amb Google (Foto: Disclosure)

Originalment llançat amb la línia Samsung Galaxy S24, o Cercle per cercar ara us permet compartir retalls directament amb els contactes mitjançant missatges o WhatsApp.

El funcionament segueix sent el mateix: premeu la barra de navegació inferior per activar el Cercle per cercar i seleccioneu l'objecte desitjat. La novetat és l'addició d'un botó "compartir" que obre el menú per compartir d'Android, facilitant la distribució de la informació.

Mireu el vídeo que mostra les funcions a continuació.

Fet per Google 2024

Què us han semblat tots els anuncis d'avui? Explica'ns aquí Comentari!

Veja também:

Revisat per Víctor Pacheco el 13/08/2024


Descobreix més sobre Showmetech

Registra't per rebre les nostres últimes notícies per correu electrònic.

llocs relacionats