1. Xat amb metaIA amb funcions d'edició d'imatges i eliminació de fons per a converses de WhatsApp.

Llama 3.2 aporta funcions com ara la traducció de vídeos de sincronització de llavis, veus de celebritats i molt més a Meta AI

Avatar de Lucas Gomes
Ara multimodal, la intel·ligència artificial de Meta pot veure i parlar, entenent imatges, taules i gràfics, a més de conversar de manera natural amb l'usuari. Entendre

Avui (25) el Goal Connect 2024, un acte de l'empresa responsable de Facebook, Instagram i WhatsApp, amb l'anunci de les seves novetats tecnològiques, presentades per la pròpia companyia Mark Zuckerberg. Més enllà de les ulleres hologràfiques Orió, encara vam veure notícies sobre el Llama 3.2 i Meta AI — que integra totes les xarxes socials de l'empresa. Mireu ara els aspectes més destacats sobre la intel·ligència artificial de Meta

Noves funcions que arriben amb Llama 3.2

Processador lleuger i multimodal amb models Llama 3b i 11b per a una IA avançada.
LLM de visió petita i mitjana (11B i 90B) i models lleugers només de text (1B i 3B) que s'adapten als dispositius mòbils. Imatge: Meta

Els dos models nous més grans de la col·lecció Truca 3.2, amb Paràmetres 11B i 90B (11 i 90 mil milions, respectivament)., destaquen pel seu suport a tasques de raonament visual, com ara la comprensió de documents complexos, incloent taules i gràfics, així com els subtítols d'imatges i la identificació d'objectes en escenes visuals a partir de descripcions en llenguatge natural.

Un exemple pràctic inclou la capacitat de Llama 3.2 de analitzar gràfics per respondre ràpidament a preguntes sobre el rendiment de vendes d'una empresa en un mes determinat. En un altre cas, el model pot interpretar mapes, que indica quan un camí es fa més pendent o la distància d'una ruta específica. Aquests models avançats també es connecten visió i llenguatge, poder extreure detalls d'una imatge i generar subtítols per descriure l'escena.

Meta també va anunciar models més lleugers, Paràmetres 1B i 3B, per a dispositius més petits com ara telèfons intel·ligents i ulleres intel·ligents. Aquests es van fer generació de text multilingüe i execució d'ordres automatitzades. Permeten el desenvolupament d'aplicacions personalitzables que funcionen directament en dispositius, garantint la total privadesa, ja que les dades no s'envien al núvol. Aquestes aplicacions poden resumir els missatges entrants i identificar elements importants per enviar invitacions de calendari directament mitjançant la funcionalitat de trucades d'eines.

L'execució local dels models té dos avantatges principals: respostes gairebé instantànies, a causa del processament directe al dispositiu, i més intimitat, evitant l'enviament de dades sensibles al núvol. Això permet controlar quines consultes queden al dispositiu i quines poden ser processades per models més grans al núvol d'una manera clara i segura.

Aquest treball va comptar amb el suport dels nostres socis de la comunitat d'IA. Volem agrair i reconèixer (per ordre alfabètic): Accenture, AMD, Arm, AWS, Cloudflare, Databricks, Dell, Deloitte, Fireworks.ai, Google Cloud, Groq, Hugging Face, IBM watsonx, Infosys, Intel, Kaggle, Lenovo, LMSYS, MediaTek, Microsoft Azure, NVIDIA, OctoAI, Ollama, Oracle Cloud, PwC, Qualcomm, Sarvam AI, Scale AI, Floquet de neu, Together AI i UC Berkeley - Projecte vLLM.

Meta Gràcies al vostre lloc web

Noves funcions de Meta AI

I la notícia no s'atura aquí! Meta AI es beneficiarà de les noves funcions següents:

Veus a WhatsApp, Instagram, Facebook i Messenger

Veu d'IA personalitzada en meta IA amb diferents veus femenines i masculines.
Meta convida els seus usuaris a provar les noves veus d'IA de celebritats. Imatge: Meta

Mark Zuckerberg va anunciar una nova actualització dels assistents d'IA de Meta, que ara comptaran amb veus de celebritats com ara Dame Judi Dench, John Cena, Awkwafina, Keegan Michael Key i Kristen Bell. La idea és fer la interacció més natural i divertida, oferint una experiència personalitzada en plataformes com ara Facebook, Missatger, WhatsApp e Instagram.

A més de noves veus, una de les innovacions més importants és la capacitat dels models d'IA interpretar fotos i altra informació visual dels usuaris, ampliant les alternatives d'interacció i oferint respostes encara més contextuals i rellevants per a cada usuari.

Veure, explicar i editar imatges

Ulleres de sol i paraigües de colors pengen sobre el carrer de la ciutat amb un teló de fons vibrant.
Els usuaris podran enviar fotos i sol·licitar modificacions a l'IA. Imatge: Meta

També s'ha ampliat la capacitat d'edició de Meta AI, cosa que li permet processar informació visual. Ara serà possible fer una foto d'una flor mentre camina i demanar-ho a Meta AI identificar-lo i/o explicar-ne més, o fes el pujar una imatge d'un plat i rebre la recepta corresponent.

Els usuaris també ho podran fer edicions detallades a les teves fotos reals utilitzant ordres en llenguatge quotidià, com ara afegir o eliminar elements. Anteriorment, aquesta funció només funcionava amb imatges generades per Meta AI, però ara està disponible fotografies fetes pels usuaris, facilitant ajustos personalitzats.

Amb la funció Imaginar de Meta AI, podreu inserir-vos en històries, publicacions de feeds i fins i tot la vostra foto de perfil Facebook i Instagram, compartint Selfies generats per IA d'una manera interactiva. L'IA també pot suggerir subtítols per a les vostres històries d'Instagram i Facebook. Només heu de triar una imatge i Meta AI us suggerirà diverses opcions de subtítols, de manera que serà més fàcil triar la que millor s'adapti a la vostra publicació.

Doblatge de sincronització de llavis a Reels

Parla amb si mateix mitjançant la IA per connectar persones d'arreu del món.
De moment, el doblatge encara està restringit. Imatge: Meta

Meta actualment també està provant el doblatge automàtic de vídeo amb sincronització de llavis a Instagram i Facebook Reels, començant pels idiomes Anglès i castellà. Aquesta funcionalitat permetrà als usuaris veure contingut en la seva llengua materna, facilitant-ne la comprensió i la interacció.

Inicialment, la funció està disponible per a un grup reduït de creadors, però hi ha plans per ampliar-la més creadors i incloure altres idiomes en breu. Aquest avenç té el potencial d'augmentar significativament l'abast dels creadors de contingut, permetent que les seves produccions superin les barreres lingüístiques i connectin amb un públic global, independentment de l'idioma que es parlin.

Disponibilitat

AI Voice a Austràlia, Canadà, Nova Zelanda i EUA només en anglès. Imatge: meta
Veu d'IA a Austràlia, Canadà, Nova Zelanda i Estats Units només en anglès. Imatge: Meta

L'empresa afirma que el Truca 3.2 ara està disponible a les plataformes Meta, a excepció de les actualitzacions de veu Meta AI. Aquests estan disponibles a Austràlia, Canadà, Nova Zelanda i els EUA només en anglès.

I tu, què t'ha semblat la notícia? Explica'ns Comentari!

Veja também:

Meta espectacles Ulleres hologràfiques Orion, que mostren imatges a la pantalla.

Amb informació de: Objectiu [1] e [2].

Revisió del text realitzada per: Daniel Coutinho (25 / 09 / 24)


Descobreix més sobre Showmetech

Registra't per rebre les nostres últimes notícies per correu electrònic.

llocs relacionats