Índex
El cap de setmana passat, una intel·ligència artificial anomenada DeepSeek, desenvolupada a la Xina, està provocant un enrenou al món de la tecnologia i està fent que el valor de les accions de gegants nord-americans com NVIDIA, Google, Meta i Microsoft caigui en picat més d'un bilió de dòlars. Comprèn com funciona i com pot afectar el món de la tecnologia, però específicament el ChatGPT d'OpenAI.
Què és DeepSeek
DeepSeek és una empresa xinesa d'intel·ligència artificial creada el 2023 per Liang Wenfeng, empresari xinès i cofundador del fons de cobertura quantitatiu Volador alt. Aquest fons, famós per utilitzar tècniques d'aprenentatge automàtic en la inversió en accions, també és el finançador actual de la investigació d'IA de la companyia.
Des del 2023, l'empresa ha estat cridant l'atenció mundial a causa del ràpid desenvolupament dels seus models lingüístics o LLM.
Desenvolupament de baix cost
El principal avantatge dels models és el seu cost de desenvolupament. En un article publicat recentment, la companyia va explicar que el seu model lingüístic DeepSeek-V3 utilitzat 2 mil targetes NVIDIA H800, que ja són relativament antics, per formar-se a a cost total de 5,5 milions de dòlars.
A tall de comparació, això és només una fracció del cost de la formació d'un model com el Llama 3.3 de Meta, que només aquest any s'espera gastar més de 65% mil milions de dòlars en la seva millora. En aquesta comparació, els costos de DeekpSeek acaben sent fins i tot inferiors al sou anual d'alguns directius de l'empresa de Meta. Segons els analistes, les reduccions de costos arriben a impressionants 95%.
Aquest assoliment posa fi al paradigma que es necessitarien grans inversions en infraestructures de centres de dades i electricitat per formar IA, fent de DeepSeek una IA que no només sigui més barata, sinó que també sigui més sostenible ecològicament.
En teoria, en lloc d'utilitzar centres de dades especialitzats amb GPU molt cares dissenyades per a altes demandes d'IA, els models DeepSeek fins i tot es podrien entrenar en ordinadors domèstics, amb GPU tradicionals, la qual cosa causa tant sorpresa com por en empreses com NVIDIA, que va ser tan aprofitada per la La pressa recent per construir centres de dades d'empreses que busquen una participació en aquest mercat.
Per aquest motiu, en el que s'ha conegut com el "Dia del pànic DeepSeek" ou "Dia del pànic DeepSeek", En traducció lliure, el 27 de gener va estar marcat per les caigudes de mil milions de dòlars de les accions al NASDAQ, la borsa de les empreses nord-americanes d'alta tecnologia, arribant al 3,5% del total negociat. El competidor de ChatGPT ho té tot per tenir èxit.
DeepSeek-V3 i DeepSeek-R1
Els models de la companyia també són un exemple d'eficiència. EL DeepSeek-V3, per exemple, compta amb un rendiment impressionant en múltiples punts de referència, alhora que requereix molt menys recursos que competidors com Meta's Llama 3.3. I el DeepSeek-R1, llançat el gener de 2025, se centra en tasques de raonament i desafia el model o1 d'OpenAI amb les seves funcions avançades.
En essència, ambdues opcions de model d'intel·ligència artificial xinesa aprenen interactuant amb el seu entorn i rebent comentaris sobre les seves accions, de manera similar a com els humans aprenen a través de l'experiència. Això els permet desenvolupar-se habilitats de raonament més sofisticades i adaptar-se a noves situacions de manera més eficaç. Aquest enfocament també és més barat que l'"aprenentatge supervisat humà" utilitzat pels competidors.
Un altre avantatge d'aquesta IA xinesa és estalvi de recursos. En lloc d'utilitzar tots els paràmetres del model per respondre una consulta, els models de DeepSeek seleccionen només uns quants "paràmetres específics" o "experts" per al tema. Aquesta activació selectiva redueix significativament els costos computacionals i augmenta l'eficiència del model.
Explicant-ho d'una manera més senzilla, seria com disposar d'un gran equip d'especialistes a disposició per a tot tipus de tasques, però trucant només als més adients per dur-lo a terme en un cas concret, garantint un ús eficient i experiència en el servei.
O DeepSeek-V3 també empra tècniques de destil·lació, el que significa que transfereix coneixements i capacitats de models més grans a models més petits i eficients. És com si un professor transferís els seus coneixements a un estudiant, permetent-li realitzar tasques amb una competència similar però amb menys experiència o recursos.
El resultat és una IA que ocupa menys espai i recursos, amb una alta eficiència per treballar en dispositius més petits, com ara telèfons intel·ligents i ordinadors portàtils. Per fer que l'aplicació estigui disponible per a telèfons intel·ligents i també en versió web, l'empresa va utilitzar DeepSeek R1 com a base i la va transformar en una aplicació.
Model de codi obert
A més de combinar tècniques d'eficiència i rendiment, els models també aprofiten la col·laboració inherent al disseny de projectes. codi aberto (o codi obert, en anglès).
Aquí, a diferència d'una empresa com OpenAI, que treballa de manera privada en el desenvolupament d'IA, els models de DeepSeek tenen el seu codi disponible a la xarxa, i poden ser accedits, provats i fins i tot corregits per la comunitat global de desenvolupadors, que també reflexiona sobre més transparència i confiança en els resultats presentats.
De fet, l'empresa vol animar qualsevol persona a provar els seus models i està alliberant llicències per als seus professionals per facilitar l'ús d'altres empreses.
L'estratègia també reforça la competitivitat, atraient talent i destaca la posició de lideratge de DeepSeek, en una mena de màrqueting lliure. L'empresa no se'n beneficia directament, sinó que aprofitarà l'adopció massiva del model, podent monetitzar mitjançant serveis complementaris, com ara suport tècnic o versions premium, alhora que fomenta un ecosistema col·laboratiu i innovador.
Número 1 a les botigues d'aplicacions
La curiositat per DeepSeek no es trobava només entre els CEO i els enginyers tecnològics.
Llançat el 20 de gener, el R1, Aplicació DeepSeek per a iPhones i els telèfons intel·ligents Android, sembla estar seguint el camí reeixit del competidor ChatGPT. Ja és l'aplicació més baixada de l'App Store nord-americana d'Apple i la segona del Brasil, només per darrere del competidor d'OpenAI.
Na Play Store, botiga d'Android, l'èxit també és innegable: a tot el món, el chatbot xinès ja s'ha instal·lat més d'un milió de vegades.
Sam Altman, fundador i actual CEO d'OpenAI, va parlar de l'èxit de DeepSeek. Va esmentar que està vigilant què pot fer la IA xinesa i que el primer model és impressionant. Vegeu els tuits i les traduccions a continuació.
El deepseek r1 és un model impressionant, sobretot pel que fa al que poden oferir pel preu. Òbviament, oferirem models molt millors i també és legítimament refrescant tenir un nou competidor! Farem alguns llançaments.
Però el més important, estem entusiasmats de continuar complint els nostres objectius i creiem que més informàtica és més important ara que mai per tenir èxit en la nostra missió.
El món voldrà utilitzar MOLTA IA i realment es sorprendrà amb els models de propera generació que vindran. Esperem poder portar-vos tots AGI i més enllà.
Sam Altman sobre l'èxit de la intel·ligència artificial xinesa DeepSeek.
Implicacions i biaixos polítics
Però amb l'èxit, també sorgeixen sospites. Els experts qüestionen si el nombre total de GPU utilitzades per entrenar els models DeepSeek no es va informar, amb la intenció d'ocultar l'ús del maquinari NVIDIA que recentment es va prohibir la venda a la Xina, a causa de la guerra comercial amb els Estats Units. Però l'empresa nega aquest fet, afirmant que va aconseguir entrenar el seu model fins i tot amb GPU de baixa potència.
També hi ha signes de censura a l'eina, d'acord amb els preceptes o biaixos polítics del Partit Comunista Xinès. Per exemple, quan se li pregunta sobre el "Massacre de la plaça de Tiananmen de 1989 a Pequín", on centenars d'activistes van ser assassinats o ferits per l'exèrcit xinès, la IA es nega a respondre la pregunta.
El mateix passa quan es pregunta a la IA sobre el conflicte entre la Xina i Taiwan. DeepSeek esmenta que Taiwan forma part de la Xina i això "El govern xinès està compromès amb el principi d'una sola Xina i busca la reunificació pacífica del país.
Què ve després?
La possibilitat de disposar de models d'IA tan eficients, amb uns costos d'infraestructura significativament més baixos, fa que els inversors es replantegin la compra o fins i tot la venda de les seves accions en empreses tecnològiques centrades en aquest sector.
Una de les llegendes de capital de risc americà Marc Andreessen, veu l'aparició de DeepSeek com el "El moment Sputnik d'AI", en referència a l'històric primer llançament de satèl·lit en òrbita l'any 1957, que va marcar el moment en què la Unió Soviètica va superar temporalment els Estats Units en el camp de la tecnologia espacial.
El cas és que la superioritat nord-americana en el camp de la intel·ligència artificial s'ha posat en dubte. I, per aquest motiu, és probable que s'anunciïn represàlies del govern nord-americà, potser mitjançant més sancions a la comercialització de tecnologies i xips americans a empreses xineses.
En reacció al cas, el nou president Donald Trump va qualificar l'ascens de l'empresa xinesa DeepSeek de "una crida d'atenció" per a la indústria tecnològica dels Estats Units, un senyal que hauria d'arribar aviat una reacció.
Seguirem el tema de prop. Mentrestant, digueu-nos Comentari: Creus que DeepSeek pot prendre el Lideratge de ChatGPT?
Veure el vídeo
Veure també
Amb informació: yahoo l Ground Notícies l Informació Diners l Forbes (1 e 2)
Descobreix més sobre Showmetech
Registra't per rebre les nostres últimes notícies per correu electrònic.