13 de novembre 2025

IA pertot arreu (7)

The Thinking Machine: Jensen Huang, Nvidia, and the World's...

 Aquest llibre, "The Thinking Machine: Jensen Huang, Nvidia, and the World's..." de Stephen Witt, relata la història de com Nvidia, un proveïdor especialitzat en maquinari per a videojocs, es va convertir en l'empresa més valuosa del món. La narrativa se centra en la figura de Jensen Huang, un empresari i inventor visionari que va impulsar una revolució en el silici durant trenta anys, culminant en el naixement d'una nova i potent categoria d'intel·ligència artificial (IA).

Part I: Orígens i Revolució en el Silici

Infància i Caràcter

Huang, nascut a Taipei, Taiwan el 1963, va emigrar als Estats Units amb deu anys. La seva estada inicial en un internat rural de Kentucky (Oneida Baptist Institute) va ser marcada per l'assetjament, però va demostrar una gran tenacitat, excel·lint acadèmicament malgrat ser petit i parlar un anglès imperfecte. Aquesta dedicació es va reflectir en la seva vida posterior; va ser cambrer en un restaurant Denny's i va esdevenir un jugador de tennis de taula classificat a nivell nacional, caracteritzat per la seva concentració i ètica de treball.

Després de graduar-se en enginyeria elèctrica per la Universitat Estatal d'Oregon (OSU), va treballar a Advanced Micro Devices (AMD) i després a LSI Logic, on va dominar el disseny de circuits i va conèixer els seus futurs cofundadors.

La Fundació de Nvidia i el "Pecat Original"

Huang va cofundar Nvidia (el nom prové del llatí invidia, enveja) l'abril de 1993, després de desenvolupar el pla de negoci en un Denny's.

El seu primer producte, l'NV1, destinat a gràfics de videojocs d'alta gamma, va resultar ser un "desastre" perquè utilitzava la tècnica de mapatge de textures quadràtiques, que era incompatible amb el nou estàndard DirectX de Microsoft.

Enfrontat a la fallida, Huang va prendre decisions radicals: va acomiadar la majoria de la plantilla, va abandonar l'arquitectura NV1/NV2, i va comprar un costós emulador de maquinari per saltar-se el prototipat físic. Aquesta aposta desesperada va portar a la creació del mantra corporatiu: "La nostra empresa és a trenta dies de tancar". A més, Huang va forçar la sortida del lideratge tècnic del cofundador Curtis Priem a causa de la seva intransigència.

El Triomf del Processament Paral·lel

El següent xip, el Riva 128 (NV3), va ser un èxit el 1997. Huang va absorbir i aixafar rivals, utilitzant el llibre "The Innovator’s Dilemma" de Clayton Christensen per guiar la seva estratègia: servir clients de nínxol (jugadors) que les grans empreses ignoraven per desmantellar-les des de baix.

El 1998, Nvidia va fer la seva aposta radical: el xip TNT va introduir el "processament paral·lel". Aquest enfocament, que permetia resoldre múltiples problemes alhora, tenia una taxa d'èxit del zero per cent abans de Nvidia. Huang va persistir perquè va veure que només el paral·lelisme podia satisfer la demanda infinita de potència de càlcul dels gràfics 3D.

El llançament de la línia GeForce (NV10), que utilitzava múltiples pipelines de renderització en un sol xip, va consolidar el lideratge de Nvidia. Per motius de màrqueting, van encunyar el terme "Graphics Processing Unit" (GPU). El 2000, Huang va guanyar la "batalla a mort" (death struggle) contra el seu principal rival, 3dfx, comprant els seus actius i assimilant els seus enginyers.

L'Aprenentatge d'AMD i la Creació de CUDA

El 1999, Nvidia va sortir a borsa amb una valoració de 600 milions de dòlars. Tot i el creixement, l'empresa va patir un daltabaix borsari del 90% entre el 2000 i el 2002 (a causa de la bombolla dot-com i l'escàndol de comptabilitat Bumpgate), que va alimentar la paranoia de Huang.

La gran aposta de la dècada de 2000 va ser el projecte CUDA (Compute Unified Domain Architecture).

  • Impulsat per l'enginyer John Nickolls, que va predir el col·lapse de la Llei de Moore (l'augment exponencial de la velocitat dels xips Intel), CUDA pretenia utilitzar els circuits paral·lels de les GPU per a la ciència.
  • Huang va apostar pel que ell anomenava el "mercat del zero bilions de dòlars": un producte sense clients evidents (com investigadors de càncer de mama o astrofísics) que els competidors no gosarien a perseguir.
  • CUDA (llançat el 2006) va imposar una "taxa CUDA" als clients de jocs, ja que finançaven una inversió que Wall Street considerava innecessària i de "valor negatiu".

Part II: El Triomf de la Màquina Pensant

AlexNet i l'Oportunitat Única

El punt d'inflexió va arribar el 2012. Investigadors de la Universitat de Toronto, liderats per Geoffrey Hinton (un pioner de les xarxes neuronals), van utilitzar dues targetes gràfiques de consum (GeForce GTX 580) per entrenar AlexNet, una xarxa neuronal per al reconeixement d'imatges.

  • AlexNet va aconseguir més del 80% d'encert, superant la resta de mètodes convencionals.
  • La GPU era essencial, ja que accelerava la multiplicació de matrius (l'operació central del deep learning) centenars de vegades més ràpid que una CPU.
  • Huang va tenir una "epifania de Damasc", identificant el deep learning com el "O.I.A.L.O." ("Once in a Lifetime Opportunity") de l'empresa. Va anunciar una aposta total, transformant Nvidia en una "empresa d'IA" d'un dia per l'altre.

L'Era de la Hiperescala

El llibre descriu l'èxit massiu que va seguir. El 2017, la companyia va triplicar els seus beneficis. Huang va consolidar el seu domini a través de:

  1. Integració Vertical: El 2019, Nvidia va adquirir Mellanox ($7 mil milions), el principal fabricant de tecnologia de xarxes (Infiniband). Huang va veure el centre de dades com "un sol xip" i Infiniband com el "sistema nerviós" que connectava milers de GPU.
  2. Maquinari Dedicat: Va crear el DGX-1 (un ordinador accelerat per IA de $129,000), que va lliurar la primera unitat a Elon Musk a OpenAI el 2016.
  3. Monopoli de Programari: Nvidia va aconseguir una velocitat mil vegades superior en el rendiment d'IA entre 2012 i 2022, principalment gràcies a l'optimització del programari (com la biblioteca cuDNN, creada per Bryan Catanzaro) en lloc de la millora del transistor. Aquest programari lliure crea un "bloqueig del venedor" (vendor lock) que fa que els clients prefereixin esperar pel maquinari de Nvidia que canviar a competidors.

El Transformer i ChatGPT

L'arquitectura Transformer (inventada a Google el 2017) va millorar AlexNet, ja que la seva lògica senzilla (predir una paraula a la vegada basant-se en el context, self-attention) era perfecta per al processament paral·lel de la GPU.

OpenAI va adoptar els Transformers per crear el GPT (Generative Pre-Trained Transformer). El llançament de ChatGPT el 2022 (amb un model d'aproximadament un bilió de paràmetres) va impactar el món, demostrant capacitats com la resolució de problemes de lògica i la redacció de codi funcional.

Aquesta "explosió càmbrica" d'IA va ser possible només per la hiperescala. L'entrenament de GPT-4 (amb un cost estimat de més de 100 milions de dòlars) va requerir la compra massiva de GPU. El 2023, els ingressos del centre de dades de Nvidia van superar per primera vegada els ingressos de jocs.

La Fortuna i la Por

El "Dia del Judici" (febrer de 2024) va veure Nvidia anunciar que els seus ingressos s'havien duplicat a 60 mil milions de dòlars, amb beneficis de gairebé 30 mil milions (més del que havien guanyat en trenta anys). La seva capitalització es va disparar a més de 3 bilions de dòlars, convertint Huang en multimilionari i Nvidia en una de les tres empreses més valuoses del món.

Huang va descriure aquest moment com el principi d'una nova revolució industrial, amb els superordinadors de Nvidia actuant com a "fàbriques de generació d'IA".

No obstant això, el llibre també examina la por (The Fear) expressada per pioners de l'IA com Geoffrey Hinton i Yoshua Bengio, que creuen que la intel·ligència artificial podria representar un risc existencial per a la humanitat. Huang, en canvi, rebutja vocalment aquests temors, als quals es refereix com a "històries de ciència-ficció ridícules". Des de la seva perspectiva d'enginyer, l'IA és només programari i hardware, i els beneficis de reduir el cost marginal de càlcul a zero superen qualsevol risc.

El principal límit de l'IA actual és el consum elèctric, ja que les GPU de nova generació consumeixen una potència exponencialment més gran (la B200 requerirà 1.000 watts).

La trajectòria de Huang (superant els rivals, inclosa la seva cosina i CEO d'AMD, Lisa Su) demostra la seva execució implacable i la seva superioritat intel·lectual, que ha convertit Nvidia en l'únic "proveïdor d'armes" d'una revolució de la intel·ligència.