Demistificarea LLM-urilor

Demistificarea LLM-urilor

Acest articol a fost tradus automat din limba engleză și poate conține inexactități. Aflați mai multe
Consultați originalul

Modelele lingvistice au devenit o piatră de temelie a inteligenței artificiale moderne, revoluționând nu numai modul în care interacționăm cu tehnologia, ci și modul în care interacționăm unii cu alții. Gândiți-vă la chatbots, asistenți virtuali și chiar traducători de vorbire.

Dar, contrar credinței larg răspândite, tehnologia nu este complet nouă! De fapt, s-ar putea argumenta că datează din anii 1960, când profesorul de la MIT Joseph Weizenbaum a simulat conversațiile folosind potrivirea și înlocuirea modelelor cu programul său ELIZA.

No alt text provided for this image

La acea vreme, Eliza a dat iluzia unei conversații inteligente, dar nu avea nicio înțelegere conceptuală a ceea ce se spunea de niciuna dintre părți.


Deci, ce s-a schimbat? 

Ei bine, astăzi, modelele lingvistice sunt antrenate pe cantități masive de date, de obicei miliarde de cuvinte dintr-o varietate de surse, inclusiv cărți, articole, postări pe rețelele sociale și multe altele. De asemenea, sunt instruiți cu parametri specifici care ajută la contextualizarea și interpretarea semnificației, astfel încât să poată formula un ton în răspunsurile lor.

Pentru a vă oferi un context.

  • Ada a fost antrenată cu 40 GB de date text și 350 de milioane de parametri.
  • Babbage a fost antrenat cu 300 GB de date și 3 miliarde de parametri.
  • Curie a folosit 800 GB de date de antrenament și 13 miliarde de parametri
  • Și Davinci le-a spulberat pe toate cu 45 TB de date text și 175 de miliarde de parametri!

Inutil să spun că Davinci poate face față aproape oricărei sarcini de limbaj natural, creând text coerent și creativ, cu fluență, consecvență și diversitate.


No alt text provided for this image

Deci, ce fac ei?

În esență, modelele lingvistice au fost întotdeauna despre prezicerea următorului cuvânt din fiecare propoziție, mai întâi folosind dicționare, apoi rețele neuronale recurente și, mai recent, transformatoare!

Transformatorii introduc conceptul de atenție, ceea ce înseamnă că pentru fiecare cuvânt introdus, modelul învață cum este legat de fiecare alt cuvânt din text. Prin urmare, prin procesarea și înțelegerea modelelor din limbaj, modelul poate genera răspunsuri semnificative și adecvate contextual.

Din acest motiv, LLM-urile sunt adesea folosite pentru a automatiza interacțiunile de asistență pentru clienți, accelerând timpul de soluționare fără a fi nevoie să așteptați un agent de asistență. De asemenea, sunt grozave cu crearea de conținut, cum ar fi crearea de articole și postări pe blog (Dar nu și acesta!) 

No alt text provided for this image

Dar cea mai mare utilizare a LLM-urilor este în activitățile de traducere lingvistică, de fapt, dacă mă urmăriți pe LinkedIn, veți fi văzut postările mele despre proiectul meu de fermă din Thailanda, în mare parte de succes datorită capacităților de traducere ale AI moderne.


Deci, care este această problemă cu LLM-urile?

Ei bine, sunt grozave, dar, ca în orice caz, nu este doar soare și curcubee. Uneori, LLM-urile sunt de fapt cei mai buni mincinoși din lume! În termeni tehnici, acest lucru se numește halucinații și înseamnă că LLM-urile vor produce o ieșire convingătoare, care fie în unele sau în toate părțile, este complet greșită.

De aceea este important să verificați faptele și să nu urmăriți orbește conținutul produs.

În al doilea rând, ele pot amplifica prejudecățile, în special în ceea ce privește opiniile de gen și rasiale. Amintiți-vă că sunt la fel de buni ca datele pe care au fost antrenați și, din punct de vedere istoric, oamenii nu au fost întotdeauna cei mai buni.

Ceea ce voi spune totuși este că devin mult mai bune, datorită practicilor responsabile de inteligență artificială care au fost folosite în întreaga lume.


Deci, cum comunicăm cu LLM-urile?

Acum nu voi petrece mult timp cu această secțiune, deoarece îmi pot imagina că majoritatea dintre voi în acest moment ați folosit ChatGPT sau unul dintre numeroasele alte motoare de căutare alimentate de GPT.

Dar voi întări conceptele de îndemnuri bune.

Vedeți că utilizarea eficientă a LLM-urilor necesită creativitate și atenție la detalii. Implică selectarea cuvintelor, expresiilor și exemplelor potrivite pentru a genera rezultate de înaltă calitate. Vei scoate doar ceea ce pui, așa că fii elaborat, dă exemple potrivite, definește publicul, persona, genul și tonul.


În concluzie, modelele lingvistice mari reprezintă o schimbare de paradigmă în modul în care mașinile înțeleg și interacționează cu limbajul uman. Capacitatea lor de a genera răspunsuri adecvate contextual și naturale deschide nenumărate posibilități pentru companiile din diferite industrii.

Prin încorporarea modelelor lingvistice mari în fluxurile de lucru AI, puteți eficientiza procesele, oferi experiențe excepționale clienților și rămâne în fruntea unui peisaj din ce în ce mai competitiv.



Pentru a vizualiza sau a adăuga un comentariu, intrați în cont

Mai multe alte articole de Daniel Baker

  • Demistificarea încorporarilor vectoriale

    În domeniul științei datelor și al inteligenței artificiale, încorporarea vectorială servește ca o punte între lumea…

  • Trebuie să vorbim despre date...

    Tim Berners-Lee a spus odată că "*_Datele sunt un lucru prețios și că vor dura mai mult decât sistemele în sine_*”…

  • Mașini gânditoare

    În 1977, George Lucas a lansat Star Wars și m-am îndrăgostit de un droid mic numit R2D2. De fapt, până în ziua de azi…

Alte persoane au mai vizionat