Demistificarea LLM-urilor

Daniel Baker

Publicat la 29 iul. 2023

Modelele lingvistice au devenit o piatră de temelie a inteligenței artificiale moderne, revoluționând nu numai modul în care interacționăm cu tehnologia, ci și modul în care interacționăm unii cu alții. Gândiți-vă la chatbots, asistenți virtuali și chiar traducători de vorbire.

Dar, contrar credinței larg răspândite, tehnologia nu este complet nouă! De fapt, s-ar putea argumenta că datează din anii 1960, când profesorul de la MIT Joseph Weizenbaum a simulat conversațiile folosind potrivirea și înlocuirea modelelor cu programul său ELIZA.

La acea vreme, Eliza a dat iluzia unei conversații inteligente, dar nu avea nicio înțelegere conceptuală a ceea ce se spunea de niciuna dintre părți.

Deci, ce s-a schimbat?

Ei bine, astăzi, modelele lingvistice sunt antrenate pe cantități masive de date, de obicei miliarde de cuvinte dintr-o varietate de surse, inclusiv cărți, articole, postări pe rețelele sociale și multe altele. De asemenea, sunt instruiți cu parametri specifici care ajută la contextualizarea și interpretarea semnificației, astfel încât să poată formula un ton în răspunsurile lor.

Pentru a vă oferi un context.

Ada a fost antrenată cu 40 GB de date text și 350 de milioane de parametri.
Babbage a fost antrenat cu 300 GB de date și 3 miliarde de parametri.
Curie a folosit 800 GB de date de antrenament și 13 miliarde de parametri
Și Davinci le-a spulberat pe toate cu 45 TB de date text și 175 de miliarde de parametri!

Inutil să spun că Davinci poate face față aproape oricărei sarcini de limbaj natural, creând text coerent și creativ, cu fluență, consecvență și diversitate.

Deci, ce fac ei?

În esență, modelele lingvistice au fost întotdeauna despre prezicerea următorului cuvânt din fiecare propoziție, mai întâi folosind dicționare, apoi rețele neuronale recurente și, mai recent, transformatoare!

Transformatorii introduc conceptul de atenție, ceea ce înseamnă că pentru fiecare cuvânt introdus, modelul învață cum este legat de fiecare alt cuvânt din text. Prin urmare, prin procesarea și înțelegerea modelelor din limbaj, modelul poate genera răspunsuri semnificative și adecvate contextual.

Din acest motiv, LLM-urile sunt adesea folosite pentru a automatiza interacțiunile de asistență pentru clienți, accelerând timpul de soluționare fără a fi nevoie să așteptați un agent de asistență. De asemenea, sunt grozave cu crearea de conținut, cum ar fi crearea de articole și postări pe blog (Dar nu și acesta!)

Recomandat de LinkedIn

Lanțuri Langchain: Tot ce trebuie să știi

Riya Teke Cu 2 ani în urmă

Dezvăluirea viitorului: Principalele tendințe în…

Mohamed MARZOUGUI Cu 1 ani în urmă

Valorificarea puterii AI pentru a debloca diversitatea…

Amb - Prof Bitange Ndemo Cu 2 ani în urmă

Dar cea mai mare utilizare a LLM-urilor este în activitățile de traducere lingvistică, de fapt, dacă mă urmăriți pe LinkedIn, veți fi văzut postările mele despre proiectul meu de fermă din Thailanda, în mare parte de succes datorită capacităților de traducere ale AI moderne.

Deci, care este această problemă cu LLM-urile?

Ei bine, sunt grozave, dar, ca în orice caz, nu este doar soare și curcubee. Uneori, LLM-urile sunt de fapt cei mai buni mincinoși din lume! În termeni tehnici, acest lucru se numește halucinații și înseamnă că LLM-urile vor produce o ieșire convingătoare, care fie în unele sau în toate părțile, este complet greșită.

De aceea este important să verificați faptele și să nu urmăriți orbește conținutul produs.

În al doilea rând, ele pot amplifica prejudecățile, în special în ceea ce privește opiniile de gen și rasiale. Amintiți-vă că sunt la fel de buni ca datele pe care au fost antrenați și, din punct de vedere istoric, oamenii nu au fost întotdeauna cei mai buni.

Ceea ce voi spune totuși este că devin mult mai bune, datorită practicilor responsabile de inteligență artificială care au fost folosite în întreaga lume.

Deci, cum comunicăm cu LLM-urile?

Acum nu voi petrece mult timp cu această secțiune, deoarece îmi pot imagina că majoritatea dintre voi în acest moment ați folosit ChatGPT sau unul dintre numeroasele alte motoare de căutare alimentate de GPT.

Dar voi întări conceptele de îndemnuri bune.

Vedeți că utilizarea eficientă a LLM-urilor necesită creativitate și atenție la detalii. Implică selectarea cuvintelor, expresiilor și exemplelor potrivite pentru a genera rezultate de înaltă calitate. Vei scoate doar ceea ce pui, așa că fii elaborat, dă exemple potrivite, definește publicul, persona, genul și tonul.

În concluzie, modelele lingvistice mari reprezintă o schimbare de paradigmă în modul în care mașinile înțeleg și interacționează cu limbajul uman. Capacitatea lor de a genera răspunsuri adecvate contextual și naturale deschide nenumărate posibilități pentru companiile din diferite industrii.

Prin încorporarea modelelor lingvistice mari în fluxurile de lucru AI, puteți eficientiza procesele, oferi experiențe excepționale clienților și rămâne în fruntea unui peisaj din ce în ce mai competitiv.

Pentru a vizualiza sau a adăuga un comentariu, intrați în cont

Mai multe alte articole de Daniel Baker

Demistificarea încorporarilor vectoriale

26 iul. 2023

Demistificarea încorporarilor vectoriale

În domeniul științei datelor și al inteligenței artificiale, încorporarea vectorială servește ca o punte între lumea…
Trebuie să vorbim despre date...

1 aug. 2023

Trebuie să vorbim despre date...

Tim Berners-Lee a spus odată că "*_Datele sunt un lucru prețios și că vor dura mai mult decât sistemele în sine_*”…
Mașini gânditoare

25 iul. 2023

Mașini gânditoare

În 1977, George Lucas a lansat Star Wars și m-am îndrăgostit de un droid mic numit R2D2. De fapt, până în ziua de azi…

Demistificarea LLM-urilor

Daniel Baker

Recomandat de LinkedIn

Mai multe alte articole de Daniel Baker

Alte persoane au mai vizionat

Raportul tehnic Qwen2

Inteligența artificială care funcționează: Ce se întâmplă când pui întreaga industrie într-o singură cameră

Construirea unui motor de căutare vocală intern: un plan de acțiune pas cu pas

Ascensiunea modelelor de limbaj mari open-source

ABC-ul inteligenței artificiale - fiind mai puțin artificial

🧠 Modele lingvistice mari post-antrenament

Transformatoare

Modele Conceptuale Mari

Puterea LLM-ului - Proiectarea Prompturilor

De ce "multilingv" este cuvântul greșit pentru modelele de bază ale vorbirii de astăzi

Recomandat de LinkedIn

Mai multe alte articole de Daniel Baker

Demistificarea încorporarilor vectoriale

Trebuie să vorbim despre date...

Mașini gânditoare

Alte persoane au mai vizionat

Raportul tehnic Qwen2

Inteligența artificială care funcționează: Ce se întâmplă când pui întreaga industrie într-o singură cameră

Construirea unui motor de căutare vocală intern: un plan de acțiune pas cu pas

Ascensiunea modelelor de limbaj mari open-source

ABC-ul inteligenței artificiale - fiind mai puțin artificial

🧠 Modele lingvistice mari post-antrenament

Transformatoare

Modele Conceptuale Mari

Puterea LLM-ului - Proiectarea Prompturilor

De ce "multilingv" este cuvântul greșit pentru modelele de bază ale vorbirii de astăzi