in Informatica, Intelligenza Artificiale

L’Intelligenza Artificiale Spiegata Semplice

Spiegare cos’è un modello di Intelligenza Artificiale (AI) non deve essere complicato. Possiamo immaginarlo come un allievo molto diligente o come una cucina industriale che deve imparare a preparare migliaia di piatti diversi seguendo istruzioni che si perfezionano nel tempo.

In questo post vedremo cosa succede “sotto il cofano” di un’AI, usando esempi che tutti conosciamo.

1. Cosa sono i Parametri? (L’analogia della Ricetta)

Quando senti dire che un modello ha “7 miliardi di parametri”, immagina una ricetta di cucina gigantesca.

  • In una ricetta normale hai pochi parametri: “2 tazze di farina” o “1 tazza di zucchero”.
  • Se cambi questi numeri, il sapore dei biscotti cambia.
  • Un modello AI è come una ricetta con miliardi di questi numeri. Regolando ognuno di essi, l’AI cambia il modo in cui risponde o crea immagini.

Un’altra immagine utile è quella della chitarra: i parametri sono come le corde. Se sono troppo tese o troppo allentate, il suono è stonato. Solo quando miliardi di “corde” sono tese al punto giusto, l’AI produce un risultato armonioso.

2. Pesi e Bias: I veri protagonisti

I parametri si dividono principalmente in due tipi: Pesi e Bias.

I Pesi (L’importanza delle cose)

I pesi sono come dei regolatori di volume (o manopole). Determinano quanto un’informazione sia importante per il risultato finale.

  • Esempio: Se un’AI deve decidere se una casa si venderà bene, darà un “peso” alto alla posizione e un “peso” più basso al colore delle pareti.
  • Matematicamente, il peso è il valore $m$ nell’equazione:$$y = mx + b$$Più grande è $m$, più l’input $x$ sposta il risultato $y$.

Il Bias (La base di partenza)

Il bias è una soglia minima o un punto di partenza. Permette all’AI di essere flessibile anche quando non ci sono input forti.

  • Esempio: Immagina che in una zona il 60% delle case si venda sempre, a prescindere dal prezzo. Il bias permette al modello di partire da quella “base” del 60% e poi aggiungere o togliere probabilità usando i pesi.
  • Nell’equazione sopra, il bias è la $b$. Serve a spostare la nostra “linea delle decisioni” verso l’alto o verso il basso.

3. L’Addestramento: Come impara l’AI?

Un’AI non nasce intelligente; lo diventa provando e sbagliando miliardi di volte. È come imparare ad andare in bicicletta.

  1. Il Tentativo (Forward Propagation): All’inizio l’AI tira a indovinare. Se vede la frase “Il gatto è sul…”, potrebbe rispondere “banana”.
  2. La Correzione: Il sistema di addestramento le dice: “Sbagliato! La risposta era ‘tavolo'”.
  3. L’Aggiustamento (Backward Propagation): Qui avviene la magia. L’AI torna indietro e sposta leggermente tutte le sue miliardi di manopole (parametri) per fare in modo che, la prossima volta, la risposta “tavolo” sia più probabile.

Dopo aver ripetuto questo ciclo triliardi di volte, l’AI smette di tirare a indovinare e inizia a riconoscere gli schemi del linguaggio.

4. Overfitting e Underfitting: Gli errori dello studente

Non sempre l’addestramento va bene. Immaginiamo un’AI come uno studente che deve prepararsi per un esame.

  • Underfitting (Lo studente pigro): Il modello è troppo semplice e non studia abbastanza. Sbaglia sia gli esercizi del libro che le domande nuove all’esame. Non ha capito le regole base.
  • Overfitting (Lo studente che impara a memoria): Questo è il problema più comune. Lo studente impara a memoria ogni singola parola del libro, compresi gli errori di stampa (il “rumore” dei dati). Se all’esame gli fai una domanda leggermente diversa, fallisce perché non sa ragionare, sa solo ripetere.

Un buon modello è quello che generalizza: impara i concetti dal libro per poi saper rispondere a domande nuove.

5. I “B” (Miliardi) e la memoria: Quanto è grande un’AI?

Spesso leggiamo sigle come 7B o 70B. La “B” sta per billions (miliardi di parametri). Possiamo paragonarli alla memoria dei telefoni:

  • 7B (Modello Base): Come un telefono da 32GB. Ci girano le app base, è veloce e sta in tasca (puoi usarlo sul tuo PC di casa).
  • 70B (Livello Professionale): Come un telefono da 128GB. Molto più intelligente, ma serve un computer potente per farlo funzionare.
  • 175B+ (Frontiera): Come un computer enorme da server. Può fare quasi tutto, ma costa tantissimo e risponde più lentamente.

La Quantizzazione: Far stare un elefante in una scatola

Per far girare modelli grandi su computer normali si usa la quantizzazione. È come ridurre la qualità di un video da 4K a 720p: il file diventa molto più piccolo, ma per l’utente normale la differenza di qualità è quasi invisibile.

In cucina, è come passare dal misurare “2.847 grammi di farina” (molto preciso) a “3 grammi” (arrotondato). I biscotti verranno buoni lo stesso.


6. Token: L’alfabeto dell’AI

L’AI non legge le parole come noi, ma le sminuzza in Token. Immagina di tagliare gli ingredienti per un soffritto.

  • Una parola comune come “ciao” è 1 token.
  • Una parola complessa come “precipitevolissimevolmente” viene spezzata in più pezzetti (token).
  • Curiosità: In media, 1000 token corrispondono a circa 750 parole.

Sintesi Finale: Il Ristorante dell’AI

Per chiudere, ecco come riassumere tutto pensando a un ristorante:

Concetto AIAnalogia del Ristorante
DatiGli ingredienti grezzi.
TokenGli ingredienti tagliati a pezzetti.
AddestramentoLo studio di migliaia di ricette.
ParametriLe dosi di sale, pepe e farina scritte nella ricetta.
Fine-TuningSpecializzarsi in una cucina specifica (es. sushi).
AllucinazioniLo chef che inventa una ricetta mai provata e sbaglia.