Funzioni per calcolare la distanza tra embeddings

Le funzioni più comunemente utilizzate per calcolare la distanza tra embeddings (vettori numerici che rappresentano dati come testo, immagini, ecc.) sono: Queste funzioni vengono scelte in base a se i vettori embedding siano normalizzati o meno, e a seconda delle caratteristiche del modello che ha generato gli embedding. Ad esempio, per vettori normalizzati, il prodotto […]

Cosa sono gli Embeddings e perché visualizzarli

Nel post precedente abbiamo descritto i database vettoriali, e come utilizzati all’interno del mondo dell’intelligenza artificiale. In particolare, abbiamo visto come il contenuto viene trasformato in embeddings (vettori N dimensionali) e memorizzati per le ricerche. In questo post vedremo come sia possibile rappresentare visivamente gli embeddings e plottarli all’interno di un grafico. Il tutto utilizzando […]

Differenze tra Ollama e Claude

In un post precedente abbiamo analizzato Ollama, e come può essere utilizzato. In questo post confrontiamo le caratteristche di Ollama con un altro servizio cloud chiamato Claude. Architettura e Filosofia Fondamentale Ollama e Claude rappresentano due approcci completamente diversi all’intelligenza artificiale. Ollama è una piattaforma open-source che consente di eseguire modelli linguistici di grandi dimensioni […]

Il “Chunking” dei Dati: La Fondamenta Invisibile dell’Intelligenza Artificiale Moderna

Nell’ecosistema dell’Intelligenza Artificiale, siamo ormai abituati a interagire con sistemi capaci di elaborare e rispondere a domande basate su volumi di dati sconfinati. Ma come possono questi modelli, che operano con limiti intrinseci di “memoria”, gestire documenti complessi come report aziendali, manuali tecnici o interi libri? La risposta si trova in un processo tanto semplice […]

Qdrant: Il Database Vettoriale Essenziale per la Ricerca Semantica Avanzata

Nel panorama in rapida evoluzione dell’intelligenza artificiale, la capacità di gestire e interrogare grandi volumi di dati non strutturati in modo efficiente è diventata cruciale. In questo contesto, i database vettoriali emergono come componenti fondamentali. Tra questi, Qdrant si posiziona come una soluzione open-source e ad alte prestazioni, pensata per superare i limiti dei sistemi […]