Qué es un modelo de lenguaje (LLM) y cómo funciona

ChatGPT, Claude, Gemini, LLaMA. Todos son LLMs. Si usás IA para texto, estás usando un LLM. Pero ¿qué significa eso exactamente?

LLM: Large Language Model

Un LLM (modelo de lenguaje grande) es un sistema de inteligencia artificial entrenado con enormes cantidades de texto para predecir y generar lenguaje de forma coherente.

No «entiende» el lenguaje como lo hacemos nosotros. Pero aprendió patrones estadísticos a tal escala que puede generar texto que suena natural, coherente y útil.

Cómo aprende un LLM

Durante el entrenamiento, el modelo lee billones de palabras de libros, artículos, páginas web y conversaciones. Aprende a predecir cuál es la palabra más probable después de cada secuencia de palabras.

Ese proceso, repetido miles de millones de veces, genera un modelo capaz de escribir, resumir, traducir y razonar.

Por qué se llaman «grandes»

Por la cantidad de parámetros que tienen. Un parámetro es una variable numérica que el modelo ajusta durante el entrenamiento. Los LLMs modernos tienen entre 7.000 millones y más de un billón de parámetros. Esa escala es lo que les da capacidad.

Qué pasa cuando le escribís algo

Cuando escribís un mensaje, el modelo convierte tus palabras en números (tokens), procesa esa secuencia a través de capas matemáticas y genera una respuesta token por token, eligiendo en cada paso la continuación más probable según lo que aprendió.

Por qué a veces se equivocan

Porque predicen texto, no buscan hechos. Si no tienen suficiente información de entrenamiento sobre algo, pueden generar respuestas que suenan bien pero son incorrectas. A esto se le llama «alucinación».

Saber esto te hace mejor usuario: verificá los datos importantes, especialmente fechas, estadísticas y nombres.

Comentarios

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *