Overfitting vs. Underfitting: guía completa con señales, causas y soluciones

Poslední aktualizace: 11/23/2025
  • Přídavné vybavení: alta varianza, memoriza el entrenamiento y falla en datos nuevos; se corrige con regularización, validación, poda, dropout, más data a early stopping.
  • Spodní vybavení: alto sesgo, incapaz de aprender patrones; se mitiga con más complejidad, más épocas, mejor ingeniería de características y menos regularización.
  • Sesgo–varianza: equilibrio critico; komplejidad snížit sesgo pero aumenta varianza, a naopak.
  • Klíčová slova: kalibrace dat, normalizace, sledování posunu, k-fold, soubory (bagging/boosting) a přenos učení.

Srovnávací nadměrné přizpůsobení podhodnocení

Složité modely strojového učení, autobusy jsou také velmi jasné: tato funkce je shodná s daty, které jsou pro vás důležité, s novými daty. Ese equilibrio entre aprender de verdad y generalizar sin memorizar es la diferencia entre un prototipo vistoso y un sistema fiable en producción.

El problema es que alcanzar ese punto intermedio no es trivial. Dos fallos clásicos lo entorpecen: nadměrné vybavení (sobreajuste) a nedostatečné vybavení (subajuste). El primero aparece cuando el modelo se pega tanto a los datos de entrenamiento que confunde el ruido con la señal; el segundo, cuando el modelo es tan simple (o está tan limitado) que ni siquiera capta los patrones básicos. En las siguientes secciones vas a ver las causas, señales, ejemplos, la relación con el sesgo y la varianza, y un arsenal de técnicas prácticas para corregir cada caso.

Qué son overfitting y underfitting

Model s overfitting aprende demasiado de su conjunto de entrenamiento, incluyendo peculiaridades y outliers que no se repiten. Rinde de lujo en entrenamiento y flojea en validación o test. Es como un estudiante que se aprende las resuestas de memoria: clava el simulacro, pero en el el examen real se pierde.

El underfitting es la cara opuesta. Model je zachycován do struktury problému: rinde mal tanto en entrenamiento como en test. Imagina ajustar una recta a datos que siguen una curva; por muy bien que la estires, no va a encajar bien. El subajuste suele venir acompañado de alto sesgo y baja varianza.

En la práctica, medimos estas situaciones con métricas en los distintos conjuntos. Diferencias grandes entre el rendimiento en entrenamiento y validación delatan sobreajuste, mientras que resultados pobres en ambos sugieren subajuste. Además, revisar la pérdida durante el entrenamiento suele dar pistas adicionales.

Sesgo y varianza: el equilibrio delicado

Dos fuentes de error mandan aqí: sesgo (zaujatost) a variance (analýza variant). El sesgo sube cuando el modelo hace suposiciones demasiado fuertes (excesiva simplicidad), loque se traduce en underfitting. La varianza sube cuando el modelo es velmi rozumné a pequeñas fluctuaciones del conjunto de entrenamiento, loque se traduce en overfitting.

Slavný kompromisní sesgo-varianza te obliga a encontrar un punto intermedio. Al incrementar la complejidad, suele bajar el sesgo pero sube la varianza; zjednodušující, vyskytující se naopak. A lo largo del entrenamiento, el sesgo tiende a disminuir mientras la varianza puede crecer, así que conviene vigilar el comportamiento en validación y no entrenar a ciegas indefinidamente.

Ejemplo rápido: predicción de precios de vivienda. Una recta (alto sesgo) puede quedarse corta si la relación es curvilínea (podvybavení); un polinomio de grado 4 que toque cada punto puede capturar el ruido (alta varianza, overfitting); una curva suave de complejidad moderada (po ejemplo, un polinomio de grado 2 bien regularizado) suele dar el mejor compromiso.

Gráfico de ajuste y generalización

Jedná se o identifi kační problém

Las señales typicas del sobreajuste obsahuje: precisión altísima en entrenamiento y claramente inferior en test; pérdida de entrenamiento bajando mientras la pérdida de validación empieza a subir; sensibilidad extrema a pequeños cambios en la entrada; y que modelos más complejos “ganen” en entrenamiento pero no mejoren la generalización.

Para el subajuste, fíjate en métricas mediocres a ambos conjuntos y en aprendizaje estancado: si tras varias épocas no mejora la puntuación, quizá el modelo no tiene capacidad suficiente. Otro síntoma típico son predicciones demasiado generalistas: un clasificador que siempre predice la clase Mayoritaria o un regresor que apenas se aleja de la media.

La validación cruzada ayuda a ver el cuadro completo. Una alta variabilidad entre pliegues (záhyby) suele apuntar a overfitting. Coherencia en la mediocridad, en cambio, huele a underfitting. Valen tanto para přesnost como para errores de predicción (MAE, MSE) nebo métricas específicas de la tarea.

Causas habituales de overfitting

La primera sospechosa es la complejidad. Modelos con demasiados parametros para la cantidad y diversidad de datos disponibles tienden a aprender peculiaridades locales. También influye entrenar durante demasiado tiempo sin control: si no aplicas parada temprana, el modelo puede pasar de aprender patrones a memorizar.

Otra vía de sobreajuste es la ingeniería de variables sin control: demasiadas características irelevantní o muy correlacionas empujan al modelo a ver relaciones fantasma. Conjuntos pequeños o poco representativos empeoran el problema porque la muestra no enseña suficiente variación jako pro obecný model.

En redes neuronales profundas, la grand capacidad de representación es un arma de doble filo. Sin regularización y datos suficientes, las redes tienden a sobreajustar con facilidad. Včetně aspektů jako tamaño de lote (velikost šarže) demasiado grande pueden contribuir a memorizar patrones con exceso de precisión.

Causas habituales de underfitting

Podléhající příchod modelos excesivamente simples para la complejidad del problema (por ejemplo, lineales sobre relaciones no lineales). Las regularizaciones demasiado fuertes (L1/L2) también pueden „ahogar“ el aprendizaje obligando a soluciones excesivamente simples.

Otro factor es la falta de información útil en las entradas. Si las características no recogen los factores relevantes, el modelo no puede aspirar a aprenderlos. Escalados inadecuados o ausencia de normalización/estandarización pueden dificultar la optimización y traducirse en un aprendizaje pobre que parece underfitting.

Por último, también se da cuando no se entrena el tiempo suficiente (muy pocas épocas o iteraciones), cuando se retiró el modelo con parada temprana demasiado pronto, o cuando la calidad de los datos impide aprender los patrones de fondo por ruido excesivo.

Ejemplos cotidianos para entenderlo

Snímek a vize: je červená pro ruční písmo memoriza pixeles concretos, Puede clavar el entrenamiento y fallar con dígitos escritos de otra manera (přepastování). Con tecnicas coo augmentace dat (rotaciony, volty) se favorece la generalización.

Finanzas: un modelo de series temporales puede seguir cambios aleatorios del pasado que no se repiten en el futuro si está sobreajustado. Con underfitting, ni capta ciclos ni reacciona a cambios estructurales.

Un ejemplo curioso de sobreajuste es entrenar un robot de baloncesto a imitar hasta el último detalle de un jugador concreto. Robot je dokonalý v secuencias conocidas, pero se queda vendido ante jugadas nuevas. Falta generalización fuera del guion.

En meteorología, intentar predecir lluvia solo con temperatura deja fuera humedad, viento o presión. Esa pobreza de variables vede k nedostatečnému vybavení: el modelo da palos de ciego aunque veas que baja el termómetro.

Por qué el sobreajuste puede ser „peor“ que el subajuste

Hay un matiz teórico importante. Un extrémně subnastavený model podría dar siempre una Constante, ignorando el input: su error en test rondaría la varianza de la variabilní objekt. En cambio, un modelo sobreajustado que interpola todos los puntos del entrenamiento puede generar picos espurios entre muestras y disparar el error en test de forma potencialmente descomunal.

Esto puede verse con polinomios de alto grado or incluso con redes MLP sobreparametrizadas: al ajustarse a cada punto, „oscilan“ entre observaciones y crean valores absurdos fuera de la muestra. El resultado es que la degradación del rendimiento fuera de entrenamiento nemá jasný vršek.

Overfitting vs sobreparametrización: no son lo mismo

Pohodlná různá trička. Parametrizace significa que la clase de modelos tiene más capacidad de la necesaria para representar la estructura del problema. Přetížení objevit se, vytvořit konkrétní model, lo optimizas de form que rinde mejor en entrenamiento pero peor en generalización. Con regularización adecuada, es posible tener un modelo sobreparametrizado que no sobreajuste. Las técnicas de regularización (po ejemplo, hřeben nebo laso) ayudan a „desacoplar“ ambos conceptos.

Cómo evaluar y monitorizar el ajuste

Divide el flujo en entrenamiento, validación y prueba. Míra přesnosti, chyby o la métrica que toque en cada segmento. Si el entrenamiento va bien pero la validación cae, sospecha de sobreajuste; si los dos van mal, probablemente falta capacidad o datos.

La validación cruzada (k-násobek) snížit el riesgo de sacar Závěry de una sola partición. Si la media de validación es etable y la desviación entre pliegues es baja, hay más garantías de que el modelo generaliza. También es clave definir un conjunto de evaluación final (test) que no se toque durante el ajuste de hiperparámetros.

Navíc, vigila la distribución de los datos en el tiempo. Datový drift (cambios en la distribución de entrada) puede convertir en inservible un modelo que ayer funcionaba: monitorování a opakované periodicita es parte de la receta, no un lujo.

Técnicas para reducir overfitting

Data a další data. Aumentar el volumen y la diversidad del entrenamiento ayuda a que el modelo aprenda patrones de fondo en lugar detalles accidentales. Eso si, mejor calidad que cantidad: depurar outliers cuando distorsionan y corregir errores je prioritou.

Regularizace. L1 (laso) favorece la selección de características přibírat pesos za 100 %; L2 (hřeben) reparte la penalización encogiendo los pesos sin anularlos. Elastická síť combina ambas y muchas veces es un buen término medio.

Architektura a vzdělávání. Výpadek v neuronálních sítích apaga neuronas aleatoriamente y evita que el modelo dependa de rutas demasiado específicas. en árboles, la poda (prořezávání) y limitar profundidad o número de hojas zaznamenává kompletní shrnutí. Parada temprana: monitoriza la pérdida de validación y corta cuando deje de mejorar.

Ověření a výběr. k-násobná křížová validace para validar decisiones de ajuste y evitar escoger el “mejor” modelo solo por suerte. Snížení počtu proměnných o elegir mejor cuáles entran puede bajar la varianza y mejorar la interpretabilidad.

Optimalizace a spoustu věcí. Lotes pequeños představilo ruido „saludable“ en el gradiente, lo que a menudo mejora la generalización; lotes gigantes pueden favorecer el sobreajuste al seguir trayectorias de optimalización demasiado precisas al paisaje de entrenamiento.

Técnicas para reducir underfiting

Kapacita modelu. Sube la complejiidad si los datos lo exigen (polinómico en vez de lineal, árboles más profundos, redes menos superficiales). La clave está en no pasarse de frenada y acompañarlo de validaciones sólidas.

Regulace a čas. Si estás penalizando en exceso, baja la regularización para dejar respirar al modelo. Aumenta el numero de épocas: a veces el modelo simplemente necesita más tiempo para aprender, siempre con un ojo en la validación para no caer en sobreajuste.

Charakteristiky a předběžné zpracování. Amplía y mejora las características (interacciones, términos polinómicos, codificaciones adecuadas de variables categóricas). Normalizace nebo estandarizace pro tento algoritmus nejsou žádné „favorezca“ proměnné escala. en muchos casos, šum filtru zvednout užitečný signál.

Data a krytí. Más datos representativos limited la probabilidad de subajuste. Si el conjunto se queda corto, plantéate přenos učení vize NLP pro partir de zastupování, aprendidas a evitar un modelo que „no arranca“.

Kvalita dat, posun a automatizace

Kvalita dat požadovaná. Přesnost, úplnost a konzistence deberían auditarse y cruzarse con fuentes fiables. Técnicas jako normalizace (0-1) o estandarización (média 0, desviación 1) evitan que el modelo prime variables por la escala.

Con el tiempo, los datos cambian. El data drift puede causar tanto overfitting como underfitting en el nuevo contexto. Přehled: monitorované metriky, kontrolní distribuce a pravidelné pravidelné aktualizace dat.

Nástroje AutoML pueden acelerar la selección de hiperparaámetros, ingeniería de características y la creación de pipelines de evaluación, liberando tiempo para análisis de alto nivel. Známá historie: služba Amazon Machine Learning ya no se updatediza ni acepta nuevos usuarios; si trabajas con documentación antigua, tenlo presente.

Señales clave y reglas de pulgar

En la prastica del día a día, muchos empezamos igual: dudando si el modelo está sobreajustando o si simplemente se ha quedado corto de entrenamiento. Con la experiencia, se vuelve rutina mirar tres cosas: gran brecha entre train y test (sobreajuste), resultados konzistentnemente bajos en ambos (subajuste), y varianza alta entre folds (ruční nastavení).

Nepřipouštím, že by byly dobré a entrenamiento. Una curva de pérdida que cae sin parar en train pero empeora en validación es aviso de MEMORIZACIÓN. Nacházíte se, doplňuje a používá pravidelnou úpravu.

Ensamblados, selección de características a tamaño de lote

Los métodos de conjunto ayudan. Pytlování (jako Random Forest) snižuje varianzu y suele ser buen antidoto contra el sobreajuste; Zesílení (jako XGBoost) snižuje sesgo y puede levantar modelos demasiado simples, aunque seno que cuidarlo para que no sobreajuste.

La selección de características eliminovat proměnné redundantes nebo irelevantes, snížit hluk y mejora la generalización. Es uno de los remedios más efectivos cuando el problema viene por exceso de input inútil.

Takže co říkáte: lotes pequeños představil variabilidad en el gradiente ya menudo generalizan mejor; lotes muy grandes pueden empujar a soluciones que clavan el entrenamiento pero pierden en test.

Elegir el algoritmo: empieza sencillo, escala cuando toque

Dependiendo del problema y los data, distintas familias brillan más. Si seno fronteras claras, SVM o árboles pueden ir de maravilla. Conjuntos grandes y complejos, redes profundas o ensambles potentes of recent flexibilidad. Modelos sencilos como regresión lineal o k-NN son útiles con datasets modestos y cuando prima la interpretabilidad.

Una estrategia eficaz es comparar versiones simples y complejas en paralelo con un buen esquema de validación. A veces lo complejo apenas aporta mientras suma fragilidad. Žádný model „más complicado“ není nutný, není třeba, aby byl skutečný.

Casos de uso y consecuencias en negocio

En sanidad, un forecastor de riesgo debe generalizar más allá de un hospital o cohorte específica. Sobreajustar a patrones locales puede ser peligroso; subajustar, inútil. En finanzas, modelos que memorizan vaivenes históricos Fallan al traducirlos en señales futuras.

En vohículos autónomos, los detección detección deben reconocer objetos en rozmanité prostředí; memorizar imágenes concretas no sirve. V NLP, a to je analytik sentimentos aprende frases del entrenamiento "de carrerilla", no entenderá nuevas formulaciones.

A nivel de negocio, el sobreajuste da lugar a falešně pozitivní (por ejemplo, podvod) oa estrategias que parecían prometedoras en validación interna pero se desploman al desplegarse. El subajuste, por su parte, produkovat predikce holenní kosti que apenas superan reglas triviales, minando la confianza en el equipo de datos.

Preguntas frecuentes y matices prácticos

Co říkáte výběru postav a evitar sobreajuste? Al quitar ruido y redundancias, disminuye la varianza y mejora la generalización. Es de las primeras medidas a probar si sospechas entradas irelevantes.

¿Los ensambles snižuje ambos problémy? Bagování tiende a bajarská varianta (menos sobreajuste) y Posílení a bajarské sesgo (menos subajuste). Bien ajustados, syn herramientas muy potentes.

¿Por qué las redes profundas sobreajustan con facilidad? Pro svou obrovskou kapacitu. Regulace, výpadek a další data/augmentace syn esenciales para mantenerlas poctivý.

Vliv velikosti lote? Ano. Lotes pequeños představil ruido beneficioso que favorece la generalización; lotes grandes pueden “memorizar” con más facilidad.

Pomoc s transferem vzdělávacích dovedností? Mnoho. Aprovecha representaciones ya aprendidas y snížit tanto el riesgo de subajuste (falta de capacidad efectiva) como de sobreajuste en datasets pequeños.

Rychlý a přístupný kontrolní seznam

Para cerrar con un recordatorio prácico, si ves vlak/test s gran gap, piensa en regularización, menos complejidad, más data, brzké zastavení, výpadek, poda en árboles, y valida con k-fold. Si ves test ve vlaku, zvažte más capacidad, más épocas, regularizace bajarů, mejores características, y preprocesados ​​adecuados (normalizar/estandarizar).

A nevidí to v provozu: monitorovací drift, planifica reentrenos, cuida la calidad de datos y, si tiene sentido, schválit AutoML para automatizar las partes mecánicas de búsqueda de hiperparámetros y pipelines de evaluación.

Todo je téma va de equilibrio: captar la señal sin perseguir el ruido. Cuando ese balance existe, el modelo funciona dentro y fuera del laboratorio; cuando se rompe, llegan los sustos. Aprender a detectar las señales, aplicar las técnicas adecuadas y cuidar los datos es lo que rozdíl mezi „que corre“ a „que aporta valor“.

ANOVA s JavaScriptem
Související článek:
ANOVA s JavaScriptem: desde la teoría a las herramientas
Související příspěvky: