Suponeos que tenemos una secuencia de números:
3 2 4 5 6 7 1 8 9
Tenemos que resumir la secuencia en un solo número minimizando el error, por definición de "minimizar el error" se entiende como que los números se modifican lo menos posible. Por ejemplo si cogieramos el 9 y calcularamos el error absoluto acumulado:
9-9 = 0
9-8 = 1
9-7 = 2
9-6 = 3
9-5 = 4
9-4 = 5
9-3 = 6
9-2 = 7
9-1 = 8
Total: 36
La solución más eficiente a este problema en concreto sería el 5, puesto que su error es menor:
5-9 = 4
5-8 = 3
5-7 = 2
5-6 = 1
5-5 = 0
5-4 = 1
5-3 = 2
5-2 = 3
5-1 = 4
Total: 20
Si en vez de un solo número, tuvieramos que resumirla en dos números, probablemente cogeríamos el 3 y el 6. Y si fueran 5 números cogeríamos los números pares.
Si generalizamos el problema. Se busca que dada una secuencia de números, resumirla en X números de modo que se minimize el error. ¿Que pasos se deberían seguir para tener siempre la mejor solución? Busco un método que seguir paso a paso (da igual que sea laborioso, lo hará una computadora).