Regression

C.F.Gauss er en metode til at bestemme bedste rette linie gennem et antal punkter. Teorien er udviklet af C. F. Gauss i 1820-erne. Metoden kaldes ofte mindste kvadraters metode.

Emner

Bedste rette linie

Grafikken viser bedste rette linie gennem 4 punkter

Beklager; din browser kan ikke vise applets!

Lad der være giver n punkter (x1, y1), (x2, y2), ... , (xn, yn) og linien med ligningen l : y = a · x + b.
I stedet for at regne med den vinkelrette afstand mellem et punkt og l, valgte Gauss at se på den lodrette afstand. Lodret over/under punktet (xi, yi) ligger liniepunktet (xi, a · xi + b), og den lodrette afstand er di = ½a · xi + b – yi½. Afstandskvadratet er di2 = (a · xi + b – yi)2.
Ideen er nu at variere a og b, indtil summen af afstandskvadraterne bliver så lille som muligt. Vi danner altså funktionen

For at finde kravene til a og b, differentierer vi d2(a, b) partielt med hensyn til a. D.v.s. at alt andet end a holdes konstant under differentiationen. Det skrives

Partiel differentiation m.h.t. b giver

Summen af afstandskvadraterne bliver mindst mulig, når differentialkvotienterne er 0, så

Disse ligninger løses af

[ Hovedmenu ] [ Ordliste ]

Korrelation

Uanset hvordan de n punkter ligger, er der altid Ún "bedste rette linie" gennem dem. Men i nogle tilfælde er tilpasningen bedre end i andre. For at undersøge dette, læner vi os op ad statistikken, idet vi lader punkterne indgå med samme vægt 1 / n.

Vi indfører variablerne X = {x1, x2, ... , xn} og Y = {y1, y2, ... , yn} og deres middelværdier

For varianserne finder vi

og dermed spredningerne

Covariansen bliver

Hvis der er stor sandsynlighed for, at X og Y på samme tid er større end deres middelværdier og på samme tid mindre, er cov(X, Y) > 0. Er X ofte større end sin middelværdi, når Y er mindre end sin og omvendt, er cov(X, Y) < 0. Er der ingen sådan sammenhæng mellem X og Y, siges X og Y at være uafhængige, og cov(X, Y) = 0. Som mål for, hvor godt linien matcher med punkterne, anvendes korrelationsionskoefficienten R(X, Y)

[ Hovedmenu ] [ Ordliste ]

Andre funktioner

Eksponentielle funktioner   y = b · ax

Her er Y = log(y) = log(a) · x + log(b), så man anvender mindste kvadraters metode på punkterne (x1, log(y1)), ... (xn, log(yn)), og finder konstanterne A = log(a) og B = log(b). Herefter er ligningen for bedste eksponentielle kurve y = 10B · (10A)x.

Her er MatLex' regnemaskine til "bedste eksponentielle funktion".

Potentensfunktioner   y = b · xa

Her er Y = log(y) = log(x) · a + log(b), så man anvender mindste kvadraters metode på punkterne (log(x1), log(y1)), ... (log(xn), log(yn)), og finder konstanterne a og B = log(b). Herefter er ligningen for bedste eksponentielle kurve y = 10B · xa.

Her er MatLex' regnemaskine til "bedste potens- funktion".

[ Hovedmenu ] [ Ordliste ]

Links

[ Hovedmenu ] [ Ordliste ] [ Tilbage til hovedsiden ]