Minst kvadrater

Minst kvadrater

Vad är metoden för minsta rutor?

Metoden för Minst kvadrater Det är en av de viktigaste applikationerna i funktionernas tillvägagångssätt. Tanken är att hitta en kurva så att med tanke på en uppsättning snygga par är denna funktion bättre närmar sig data. Funktionen kan vara en linje, en kvadratisk kurva, en kubik etc.

Idén med metoden är att minimera summan av kvadrater för skillnaderna i ordinaterna (komponent Y), mellan de punkter som genereras av den valda funktionen och punkterna som tillhör datauppsättningen.

Minsta kvadratmetod

Innan vi ger metoden måste vi först vara tydliga om vad "det är bättre närmar sig". Anta att en linje söks y = b+mx som är den som bäst representerar en uppsättning n -punkter, nämligen (x1, y1), (x2, y2) ..., (xn, yn).

Som visas i föregående siffra, om variablerna x och y var relaterade till linjen y = b+mx, skulle för x = x1 motsvarande värde på y vara b+mx1. Detta värde skiljer sig emellertid från det verkliga värdet på y, vilket är y = y1.

Kom ihåg att i planet ges avståndet mellan två punkter av följande formel:

Med detta i åtanke, för att bestämma hur man väljer linjen y = b+mx som bäst närmar sig de givna uppgifterna, låter det logiskt att använda som ett kriterium valet av linjen som minimerar summan av kvadrarna för avståndet mellan punkterna och linjen.

Eftersom avståndet mellan punkterna (x1, y1) och (x1, b+mx1) är y1- (b+mx1) reduceras vårt problem till att hitta siffror m och b så att nästa summa är minimal:

Kan tjäna dig: grönt teorem, demonstration, applikationer och övningar

Linjen som uppfyller detta tillstånd kallas "tillvägagångssättet till linjen med minsta rutor till punkterna (x1, y1), (x2, y2), ..., (xn, yn)".

När problemet har erhållits återstår det bara att välja en metod för att hitta tillvägagångssättet med minsta rutor. Om punkterna (x1, y1), (x2, y2), ..., (xn, yn) är alla på linjen y = mx+b, måste vi vara colineala och::

I detta uttryck:

Slutligen, om punkterna inte är colineal, kan y-au = 0 och problemet översätta till att hitta en vektor eller sådan att den euklidiska standarden är minimal.

Hitta den minimerade vektorn eller är inte så svårt som du kan tänka. Eftersom A är en NX2 och U -matris är en 2 × 1 -matris, har vi att Au -vektorn är en vektor i Rn och tillhör bilden av A, som är ett underområde på Rn Med en dimension inte mer än två.

Vi antar att n = 3 för att visa vad som är proceduren som måste följas. Om n = 3 kommer bilden av A att vara ett plan eller en linje som passerar genom ursprunget.

Låt v den minimerade vektorn. I figuren observerar vi att Y-Au minimeras när den är ortogonal till bilden av en. Det vill säga, om V är den minimerade vektorn, så händer det att:

Sedan kan vi uttrycka ovan på detta sätt:

Detta kan bara hända om:

Slutligen, clearing v, måste vi:

Det är möjligt att göra detta sedantA är inverterbar när N -pekar som data inte är kolineala.

Om vi ​​istället för att leta efter en rad vill hitta en liknelse (vars uttryck skulle vara av formen y = a+bx+cx2) Att det var en bättre tillnärmning till datapunkterna, proceduren skulle beskrivas nedan.

Kan tjäna dig: hela siffror

Om datapunkterna var i den liknelsen, skulle det behöva:

Sedan:

På liknande sätt kan vi skriva y = au. Om alla punkter inte finns i liknelsen, har vi att Y-AU skiljer sig från noll för alla vektor U och vårt problem är igen: Hitta en vektor U i R3 så att dess norm || y-Au || vara så mycket som möjligt.

Att upprepa det tidigare proceduren kan vi komma till den önskade vektorn är:

Löst övningar

Övning 1

Hitta den rad som bäst passar punkterna (1.4), (-2.5), (3, -1) och (4.1).

Lösning

Vi måste:

Sedan:

Därför drar vi slutsatsen att den linje som bäst passar punkterna ges av:

Övning 2

Anta att ett objekt tappas från en höjd av 200 m. Under fall vidtas följande åtgärder:

Vi vet att höjden på detta objekt, efter en tid har gått, ges av:

Om vi ​​vill få värdet på G kan vi leta efter en liknelse som är en bättre strategi för de fem punkter som ges i tabellen, och därmed skulle vi ha den koefficienten som följer med2 Det kommer att vara ett rimligt tillvägagångssätt för (-1/2) g om mätningarna är exakta.

Vi måste:

Och då:

Så datapunkterna justeras av följande kvadratiska uttryck:

Så du måste:

Detta är ett värde som är rimligt nära den rätta, vilket är g = 9,81 m/s2. För att få en mer exakt g av g skulle det vara nödvändigt att starta från mer exakta observationer.

Vad är den minsta fyrkantiga metoden för?

I de problem som uppstår i naturliga eller samhällsvetenskaper är det bekvämt att skriva förhållandena mellan olika variabler genom något matematiskt uttryck.

Kan tjäna dig: proportionell variation

Till exempel kan vi i ekonomi relatera till kostnaden (c), inkomst (i) och vinster (u) genom en enkel formel:

I fysiken kan vi relatera accelerationen orsakad av tyngdkraften, den tid då ett objekt har fallit och objektets höjd enligt lag:

I det tidigare uttrycketantingen Det är den initiala höjden på nämnda objekt och vantingen är din första hastighet.

Att hitta formler som dessa är dock inte en enkel uppgift; Det motsvarar vanligtvis den professionella som är skyldig att arbeta med många data och upprepade gånger genomföra flera experiment (för att verifiera att de erhållna resultaten är konstanta) för att hitta förhållanden mellan de olika data.

Ett vanligt sätt att uppnå detta är att representera de data som erhållits i ett plan som punkter och söka en kontinuerlig funktion som optimalt närmar sig dessa punkter.

Ett av sätten att hitta den funktion som "bättre närmar sig" de uppgifter som ges är med metoden för kvadratminimum.

Som vi också såg i övningen kan vi tack vare denna metod uppnå ganska nära tillvägagångssätt för fysiska konstanter.