Extrapolarea și interpolația sunt utilizate pentru a estima valorile ipotetice pentru o variabilă bazată pe alte observații. Există o varietate de metode de interpolare și extrapolare, bazate pe tendința generală care se observă în date. Aceste două metode au nume care sunt foarte asemănătoare. Vom examina diferențele dintre ele.
Pentru a spune diferența dintre extrapolare și interpolare, trebuie să ne uităm la prefixele „extra” și „inter”. Prefixul „extra” înseamnă „afară” sau „în plus față de”. sau „printre”. Doar cunoașterea acestor semnificații (de la originalele lor în latină) merge mult pentru a face distincția între cele două metode.
Pentru ambele metode, presupunem câteva lucruri. Am identificat o variabilă independentă și o variabilă dependentă. Prin eșantionare sau colecție de date, avem o serie de împerecheri ale acestor variabile. De asemenea, presupunem că am formulat un model pentru datele noastre. Aceasta poate fi o linie de cel puțin pătrate care se potrivește cel mai bine sau ar putea fi un alt tip de curbă care ne apropie datele. În orice caz, avem o funcție care leagă variabila independentă cu variabila dependentă.
Scopul nu este doar modelul de dragul său, de obicei dorim să folosim modelul nostru pentru predicție. Mai exact, având în vedere o variabilă independentă, care va fi valoarea prevăzută a variabilei dependente corespunzătoare? Valoarea pe care o introducem pentru variabila noastră independentă va determina dacă lucrăm cu extrapolare sau interpolare.
Am putea folosi funcția noastră pentru a prezice valoarea variabilei dependente pentru o variabilă independentă care se află în mijlocul datelor noastre. În acest caz, efectuăm interpolare.
Să presupunem că datele cu X între 0 și 10 este utilizat pentru a produce o linie de regresie y = 2X + 5. Putem folosi această linie cea mai potrivită pentru a estima y valoarea corespunzătoare X = 6. Pur și simplu conectați această valoare la ecuația noastră și vedem că y = 2 (6) + 5 = 17. Pentru că al nostru X valoarea se numără printre gama de valori utilizate pentru ca linia să se potrivească cel mai bine, acesta este un exemplu de interpolare.
Am putea folosi funcția noastră pentru a prezice valoarea variabilei dependente pentru o variabilă independentă care se află în afara domeniului de date. În acest caz, efectuăm extrapolare.
Să presupunem ca înainte de aceste date cu X între 0 și 10 este utilizat pentru a produce o linie de regresie y = 2X + 5. Putem folosi această linie cea mai potrivită pentru a estima y valoarea corespunzătoare X = 20. Pur și simplu conectați această valoare la ecuația noastră și vedem că y = 2 (20) + 5 = 45. Pentru că al nostru X valoarea nu se numără printre gama de valori utilizate pentru a se potrivi cel mai bine liniei, acesta este un exemplu de extrapolare.
Dintre cele două metode, interpolarea este preferată. Acest lucru se datorează faptului că avem o probabilitate mai mare de a obține o estimare valabilă. Când folosim extrapolarea, presupunem că tendința noastră observată continuă pentru valori ale X în afara domeniului în care ne-am format modelul. Este posibil să nu fie cazul și, prin urmare, trebuie să fim foarte atenți atunci când folosim tehnici de extrapolare.