Aproksymacja średniokwadratowa dyskretna
Wprowadzenie
Danych jest (n+1) różnych punktów x0, x1, ... , xn z przedziału [a,b] oraz wartości pewnej
funkcji y = f(x) w tych punktach
y0 = f(x0) , y1 = f(x1) , .... , yn = f(xn).
W przybliżeniach interpolacyjnych przyjmuje się , że funkcja przybliżająca F w punktach
xi pokrywa się z wartościami funkcji f. Wymóg ten jest często niedogodny, gdy wartości
f określone są empirycznie (np. są wynikami pomiarów). Wtedy wartości te mogą być
obarczone błędami, i wówczas żądanie, aby szukana funkcja F przyjmowała dokładnie te
wartości nie ma sensu.
Zajmiemy się teraz zagadnieniem bardziej ogólnym, w którym warunek, aby funkcja
przybliżana i funkcja przybliżająca przyjmowały dokładnie te same wartości w punktach
xi , nie musi być spełniony.
Przyjmujemy, że funkcja przybliżająca F jest określona przez zależność
F(x) = F(x; a0, a1, .... , am)
od (m+1) parametrów a0, a1, ... , am , przy czym
Ogólnie , zagadnienie aproksymacji na zbiorze punktów X = {x0, x1, ... , xn } polega na
wyznaczeniu parametrów a0, a1, ... , am tak, aby odległości yi (i = 0,1, ... ,n) od F były
minimalne. Sposób wyznaczania parametrów zależy od tego, jak rozumiemy to kryterium.
Niech = ( 0, 1, , ... , m) będzie układem (m+1) funkcji określonych na przedziale [a,b].
Będziemy rozważać zadanie aproksymacji liniowej polegające na przybliżaniu funkcji f
kombinacjami liniowymi funkcji j (j = 0, 1, ... , m)
Termin "liniowy" odnosi się do liniowej zależności F od parametrów aj ; nie wymagamy,
aby F zależała liniowo od x.
W aproksymacji średniokwadratowej dyskretnej, lub inaczej w metodzie najmniejszych
kwadratów, współczynniki aj dobieramy tak, aby wyrażenie
zwane odchyleniem średniokwadratowym, miało najmniejszą wartość.
Funkcję Fm , dla której H osiąga minimum nazywamy m-tą funkcją optymalną (względem
układu na zbiorze X).
Zadanie znajdowania funkcji aproksymacyjnej Fm sprowadza się do znalezienia minimum
funkcji (m+1) zmiennych. Poszukiwane wartości współczynników wyznaczamy z warunków
zerowania się pochodnych cząstkowych
= 0 , k = 0, 1, ... , m
Powyższe równości tworzą układ (m+1) równań liniowych z (m+1) niewiadomymi
a0, a1, ... , am , zwany układem równań normalnych
Ga = b,
gdzie G = [Gi,j] (i,j = 0, 1, ... , m) , a = [a0, a1, ... , am ]T, b = [b0, b1, ... , bm ]T ,
, (i,j = 0, 1, ... , m).
Macierz G, zwana macierzą Grama, jest macierzą kwadratową stopnia (m+1).
Można zapisać
G = MTM i b = MTy,
gdzie y = [y0, y1, ... , yn ]T i
Uwaga. Macierz G jest nieosobliwa wtedy i tylko wtedy, gdy rząd macierzy M
jest równy (m+1).
Stąd wynika, że
Twierdzenie. Jeżeli rząd macierzy M jest równy (m+1), to istnieje dokładnie jedna m-ta
funkcja optymalna (w sensie aproksymacji średniokwadratowej dyskretnej).
Błąd średniokwadratowy oblicza się ze wzoru
Gdy m = n i rząd M jest równy (n+1), to n-ta funkcja optymalna jest funkcją interpolującą
funkcji f opartą na węzłach X. Wówczas odchylenie średniokwadratowe H i błąd średnio-
kwadratowy są równe 0. Interpolacja jest jedną z metod aproksymacji - nazywana jest
często aproksymacją interpolacyjną.
Przyjmując m n tracimy własności wygładzania "zakłóconych" wartości yi , jakie ma
aproksymacja średniokwadratowa. W praktyce, najczęściej m jest znacznie mniejsze niż n.
Aproksymacja wielomianowa i trygonometryczna
Funkcje określają postać funkcji aproksymującej. Rozpatrzymy wielomiany algebraiczne
i funkcje trygonometryczne
Jeżeli funkcje są wielomianami stopnia j (j = 0, 1, 2 , ... , m), to Fm jest wielomianem stopnia
co najwyżej m. Wtedy funkcję optymalną Fm nazywamy m-tym wielomianem (algebraicznym)
optymalnym.
W przypadku jednomianów , już dla niedużych m (m>5) układ równań normalnych
jest źle lub bardzo źle uwarunkowany (W13). W przypadku przybliżeń wielomianowych
z wyjątkiem , gdy m jest bardzo małe, nie należy stosować takiego wyboru funkcji . Należy
stosować tzw. wielomiany Grama ; omówienie tych problemów przekracza ramy wykładu.
Uwaga. Przy aproksymacji takimi wielomianami macierz G jest macierzą diagonalną.
W zagadnieniach aproksymacji często spotykamy się z przypadkiem, gdy yi są wartościami
pomiarowymi pewnego zjawiska , o którym wiadomo, że ma przebieg okresowy. Wtedy
do aproksymacji korzystniej jest stosować wielomiany trygonometryczne, a nie algebraiczne.
Niech ( ).
Rozważamy na odcinku [0,2] aproksymację trygonometryczną postaci
na zbiorze równoodległych punktów
i = 0, 1, .... , n
Na tym zbiorze punktów macierz Grama jest macierzą diagonalną. Ponadto
j = 1, 2, ... ,k
Powiedzmy, że mamy ustalony układ funkcji = ( 0 , 1 , , ... , m , ...) . Liczbę funkcji
przybliżających, czyli wartość (m+1), ustalamy na podstawie analizy modelu badanego
zjawiska lub wyznaczając kolejne funkcje optymalne Fm (m = 0, 1, 2 , ..... ) i obliczając
kwadrat średniego błędu
gdzie Hm jest odchyleniem średniokwadratowym dla m-tej funkcji optymalnej Fm. Obliczenia
te prowadzimy tak długo, aż maleje w sposób istotny. Wartość m, po której
już niemaleje znacznie, wyznacza układ funkcji przybliżających 0, 1, , ... , m .
mhead