Saturday 11 November 2017

Przewidywana średnio przesunięciowa prognoza


Przenoszenie średniej prognozy Wprowadzenie. Jak można się spodziewać, patrzymy na niektóre z najbardziej prymitywnych podejść do prognozowania. Ale miejmy nadzieję, że są to co najmniej warte wstępu do niektórych zagadnień związanych z komputerem związanych z wdrażaniem prognoz w arkuszach kalkulacyjnych. W tym kontekście będziemy kontynuować od początku i rozpocząć pracę z prognozą Moving Average. Przenoszenie średnich prognoz. Wszyscy znają średnie ruchome prognozy niezależnie od tego, czy uważają, że są. Wszyscy studenci studiują je przez cały czas. Pomyśl o swoich testach w kursie, w którym podczas semestru będziesz miał cztery testy. Pozwala przyjąć, że masz 85 przy pierwszym testie. Jak oceniasz Twój drugi punkt testowy Co sądzisz, że Twój nauczyciel przewidziałby następny wynik testu Jak myślisz, że Twoi znajomi mogą przewidzieć następny wynik testu Jak myślisz, że twoi rodzice mogą przewidzieć następny wynik testu Niezależnie od tego, wszystkie blabbing, które możesz zrobić znajomym i rodzicom, to oni i nauczyciel bardzo oczekują, że dostaniesz coś w tej dziedzinie, którą właśnie dostałeś. No cóż, teraz pomyślmy, że pomimo twojej samoobrony do swoich znajomych, oszacujesz siebie i postanów, że możesz uczyć się mniej na drugim teście, a więc dostajesz 73. Teraz wszyscy zainteresowani i niezainteresowani idą przewiduj, że otrzymasz trzeci test Istnieją dwa bardzo prawdopodobne podejścia do nich, aby opracować szacunkowe niezależnie od tego, czy będą dzielić się nim z Tobą. Mówią same do siebie: "Ten facet zawsze dmucha o jego inteligencję. On będzie dostać kolejne 73, jeśli ma szczęście. Może rodzice będą starali się być bardziej pomocni i powiedzieli: "WELL", jak dotąd dostałeś 85 i 73, więc może powinieneś się dowiedzieć na temat (85 73) 2 79. Nie wiem, może gdybyś mniej imprezował i werent waha się weasel na całym miejscu i jeśli zacząłeś robić dużo więcej studiów, możesz uzyskać wyższy score. quot Oba te szacunki są w rzeczywistości przechodzą średnie prognozy. Pierwszy używa tylko swojego ostatniego wyniku, aby prognozować przyszłe wyniki. Nazywa się to ruchomą średnią prognozą przy użyciu jednego okresu danych. Druga to również średnia ruchoma, ale wykorzystująca dwa okresy danych. Pozwala przyjąć, że wszyscy ci ludzie popychają do twojego wielkiego umysłu, jakby się wkurzyli i postanowili dobrze wykonać trzeci test ze swoich własnych powodów i położyć większy wynik przed Twoimi notatkami. Robisz test, a Twój wynik jest w rzeczywistości 89 Wszyscy, łącznie z sobą, są pod wrażeniem. Więc teraz masz ostatni test semestru nadchodzącego i jak zwykle masz wrażenie, że musimy nakłonić wszystkich do stworzenia swoich prognoz dotyczących sposobu, w jaki wykonasz ostatni test. Mam nadzieję, że widzisz wzór. Teraz, miejmy nadzieję, widać wzór. Jaki jest Twój najlepszy gwizdek podczas pracy. Teraz wracamy do naszej nowej firmy zajmującej się sprzątaniem, która rozpoczęła się od twojej ukochanej siostry o nazwie Gwizdek podczas pracy. Masz dane z przeszłych sprzedaży przedstawione w następnej części arkusza kalkulacyjnego. Najpierw przedstawiamy dane dotyczące trzech okresowych prognoz średniej ruchomej. Wpisem dla komórki C6 powinno być Teraz możesz skopiować tę formułę komórki do innych komórek C7 do C11. Zauważ, jak średnia przenosi się do ostatnich danych historycznych, ale używa dokładnie trzech ostatnich okresów dostępnych dla każdego przewidywania. Warto też zauważyć, że nie musimy naprawdę przewidzieć z ostatnich okresów, aby rozwinąć nasze najnowsze prognozy. To zdecydowanie różni się od wyrafinowanego modelu wygładzania. Ive uwzględniła przewidywania kwotowania, ponieważ będziemy używać ich na następnej stronie internetowej w celu pomiaru ważności przewidywania. Teraz chcę przedstawić analogiczne wyniki dla dwóch okresów ruchomych średniej prognozy. Wpisem dla komórki C5 powinno być Teraz możesz skopiować tę formułę komórki do innych komórek C6 do C11. Zauważmy, że teraz tylko dwie ostatnie dane historyczne są wykorzystywane do każdego przewidywania. Znowu uwzględniono prognozy kwotowania dla celów ilustracyjnych i późniejsze wykorzystanie w walidacji prognozy. Inne ważne rzeczy do zauważenia. W przypadku prognozy średniej ruchomej w skali m wykorzystano jedynie najmniejsze wartości danych, aby przewidzieć. Nic więcej nie jest konieczne. Jeśli chodzi o prognozę średniej ruchomej w okresie m, przy prognozowaniu kwotowania zauważ, że pierwsza predykcja występuje w okresie m 1. Zarówno te kwestie będą bardzo znaczące, gdy opracujemy nasz kod. Rozwój funkcji przeciętnej ruchomości. Teraz musimy opracować kod dla prognozy średniej ruchomej, którą można używać bardziej elastycznie. Kod jest następujący. Zauważ, że dane wejściowe są dla liczby okresów, których chcesz używać w prognozie i tablicach wartości historycznych. Można go przechowywać w dowolnej skoroszycie. Funkcja MovingAverage (Historical, NumberOfPeriods) jako pojedynczy Deklarowanie i inicjowanie zmiennych Dim Item as Variant Dim Counter jako Integer Dim Akumulacja jako pojedynczy Dim HistoricalSize jako Integer Inicjalizacja zmiennych Counter 1 Akumulacja 0 Określenie rozmiaru historycznego HistoricalSize Historical. Count licznika 1 dla NumberOfPeriods Zbieranie odpowiedniej liczby ostatnich poprzednich wartości Accumulation Accumulation Historical (HistoricalSize - NumberOfPeriods Counter) MovingAverage Akumulacja NumberOfPeriods Kod zostanie wyjaśniony w klasie. Chcesz umieścić funkcję w arkuszu kalkulacyjnym tak, aby wynik obliczeń pojawił się w miejscu, w którym powinien on wyglądać jak poniżej. Prognozowanie przez techniki wygładzania Ta strona jest częścią elektronicznych obiektów E-learning, które uczą się obiektów do podejmowania decyzji. Inne JavaScript w tej serii są podzielone na kategorie w różnych obszarach aplikacji w sekcji MENU na tej stronie. Seria czasowa jest sekwencją obserwacji zamówionych w czasie. Istotnym elementem zbioru danych z czasem jest pewna forma losowej odmian. Istnieją metody zmniejszania anulowania efektu z powodu zmienności losowej. Szeroko stosowane techniki są wygładzające. Techniki te, gdy są odpowiednio stosowane, ujawniają bardziej wyraźne tendencje. Wpisz sekwencję czasową Wiersz w kolejności, zaczynając od lewego górnego naroża, a parametr (y), a następnie kliknij przycisk Oblicz (Calculate), aby uzyskać jedno-wyprzedzające prognozy. Puste pola nie są uwzględniane w obliczeniach, ale zerami są. Podczas wprowadzania danych do przenoszenia z komórki do komórki w macierzy danych użyj klawisza Tab, a nie strzałki lub wprowadź klucze. Cechy serii czasowych, które mogą być ujawnione poprzez zbadanie jego wykresu. z prognozowanymi wartościami, zachowaniem resztkowym, modelowaniem prognoz stanu. Średnie kroczące: średnia ruchoma zaliczana jest do najpopularniejszych technik preprocesowania szeregów czasowych. Są one wykorzystywane do filtrowania białego szumu przypadkowego z danych, aby szereg czasów był gładszy, a nawet podkreślał pewne elementy informacyjne zawarte w serii czasów. Exponential Smoothing: Jest to bardzo popularny schemat generowania wygładzonej serii czasowej. Podczas gdy w Moving Averages poprzednie obserwacje są ważone jednakowo, Exponential Smoothing przypisuje wykładniczo malejące ciężary, gdy obserwacja staje się starsza. Innymi słowy, niedawne obserwacje są relatywnie większe w prognozowaniu niż starsze obserwacje. Double Exponential Smoothing lepiej sprawdza trendy. Triple Exponential Smoothing lepiej sprawdza trendy paraboli. Średnia ważona średnią ruchoma z wycentrowaną prędkością a. odpowiada w przybliżeniu prostej średniej ruchomej długości (to jest okresu) n, gdzie a i n są powiązane przez: a (n1) OR n (2 - a) a. Tak więc, na przykład, średnia ważona średnią ruchoma ze stałą wygładzania równą 0,1 odpowiadaby w przybliżeniu 19-dniowej średniej ruchomej. I 40-dniowa prosta średnia ruchoma odpowiadałaby przybliżonej średniej ruchomej z wykładziną wykładaną ze stałą wygładzania równą 0,04878. Holts Linear Exponential smoothening: Załóżmy, że serie czasów są nie sezonowe, ale mają tendencję do wyświetlania. Metoda Holts szacuje obecny poziom i obecny trend. Zwróć uwagę, że prosta średnia ruchoma jest szczególnym przypadkiem wygładzania wykładniczego poprzez ustawienie okresu średniej ruchomej na całkowitą część (2-alfa) alfa. Dla większości danych biznesowych parametr alfa o wartości mniejszej niż 0,40 jest często skuteczny. Można jednak wykonać przeszukiwanie siatki przestrzeni parametrów, od 0,1 do 0,9, ze skokiem 0,1. Następnie najlepsza alfa ma najmniejszy średni błąd bezwzględny (MA Error). Jak porównać kilka metod wygładzania: Choć istnieją wskaźniki liczbowe do oceny dokładności techniki prognozowania, najbardziej szerokim podejściem jest użycie wizualnego porównania kilku prognoz w celu oceny ich dokładności i wyboru spośród różnych metod prognozowania. W tym podejściu należy wykreślić (na przykład na Excelze) na tym samym wykresie oryginalne wartości zmiennej z serii czasowej i prognozowane wartości z kilku różnych metod prognozowania, co ułatwia porównanie wizualne. Możesz skorzystać z wcześniejszych prognoz za pomocą wygładzania technik JavaScript w celu uzyskania wcześniejszych wartości prognoz opartych na technikach wyrównywania, które używają tylko jednego parametru. Metody Holt i Winters wykorzystują odpowiednio dwa i trzy parametry, dlatego też nie jest łatwo wybrać optymalne, a nawet bliskie wartości optymalne przez próby i błędy parametrów. Jednokierunkowe wygładzenie podkreśla perspektywę krótkiego zasięgu, wyznaczając poziom do ostatniej obserwacji i opiera się na warunku, że nie ma tendencji. Regresja liniowa, która pasuje do linii najmniejszych kwadratów do danych historycznych (lub przekształconych danych historycznych), reprezentuje długi dystans, który zależy od podstawowej tendencji. Holts liniowe wyrównanie wykładnicze przechwytuje informacje o najnowszym trendzie. Parametry w modelu Holts to parametr poziomów, który powinien zostać zmniejszony, gdy wielkość zmian danych jest duża, a parametr trendu powinien zostać zwiększony, jeśli ostatni trend będzie wspierany przez przyczyny. Prognoza krótkoterminowa: zwróć uwagę, że każdy JavaScript na tej stronie zapewnia prognozę na jedną stronę. Aby uzyskać prognozę dwuetapową. po prostu dodaj prognozowaną wartość na koniec danych serii danych, a następnie kliknij przycisk Oblicz. Możesz powtórzyć ten proces kilka razy w celu uzyskania potrzebnych prognoz krótkoterminowych. Modyfikowanie średnich i wykładniczych modeli wygładzania Jako pierwszy krok w wychodzeniu poza średnie modele, modele chodzenia swobodnie i modele trendów liniowych, wzorce i tendencje niepożądane mogą być ekstrapolowana przy użyciu modelu ruchomo-średniego lub wygładzającego. Podstawowym założeniem za modelami uśredniania i wygładzania jest to, że szereg czasowy jest lokalnie stacjonarny, a powoli zmienia się średnio. W związku z tym bierzemy ruchomą (lokalną) średnią w celu oszacowania bieżącej wartości średniej, a następnie użyć jej jako prognozy na najbliższą przyszłość. Można to uznać za kompromis między średnim modelem a modelem losowego chodzenia bez dryfu. Ta sama strategia może być wykorzystana do oszacowania i ekstrapolacji lokalnego trendu. Średnia ruchoma jest często określana jako quotsmoothedquot wersja pierwotnej serii, ponieważ uśrednianie krótkotrwałe ma efekt wygładzania uderzeń w oryginalnej serii. Dostosowując stopień wygładzania (szerokość średniej ruchomej), możemy mieć nadzieję na osiągnięcie jakiegoś optymalnego balansu między osiągnięciem modelu średniej i losowej. Najprostszym modelem uśredniania jest. Prosta (równoważona wagą) Średnia ruchoma: Prognoza dla wartości Y w czasie t1, która jest wykonana w czasie t równa się zwykłej średniej z ostatnich obserwacji m: (Tutaj i gdzie indziej będę używać symbolu 8220Y-hat8221 dla prognozowania serii czasowej Y dokonanej najwcześniej w poprzednim terminie przez dany model). Ta średnia jest wyśrodkowana w okresie t - (m1) 2, co oznacza, że ​​oszacowanie lokalnej średniej będzie miało tendencję do opóźnienia w stosunku do prawdziwych wartość lokalnej średniej o około (m1) 2 okresów. Tak więc mówimy, że średni wiek danych w prostej średniej ruchomej wynosi (m1) 2 w stosunku do okresu, na który obliczana jest prognoza: jest to ilość czasu, w jakim prognozy będą się spóźniały za punktami zwrotnymi w danych . Na przykład, jeśli uśrednimy ostatnie 5 wartości, prognozy będą wynosić około 3 okresy późne w odpowiedzi na punkty zwrotne. Zauważ, że jeśli m1, model prostego ruchu średniego (SMA) odpowiada modelowi losowego chodzenia (bez wzrostu). Jeśli m jest bardzo duża (porównywalna z długością okresu szacowania), model SMA jest równoważny średniemu modelowi. Podobnie jak w przypadku dowolnego parametru modelu prognozowania, zwykle dostosowywana jest wartość k w celu uzyskania najlepszej jakości danych, tzn. Najmniejszych średnich błędów prognozy. Oto przykład serii, która wydaje się wykazywać przypadkowe wahania wokół średniej wolno zmieniającej się. Po pierwsze, spróbuj dopasować go do modelu przypadkowego spaceru, co odpowiada prostej średniej ruchomej z jednej kadencji: model losowego spaceru reaguje bardzo szybko na zmiany w serii, ale w ten sposób robi to znacznie pobudzając kwintesencję dane (losowe fluktuacje), jak również kwotsignalquot (lokalna średnia). Jeśli weźmiemy pod uwagę prostą średnią ruchomą wynoszącą 5 terminów, otrzymamy gładszy zestaw prognoz: 5-letnia prosta średnia ruchoma daje w tym przypadku znacznie mniejsze błędy niż model losowego chodu. Przeciętny wiek danych w tej prognozie wynosi 3 ((51) 2), co oznacza, że ​​ma tendencję do pozostawania za punktami zwrotnymi przez około trzy okresy. (Na przykład spadek koniunktury wydaje się występować w okresie 21, ale prognozy nie odwracają się do kilku okresów później). Zauważ, że długoterminowe prognozy modelu SMA to poziome linie proste, podobnie jak w przypadku losowego spaceru Model. Tak więc, model SMA zakłada, że ​​nie ma tendencji w danych. Jednakże, mając na uwadze, że prognozy z modelu losowego spaceru są po prostu równoważne ostatniej obserwowanej wartości, prognozy z modelu SMA są równe średniej ważonej ostatnich wartości. Ograniczenia ufności obliczone przez Statgraphics w odniesieniu do długoterminowych prognoz dotyczących prostej średniej ruchomej nie są szersze, gdy horyzont prognoz wzrasta. To oczywiście nie jest poprawne Niestety, nie ma podstawowej teorii statystycznej, która mówi nam, w jaki sposób przedziały ufności powinny poszerzać się w tym modelu. Nie jest jednak zbyt trudno obliczyć empirycznych szacunków dopuszczalnych granic dla prognoz długoterminowych. Na przykład można utworzyć arkusz kalkulacyjny, w którym model SMA byłby wykorzystywany do prognozowania 2 kroków naprzód, 3 kroków naprzód itp. W ramach historycznej próbki danych. Następnie można obliczyć próbkowe odchylenia standardowe błędów w każdym horyzoncie prognozy, a następnie skonstruować interwały zaufania dla prognoz długoterminowych przez dodawanie i odejmowanie wielokrotności odpowiedniego odchylenia standardowego. Jeśli będziemy próbować 9-letniej prostej średniej ruchomej, otrzymamy jeszcze gładsze prognozy i bardziej opóźniamy: średni wiek wynosi teraz 5 okresów ((91) 2). Jeśli weźmiemy 19-letnią średnią ruchliwą, średni wiek wzrośnie do 10: Zauważ, że prognozy są już za punktami zwrotnymi o około 10 okresów. Która suma wygładzania jest najlepsza dla tej serii Poniżej znajduje się tabela porównująca ich statystykę błędów, w tym również średnia 3-letnia: Model C, 5-letnia średnia ruchoma, daje najniższą wartość RMSE przez mały margines w ciągu 3 średnie i średnie 9-dniowe oraz inne statystyki są niemal identyczne. Wśród modeli o bardzo podobnych statystykach błędów możemy wybrać, czy wolelibyśmy nieco lepiej reagować lub trochę bardziej sprawnie. (Powtórz początek strony). Browns Simple Exponential Smoothing (średnia wykładana ważona średnią ruchoma) Opisany wyżej prosty model średniej średniej ma niepożądaną właściwość, która traktuje ostatnie obserwacje równomiernie i całkowicie ignoruje wszystkie poprzednie obserwacje. Intuicyjnie dane z przeszłości powinny być dyskontowane w sposób bardziej stopniowy - na przykład ostatnie obserwacje powinny mieć nieco więcej niż druga ostatnia, a druga ostatnia powinna być nieco większa niż ostatnia z trzech, a wkrótce. Dokonuje tego prostokątny wygładzający (SES). Niech 945 oznacza stałą kwotową konsystencji (liczba między 0 a 1). Jednym ze sposobów zapisania modelu jest zdefiniowanie serii L, która reprezentuje aktualny poziom (tzn. Średnia wartość lokalna) szeregu szacowana na podstawie danych do dnia dzisiejszego. Wartość L w czasie t obliczana jest rekurencyjnie z własnej poprzedniej wartości: W ten sposób bieżąca wygładzona wartość jest interpolacją pomiędzy poprzednią wygładzoną wartością a bieżącą obserwacją, gdzie 945 kontroluje bliskość interpolowanej wartości do najnowszej obserwacja. Prognoza na następny okres jest po prostu aktualną wygładzoną wartością: równoważnie możemy wyrazić następną prognozę bezpośrednio w odniesieniu do poprzednich prognoz i wcześniejszych obserwacji w dowolnej z następujących równoważnych wersji. W pierwszej wersji prognoza jest interpolacją między poprzednią prognozą a poprzednią obserwacją: w drugiej wersji następna prognoza uzyskuje się przez dostosowanie poprzedniej prognozy w kierunku poprzedniego błędu w ułamkowej wartości 945. jest błędem dokonanym w czas t. W trzecim projekcie prognoza jest średnią ruchoma ważoną wykładnicą (tzn. Zdyskontowaną) z współczynnikiem dyskontowania 1 - 945: wersja interpolacyjna formuły prognozowania jest najprostszym sposobem użycia, jeśli model jest wdrażany w arkuszu kalkulacyjnym: jest on dopasowany do pojedynczą komórkę i zawiera odwołania do komórek wskazujące na poprzednią prognozę, poprzednią obserwację oraz komórkę, w której zapisana jest wartość 945. Zauważ, że jeśli 945 1, model SES jest równoważny modelowi losowego spaceru (bez wzrostu). Jeśli 945 0, model SES jest odpowiednikiem średniego modelu, zakładając, że pierwsza wygładzona wartość jest równa średniej. (Powrót na górę strony.) Przeciętny wiek danych w prognozie wygładzania według wykładników prostych i wykładniczych wynosi 1 945 w stosunku do okresu, w którym obliczana jest prognoza. (Nie powinno to być oczywiste, ale można to łatwo wykazać przez ocenę nieskończonej serii). W związku z tym, prosta średnia ruchoma przebiega za punktami zwrotnymi przez około 1 945 okresów. Na przykład, gdy 945 0,5 opóźnienie to 2 okresy, gdy 945 0,2 opóźnienie wynosi 5 okresów, gdy 945 0,1 opóźnienia wynosi 10 okresów itd. Dla pewnego przeciętnego wieku (czyli ilości opóźnień), prosta prognoza wygładzania wykładniczego (SES) jest nieco lepsza od prognozy SMA (Simple moving average), ponieważ w ostatnim obserwowaniu obserwuje się relatywnie większą wagę. jest nieco bardziej odpowiadający na zmiany zachodzące w niedawnej przeszłości. Na przykład model SMA z 9 terminami i model SES z 945 0.2 mają średni wiek 5 lat dla danych w ich prognozach, ale model SES daje większą wagę w stosunku do ostatnich 3 wartości niż model SMA i na poziomie w tym samym czasie nie robi nic 8220forget8221 o wartościach powyżej 9 okresów, jak pokazano na poniższym wykresie: Inną ważną zaletą modelu SES w modelu SMA jest to, że model SES wykorzystuje parametr wygładzania, który jest ciągle zmienny, dzięki czemu można z łatwością zoptymalizować za pomocą algorytmu quotsolverquot w celu zminimalizowania średniego kwadratu. Optymalna wartość 945 w modelu SES dla tej serii okazała się wynosić 0.2961, jak pokazano poniżej: średni wiek danych w tej prognozie to 10.2961 3.4 okresy, które są podobne do średniej 6-letniej prostej średniej ruchomej. Długoterminowe prognozy z modelu SES są poziomej prostej. jak w modelu SMA i modelu przypadkowego spacerowania bez wzrostu. Należy jednak pamiętać, że przedziały ufności obliczane przez Statgraphics różnią się w rozsądny sposób i że są one znacznie węższe niż przedziały ufności dla modelu losowego spaceru. Model SES zakłada, że ​​seria jest nieco bardziej przewidywalna niż model losowego chodu. Model SES jest faktycznie szczególnym przypadkiem modelu ARIMA. tak więc statystyczna teoria modeli ARIMA stanowi solidną podstawę do obliczania przedziałów ufności dla modelu SES. W szczególności model SES jest modelem ARIMA z odmienną różnicą, terminem MA (1), a nie określonym terminem. inaczej znany jako model quotARIMA (0,1,1) bez stałej ilości. Współczynnik MA (1) w modelu ARIMA odpowiada ilościowi 1- 945 w modelu SES. Na przykład, jeśli dopasujesz model ARIMA (0,1,1) bez stałej do analizowanej serii, szacowany współczynnik MA (1) okazuje się wynosić 0.7029, czyli prawie dokładnie minus minus 0.2961. Możliwe jest dodanie założenia niezerowej stałej tendencji liniowej do modelu SES. W tym celu wystarczy podać model ARIMA z jedną różniczkową różnicą i terminem MA (1) ze stałą, tj. Model ARIMA (0,1,1) ze stałą. Prognozy długoterminowe będą wtedy miały tendencję, która jest równa średniej tendencji obserwowanej w całym okresie szacunkowym. Nie można tego zrobić w połączeniu z dostosowaniem sezonowym, ponieważ opcje dostosowania sezonowego są wyłączone, gdy typ modelu jest ustawiony na ARIMA. Można jednak dodać stałą długoterminową tendencję wykładniczą do prostego modelu wygładzania wykładniczego (z korektą sezonową lub bez), korzystając z opcji regulacji inflacji w procedurze prognozowania. Odpowiednia szybkość wzrostu kwotowania (stopa wzrostu procentowego) w danym okresie może być oszacowana jako współczynnik nachylenia w modelu liniowego tendencji dopasowany do danych w połączeniu z naturalną transformacją logarytmiczną lub może opierać się na innych, niezależnych informacjach dotyczących długoterminowych perspektyw wzrostu . (Powrót na początek strony). Browns Linear (tj. Podwójne) Wyrównywanie wykładnicze Modele SMA i modele SES zakładają, że w danych nie ma żadnego trendu (co zwykle jest OK lub przynajmniej nie jest zbyt złe dla 1- prognozy stopniowe, gdy dane są stosunkowo hałaśliwe) i można je zmodyfikować, aby uwzględnić stały trend liniowy, jak pokazano powyżej. Co z trendami krótkoterminowymi Jeśli seria wykazuje zróżnicowaną stopę wzrostu lub cykliczny wzór wyraźnie wyróżniający się w stosunku do hałasu, a jeśli istnieje potrzeba prognozowania więcej niż jednego okresu, szacunek lokalnej tendencji może być również problem. Prosty model wygładzania wykładniczego można uogólnić w celu uzyskania liniowego modelu wygładzania wykładniczego (LES), który oblicza lokalne szacunki zarówno poziomu, jak i tendencji. Najprostszym modelem trendów jest Browns liniowy model wygładzania wykładniczego, który wykorzystuje dwie różne wygładzone serie, które są wyśrodkowane w różnych punktach w czasie. Formuła prognozy opiera się na ekstrapolacji linii przez dwa centra. (Poniżej omówiono bardziej wyrafinowaną wersję tego modelu, Holt8217). Algorytm liniowy linearyzacji Brown8217s, podobny do prostokątnego modelu wygładzania, może być wyrażony w wielu różnych, ale równoważnych formach. Niewątpliwą formą tego modelu jest zwykle wyrażona w następujący sposób: Niech S oznacza pojedynczo wygładzoną serię otrzymaną przez zastosowanie prostego wygładzania wykładniczego do serii Y. Oznacza to, że wartość S w okresie t jest wyrażona przez: (Przypomnijmy, że według prostego wyrównywanie wykładnicze, to byłaby prognoza dla Y w okresie t1). Pozwólmy Squot oznaczać podwójnie wygładzoną serię otrzymaną przez zastosowanie prostego wygładzania wykładniczego (przy użyciu tego samego 945) do serii S: Wreszcie prognoza dla Y tk. dla każdego kgt1, podaje: Otrzymuje e 1 0 (to znaczy trochę oszukiwać, a pierwsza prognoza jest równa faktycznej pierwszej obserwacji) i e 2 Y 2 8211 Y 1. po których generowane są prognozy przy użyciu powyższego wzoru. Daje to takie same wartości, jak wzór na podstawie S i S, jeśli te ostatnie zostały uruchomione przy użyciu S 1 S 1 Y 1. Ta wersja modelu jest używana na następnej stronie, która ilustruje kombinację wygładzania wykładniczego z dostosowaniem sezonowym. Model LES firmy Holt8217s oblicza lokalny szacunek poziomu i trendu, wygładając ostatnie dane, ale fakt, że wykonuje to za pomocą pojedynczego parametru wygładzania, ogranicza wzorce danych, które można dopasować: poziom i trend nie mogą zmieniać się w niezależnych stawkach. Model LES firmy Holt8217s rozwiązuje ten problem przez uwzględnienie dwóch stałych wygładzania, po jednym dla poziomu i jednego dla tego trendu. W dowolnym momencie t, podobnie jak w modelu Brown8217s, szacuje się, że na poziomie lokalnym jest szacunkowa t t lokalnego trendu. Tutaj są obliczane rekurencyjnie z wartości Y obserwowanej w czasie t oraz poprzednich szacunków poziomu i tendencji przez dwa równania, które nakładają na siebie wyrównywanie wykładnicze. Jeśli szacowany poziom i tendencja w czasie t-1 to L t82091 i T t-1. odpowiednio, wówczas prognoza dla Y tshy, która została dokonana w czasie t-1, jest równa L t-1 T t-1. Gdy rzeczywista wartość jest zaobserwowana, zaktualizowany szacunek poziomu jest obliczany rekurencyjnie przez interpolowanie pomiędzy Y tshy a jego prognozą, L t-1 T t-1, przy użyciu odważników 945 i 1 945. Zmiana szacowanego poziomu, mianowicie L t 8209 L t82091. można interpretować jako hałasujący pomiar tendencji w czasie t. Zaktualizowane oszacowanie trendu jest następnie obliczane rekurencyjnie przez interpolowanie pomiędzy L t 8209 L t82091 a poprzednim oszacowaniem tendencji T t-1. przy użyciu odważników 946 i 1-946: Interpretacja stałej 946 wyrównania tendencji jest analogiczna do stałej stymulacji 945. Modele o małych wartościach 946 zakładają, że tendencja zmienia się bardzo powoli w czasie, podczas gdy modele z większy rozmiar 946 zakłada, że ​​zmienia się szybciej. Model z dużą liczbą 946 uważa, że ​​dalsza przyszłość jest bardzo niepewna, ponieważ błędy w oszacowaniu tendencji stają się bardzo ważne, gdy prognozuje się więcej niż jeden rok. (Powrót na początek strony). Stałe wygładzania 945 i 946 można oszacować w zwykły sposób minimalizując średnie kwadratowe błędy prognoz na jeden etap. Gdy to nastąpi w Statgraphics, szacunki wyniosły 945 0,3048 i 946 0,008. Bardzo mała wartość 946 oznacza, że ​​model zakłada bardzo niewielką zmianę tendencji z jednego okresu do następnego, więc w zasadzie ten model próbuje oszacować długoterminowy trend. Przez analogię do pojęcia średniego wieku danych używanych do oszacowania lokalnego poziomu szeregu, średni wiek danych wykorzystywanych do oszacowania tendencji lokalnej jest proporcjonalny do 1 946, chociaż nie jest dokładnie taki sam . W tym przypadku okazuje się, że jest to 10.006 125. Jest to bardzo dokładna liczba, ponieważ dokładność szacowania 946 isn8217t rzeczywiście wynosi 3 miejsca po przecinku, ale ma ten sam ogólny porządek wielkości co rozmiar próbki 100, więc ten model uśrednia wiele historii w szacowaniu tendencji. Poniższa wykres prognozuje, że model LES szacuje nieco większą tendencję lokalną na końcu serii niż stała tendencja szacowana w modelu SEStrend. Ponadto szacowana wartość 945 jest niemal identyczna z uzyskaną przez dopasowanie modelu SES do trendu lub bez, więc jest to prawie ten sam model. Teraz wyglądają jak rozsądne prognozy modelu, które ma oszacować trend lokalny Jeśli wygląda to na wykresie, wygląda na to, że lokalny trend spadł na koniec serii Co się stało Parametry tego modelu zostały oszacowane przez zminimalizowanie kwadratu błędów prognoz na jeden etap, a nie prognoz długoterminowych, w których to przypadku tendencja ta ma wiele różnic. Jeśli wszystko, na co patrzysz, to błędy z jednopodstawowym wyprzedzeniem, nie widzisz większego obrazu trendów w ciągu 10 lub 20 okresów (powiedzmy). Aby uzyskać ten model bardziej zgodny z naszą ekstrapolacją danych oczu, możemy ręcznie dostosować stałą wygładzania trendu, tak aby używała krótszej linii odniesienia dla szacowania tendencji. Na przykład, jeśli zdecydujemy się ustawić 946 0,1, średni wiek danych wykorzystywanych do oszacowania tendencji miejscowej wynosi 10 okresów, co oznacza, że ​​uśrednimy tendencję w ciągu ostatnich 20 okresów. Here8217s jak wygląda prognoza wykresu, jeśli ustawimy 946 0.1 przy zachowaniu 945 0.3. To wydaje się intuicyjnie rozsądne w tej serii, chociaż najprawdopodobniej jest to niebezpieczne, aby wyliczyć tę tendencję w przyszłości o więcej niż 10 okresów. Co ze statystykami o błędach Oto porównanie modelu dwóch modeli przedstawionych powyżej oraz trzech modeli SES. Optymalna wartość 945 dla modelu SES wynosi około 0,3, ale uzyskuje się podobne wyniki (z nieco większą lub mniejszą reakcją) przy 0,5 i 0,2. (A) Holts liniowy exp. wygładzanie z alfa 0,3048 i beta 0,008 (B) liniowe liniowe exp. wygładzanie za pomocą alfa 0.3 i beta 0.1 (C) proste wyrównywanie wykładnicze z alfa 0.5 (D) proste wyrównywanie wykładnicze z alfa 0.3 (E) proste wyrównywanie wykładnicze z alfa 0.2 ich statystyka jest prawie identyczna, więc naprawdę możemy8217t dokonać wyboru na podstawie Błędy prognozy dotyczące etapu wyprzedzania w ramach próbki danych. Musimy pogodzić się z innymi względami. Jeśli uważamy, że sensowne jest oparcie bieżącej tendencji szacunkowej na to, co wydarzyło się w ciągu ostatnich 20 okresów, możemy zrobić przypadek modelu LES z 945 0,3 i 946 0,1. Jeśli chcemy być agnostyczni, czy istnieje tendencja lokalna, jeden z modeli SES może być łatwiejszy do wyjaśnienia, a także dałby więcej prognoz średniej wielkości na najbliższe 5 lub 10 okresów. (Powrót na początek strony.) Który typ tendencji - ekstrapolacja jest najlepsza: pozioma lub liniowa Dane empiryczne sugerują, że jeśli dane zostały już skorygowane (jeśli to konieczne) dla inflacji, może okazać się nieroztropne, aby ekstrapolować krótkoterminową liniową trendy bardzo daleko w przyszłość. Trendy widoczne dziś mogą się spowolnić w przyszłości ze względu na różne przyczyny, takie jak nieaktualność produktu, zwiększona konkurencja i cykliczne spowolnienie gospodarcze lub wzrost w przemyśle. Z tego powodu prosty wygładzanie wykładnicze często wykonuje lepszą próbę poza próbą niż oczekiwano inaczej, pomimo ekstrapolacji tendencji poziomej. Często w praktyce często stosuje się modyfikacje trendu tłumiącego liniowego modelu wygładzania wykładniczego, aby w praktyce wprowadzić do konserwacji swój zapis konserwatyzmu. Model "LES" z tendencjami tłumionymi może być realizowany jako szczególny przypadek modelu ARIMA, w szczególności modelu ARIMA (1,1,2). Możliwe jest obliczanie przedziałów ufności wokół prognoz długoterminowych wytworzonych przez wykładnicze modele wygładzania, biorąc pod uwagę je jako szczególne przypadki modeli ARIMA. (Uwaga: nie wszystkie programy obliczają prawidłowe przedziały ufności dla tych modeli.) Szerokość przedziałów ufności zależy od (i) błędu RMS modelu, (ii) rodzaju wygładzania (prostego lub liniowego) (iii) wartości (-ów) wygładzania (a) i (iv) liczbę prognozowanych okresów. Ogólnie rzecz biorąc, odstępy czasowe rozciągają się szybciej, gdy 945 staje się większe w modelu SES i rozciągają się znacznie szybciej, gdy stosuje się linearne, a nie proste wygładzanie. Ten temat jest omówiony w dalszej części sekcji ARIMA w uwagach. (Wstecz na początek strony). W praktyce średnia ruchoma dostarczy dobrej oceny średniej serii czasowej, jeśli średnia jest stała lub powoli zmienia się. W przypadku średniej stałej, największa wartość m daje najlepsze oszacowania średniej podstawowej. Dłuższy okres obserwacji będzie wynosił średnie efekty zmienności. Celem zapewnienia mniejszej m jest umożliwienie prognozowania reakcji na zmianę procesu leżącego u ich podstaw. W celu zilustrowania proponujemy zestaw danych zawierający zmiany w podstawowej średniej serii czasowej. Na rysunku przedstawiono serie czasów używane do ilustracji wraz ze średnim zapotrzebowaniem, z którego generowane były serie. Średnia rozpoczyna się jako stała wartość 10. Rozpoczynanie w czasie 21 wzrasta o jedną jednostkę w każdym okresie, aż osiągnie wartość 20 w czasie 30. Następnie staje się stała ponownie. Dane są symulowane przez dodanie do średniej, losowego szumu z rozkładu normalnego ze średnią zerową i odchyleniem standardowym 3. Wyniki symulacji są zaokrąglane do najbliższej liczby całkowitej. W tabeli przedstawiono symulowane obserwacje stosowane w przykładzie. Kiedy korzystamy z tabeli, musimy pamiętać, że w danym momencie znane są tylko poprzednie dane. Szacunki modelu parametru, dla trzech różnych wartości m są pokazane razem ze średnią serii czasowej na poniższym rysunku. Na rysunku przedstawiono ruchomą średnią szacunkową wartość średnią za każdym razem, a nie prognozę. Prognozy zmieniłyby średnie ruchome krzywe w prawo w okresach. Jeden z wniosków jest natychmiast widoczny na rysunku. We wszystkich trzech szacunkach średnia ruchoma pozostaje w tyle za tendencją liniową, przy czym opóźnienie wzrasta o m. Opóźnienie to odległość pomiędzy modelem a szacunkiem w wymiarze czasu. Ze względu na opóźnienie, średnia ruchoma nie docenia uwag, gdy średnia rośnie. Oszacowanie estymatora jest różnicą w określonym czasie w średniej wartości modelu i średniej wartości przewidywanej przez średnią ruchoma. Oszacowanie, gdy średnia rośnie, jest negatywne. Dla malejącej średniej, nastawienie jest dodatnie. Opóźnienie w czasie i nastawienie wprowadzone w oszacowaniu to funkcje m. Im większa wartość m. im większa jest wielkość opóźnienia i stronniczości. Dla ciągle rosnącej serii z tendencją a. wartości opóźnień i stronniczości estymatora średniej podano w poniższych równaniach. Przykładowe krzywe nie pasują do tych równań, ponieważ przykładowy model nie wzrasta w sposób ciągły, raczej rozpoczyna się jako stała, zmienia tendencję, a następnie staje się stały ponownie. Również przykładowe krzywe mają wpływ na hałas. Ruchome przeciętne prognozy okresów w przyszłość są przedstawione przez przesunięcie krzywych w prawo. Opóźnienie i nastawienie wzrastają proporcjonalnie. Poniższe równania wskazują na opóźnienie i nastawienie prognozowanych okresów w przyszłość w porównaniu do parametrów modelu. Ponownie, te wzory są dla serii czasowych o stałym liniowym trendzie. Nie powinniśmy być zaskoczeni tym rezultatem. Ruchome średnie estymator opiera się na założeniu stałej średniej, a przykład ma tendencję liniową w średniej podczas części okresu badania. Ponieważ serie czasu rzeczywistego rzadko będą zgodne z założeniami dowolnego modelu, powinniśmy być przygotowani na takie rezultaty. Z rysunku wynika, że ​​zmienność hałasu ma największy wpływ na mniejsze m. Oszacowanie jest znacznie bardziej niestabilne dla średniej ruchomej 5 niż średnia ruchoma równa 20. Mamy sprzeczne pragnienia, aby zwiększyć m, aby zmniejszyć wpływ zmienności spowodowany hałasem i zmniejszyć m, aby przewidzieć większą reakcję na zmiany w średniej. Błąd jest różnicą między rzeczywistymi danymi a przewidywaną wartością. Jeśli seria czasów jest rzeczywiście stałą wartością, oczekiwana wartość błędu wynosi zero, a wariancja błędu składa się z terminu, który jest funkcją, a drugi warunek, który jest wariancją szumu,. Pierwsza z nich to wariancja średniej oszacowanej próbką m obserwacji, zakładając, że dane pochodzą z populacji o stałej średniej. Ten termin jest zminimalizowany przez uczynienie m jak największym. Duża m powoduje, że prognoza nie reaguje na zmianę podstawowej serii czasowej. Aby prognoza odpowiadała na zmiany, chcemy m tak małą (1), ale zwiększa to wariancję błędu. Praktyczne prognozy wymagają wartości pośredniej. Prognozowanie w programie Excel Dodatek Prognozowania implementuje średnie ruchome wzory. Poniższy przykład przedstawia analizę dostarczoną przez dodatek dla danych przykładowych w kolumnie B. Pierwsze 10 obserwacji indeksuje się od -9 do 0. W porównaniu z powyższą tabelą, indeksy okresu są przesuwane o -10. Pierwsze dziesięć obserwacji dostarcza wartości początkowe dla oszacowania i służy do obliczania średniej ruchomej dla okresu 0. Kolumna MA (10) (C) pokazuje obliczone średnie ruchome. Parametr średniej ruchomej m znajduje się w komórce C3. Kolumna Fore (1) (D) pokazuje prognozę dla jednego okresu w przyszłości. Interwał prognozy znajduje się w komórce D3. Gdy przedział prognozy zostanie zmieniony na większą liczbę, liczby w kolumnie Fore zostaną przesunięte w dół. Err (1) (E) pokazuje różnicę między obserwacją a prognozą. Na przykład, obserwacja w czasie 1 wynosi 6. Prognozowana wartość wykonana z średniej ruchomej w czasie 0 wynosi 11.1. Błąd to -5.1. Odchylenie standardowe i średnie odchylenie średnie (MAD) są obliczane odpowiednio w komórkach E6 i E7.

No comments:

Post a Comment