Module 9 Seasonal ARIMA (SARIMA) Models Class notes for Statistics 451: Applied Time Series Iowa State University Copyright 2015 W. Q. Meeker. March 6, 2016 21h 15min 9-1 Module 9 Segment 1 Seasonal Time Series Examples and the SARIMA Model 9-2 Seasonal Time Series • “Periodic” is a better term; “seasonal” commonly used • Seasonal (periodic) model with S observations per period ◮ Monthly data has 12 observations per year ◮ Quarterly data has 4 observations per year ◮ Daily data has 5 or 7 (or some other number) of observations per week. • Notes: ◮ Sunspot data is cyclical, not seasonal, because distance between peaks is random. ◮ Just because we have 12 observations per year, does not mean that there is seasonal behavior (e.g., stock prices show no regular seasonal patterns) 9-3 Energy Consumption Data 2500 2000 Quadrillion Btu 3000 Residential and Commercial Energy Consumption 1982-1993 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 Year 9-4 Machine Tool Shipments 12000 10000 8000 6000 4000 Thousands of Dollars 14000 16000 Machine-Tool Shipments 1968-1975 1968 1969 1970 1971 1972 1973 1974 1975 Year 9-5 US Gas and Oil Consumption 60 40 20 Billions of Dollars 80 US Consumption of Gas and Oil 1967-1982 1967 1969 1971 1973 1975 1977 1979 1981 1983 Year 9-6 Des Moines Precipitation 0 2 4 Inches 6 8 10 Des Moines Precipitation 1970 1975 1980 1985 Time 9-7 Seasonal Differencing • Seasonal differencing is usually needed. For example, Wt = (1 − B12)Zt = Zt − B12Zt = Zt − Zt−12 Zt = Zt−12 + Wt or Wt = (1 − B)(1 − B12)Zt = Zt − Zt−1 − Zt−12 + Zt−13 Zt = Zt−1 + Zt−12 − Zt−13 + Wt • More generally, the “working series” is Wt = (1 − B)d(1 − BS )D Zt implemented, for example by iden(airline.tsd,gamma=0,d=1,D=1) Even more generally (not supported by RTSERIES) Wt = (1 − B)d(1 − BS1 )D1 (1 − BS2 )D2 Zt and so on. 9-8 Seasonal ARIMA Model (SARIMA) The SARIMA(p, d, q) × (P, D, Q)S model is ΦP (BS )φp(B)(1 − B)d(1 − BS )D Zt = ΘQ(BS )θq (B)at ΦP (BS )φp(B)Wt = ΘQ(BS )θq (B)at For example using P = 1, p = 1, Q = 2, q = 1, S = 12 gives Φ1(B12) = (1 − Φ1B12) φ1(B) = (1 − φ1B) Θ2(B12) = (1 − Θ1B12 − Θ2B24) θ1(B) = (1 − θ1B) The modeling problem is to choose a transformation (γ and m), differencing (d and D), and the SARIMA model (p, q, P, Q) for the working series Wt. As before, use tsplot, range-mean plot, ACF and PACF. By multiplying out the differencing terms, the SARIMA model can be expressed in the ARMA form: φ∗p∗ (B)Zt = θq∗∗ (B)at . 9-9 Module 9 Segment 2 Introduction to Seasonal Time Series Modeling Revisiting the Airline Data 9 - 10 Data Analysis Strategy Tentative Identification No Time Series Plot Range-Mean Plot ACF and PACF Estimation Least Squares or Maximum Likelihood Diagnostic Checking Residual Analysis and Forecasts Model ok? Yes Use the Model Forecasting Explanation Control 9 - 11 Strategy for Seasonal Time Series Modeling • Plot data • Use a range-mean plot to see if a transformation might be needed; choose tentative γ value (and perhaps m > 0). • Choose differencing scheme(s). ◮ Look at 3 × S + 3 lags on the ACF and PACF of Wt for all combinations of d = 0, 1 and D = 0, 1. ◮ Go higher with d or D as needed. ◮ Choose the stationary Wt with the smallest d and D. Avoid over-differencing • Tentatively identify a model(s) from the ACF and PACF of the chosen differencing scheme(s) [i.e., choose (p, d, q)(P, D, Q)]. • Fit, check, and compare models. • Iterate as necessary • At the end, choose alternative value of γ, if needed 9 - 12 Airline Data iden Output Log Transformation No Differencing esti(airline.tsd, gamma=0) International Airline Passengers w 5.0 5.5 6.0 6.5 w= log(Thousands of Passengers) 1949 1950 1951 1952 1953 1954 1955 1956 1957 1958 1959 1960 1961 time ACF 0.0 -1.0 0.45 ACF 0.5 1.0 Range-Mean Plot 10 20 30 0.40 Lag 0.5 -1.0 0.0 Partial ACF 1.0 PACF 0.35 Range 0 4.8 5.0 5.2 5.4 5.6 Mean 5.8 6.0 6.2 0 10 20 30 Lag 9 - 13 Airline Data iden Output Log Transformation One Regular Difference esti(airline.tsd, gamma=0, d=1) 0.0 -0.2 w 0.2 International Airline Passengers w= (1-B)^ 1 log( Thousands of Passengers ) 1949 1950 1951 1952 1953 1954 1955 1956 1957 1958 1959 1960 1961 time -1.0 0.0 Partial ACF 0.0 -1.0 ACF 1.0 PACF 1.0 ACF 0 10 20 Lag 30 0 10 20 30 Lag 9 - 14 Airline Data iden Output Log Transformation One Seasonal Difference esti(airline.tsd, gamma=0, D=1) 0.0 w 0.2 International Airline Passengers w= (1-B^ 12 )^ 1 log( Thousands of Passengers ) 1950 1951 1952 1953 1954 1955 1956 1957 1958 1959 1960 1961 time -1.0 0.0 Partial ACF 0.0 -1.0 ACF 1.0 PACF 1.0 ACF 0 10 20 Lag 30 0 10 20 30 Lag 9 - 15 Airline Data iden Output Log Transformation Regular and Seasonal Difference esti(airline.tsd, gamma=0, d=1, D=1) 0.0 -0.15 w 0.10 International Airline Passengers w= (1-B)^ 1 (1-B^ 12 )^ 1 log( Thousands of Passengers ) 1950 1951 1952 1953 1954 1955 1956 1957 1958 1959 1960 1961 time -1.0 0.0 Partial ACF 0.0 -1.0 ACF 1.0 PACF 1.0 ACF 0 10 20 Lag 30 0 10 20 30 Lag 9 - 16 Module 9 Segment 3 True ACF and PACF for Seasonal Time Series SARIMA Models 9 - 17 Methods of Obtaining the True ACF and PACF for Seasonal Models • Derivations similar to nonseasonal models. scrambled form of the model for Wt. Use the un- • Formula sheets from Box and Jenkins give the ACF. Note the use of special cases (e.g., setting θ = 0 in model 1 gives the ACF of a particularly simple seasonal model Wt = −Θ1at−S + at) • PACF computed using the same Yule-Walker based “Durbin formula” as in the nonseasonal models • plot.true.acfpacf() RTSERIES function. For example plot.true.acfpacf(model=list(ma=c(0.5,0,0,0,0, 0,0,0,0,0,0,0.9,-0.45)),nacf=38) or plot.true.acfpacf(model=list(ma=c(0.5,rep(0,10),0.9,-0.45)),nacf=38) 9 - 18 Example: Wt = (1 − Θ1B12)at = −Θ1at−12 + at This is a special case of Model 1 from the Box and Jenkins formula sheet with θ1 = 0. Everything is easy to derive. 2 γ0 = E(Wt2) = (1 + Θ2 1)σa γ1 = γ2 = · · · = γ11 = 0 γ12 = E(WtWt+12) = E[(−Θ1at−12 + at)(−Θ1at + at+12)] 2 = 0 + · · · + 0 + E(−Θ1a2 t ) = −Θ1σa γ13 = γ14 = · · · = 0 ρj = γj /γ0 ρ1 = ρ2 = · · · = ρ11 = 0 ρ12 = γ12/γ0 = −Θ1/(1 + Θ2 1) ρj = 0, j > 12. 9 - 19 True ACF/PACF for Wt = −Θ1at−12 + at , Θ1 = 0.9 plot.true.acfpacf(model=list(ma=c(rep(0, 11), +0.9)), nacf=38) True ACF 0.0 -1.0 True ACF 1.0 ma: 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0.9 0 10 20 30 Lag True PACF 0.0 -1.0 True PACF 1.0 ma: 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0.9 0 10 20 30 Lag 9 - 20 True ACF/PACF for Wt = −Θ1at−12 + at, Θ1 = −0.9 plot.true.acfpacf(model=list(ma=c(rep(0, 11), -0.9)), nacf=38) True ACF 0.0 -1.0 True ACF 1.0 ma: 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, -0.9 0 10 20 30 Lag True PACF 0.0 -1.0 True PACF 1.0 ma: 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, -0.9 0 10 20 30 Lag 9 - 21 Example: (1 − Φ1B12)Wt = at, Wt = Φ1Wt−12 + at This is a special case of Model 2 from the Box and Jenkins formula sheet with θ1 = Θ1 = 0. γ0 = E(Wt2) = σa2 , 2 1 − Φ1 −1 < Φ1 < 1 γ12 = E(WtWt+12) = Φ1γ0 γ1 = γ2 = · · · = γ11 = 0 γj = Φ1γj−12, j > 12. ρj = γj /γ0 ρ1 = ρ2 = · · · = ρ11 = 0 ρ12 = γ12/γ0 = Φ1 ρj = Φ1ρj−12, j > 12. 9 - 22 True ACF and PACF for Wt = +Φ1Wt−12 + at with Φ1 = 0.9 plot.true.acfpacf(model=list(ar=c(rep(0, 11), +0.9)), nacf=38) True ACF 0.0 -1.0 True ACF 1.0 ar: 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0.9 0 10 20 30 Lag True PACF 0.0 -1.0 True PACF 1.0 ar: 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0.9 0 10 20 30 Lag 9 - 23 True ACF and PACF for Wt = +Φ1Wt−12 + at with Φ1 = −0.9 plot.true.acfpacf(model=list(ar=c(rep(0, 11), -0.9)), nacf=38) True ACF 0.0 -1.0 True ACF 1.0 ar: 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, -0.9 0 10 20 30 Lag True PACF 0.0 -1.0 True PACF 1.0 ar: 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, -0.9 0 10 20 30 Lag 9 - 24 Module 9 Segment 4 True ACF and PACF for the Airline Model 9 - 25 Example: Wt = (1 − θ1B)(1 − Θ1B12)at This is Model 1 from the Box and Jenkins formula sheet. Wt = (1 − θ1B)(1 − Θ1B12)at = (1 − θ1B − Θ1B12 + θ1Θ1B13)at = −θ1at−1 − Θ1at−12 + θ1Θ1at−13 + at This is like an MA(13) and, again, everything is easy to derive. For example, γ11 = E(WtWt−11) = 0 + 0 + · · · + E[(−Θ1at−12)(−θ1at−12)] + 0 + · · · = θ1Θ1σa2 γ0 = γ1 = γ12 = γ13 = 9 - 26 Coefficients for the Multiplicative Model Expressed as an MA(13) Wt = (1 − θ1B)(1 − Θ1B12)at = (1 − θ1B − Θ1B12 + θ1Θ1B13)at = −θ1at−1 − Θ1at−12 + θ1Θ1at−13 + at = −θ1at−1 − θ12at−12 − θ13at−13 + at The coefficients for this model are: θ1 = θ1 = 0.50 θ12 = Θ1 = 0.90 θ13 = −θ1 × Θ1 = −0.45 9 - 27 True ACF/PACF for Wt = (1 − θ1B)(1 − Θ1B12)at, θ1 = 0.5, Θ1 = 0.9 plot.true.acfpacf(model=list(ma=c(0.5,rep(0,10),0.9,-0.45)),nacf=38) True ACF 0.0 -1.0 True ACF 1.0 ma: 0.5, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0.9, -0.45 0 10 20 30 Lag True PACF 0.0 -1.0 True PACF 1.0 ma: 0.5, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0.9, -0.45 0 10 20 30 Lag 9 - 28 True ACF/PACF for Wt = (1 − θ1B)(1 − Θ1B12)at, θ1 = 0.1, Θ1 = 0.9 plot.true.acfpacf(model=list(ma=c(0.1,rep(0,10),0.9,-0.09)),nacf=38) True ACF 0.0 -1.0 True ACF 1.0 ma: 0.1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0.9, -0.09 0 10 20 30 Lag True PACF 0.0 -1.0 True PACF 1.0 ma: 0.1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0.9, -0.09 0 10 20 30 Lag 9 - 29 True ACF/PACF for Wt = (1 − θ1B)(1 − Θ1B12)at, θ1 = −0.5, Θ1 = −0.9 plot.true.acfpacf(model=list(ma=c(-0.5,rep(0,10),-0.9,-0.45)),nacf=38) True ACF 0.0 -1.0 True ACF 1.0 ma: -0.5, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, -0.9, -0.45 0 10 20 30 Lag True PACF 0.0 -1.0 True PACF 1.0 ma: -0.5, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, -0.9, -0.45 0 10 20 30 Lag 9 - 30 True ACF/PACF for (1 − φ1B)(1 − Φ1B12)Wt = at , φ1 = 0.5, Φ1 = 0.9 plot.true.acfpacf(model=list(ar=c(+0.5,rep(0,10),+0.9,-0.45)),nacf=38) True ACF 0.0 -1.0 True ACF 1.0 ar: 0.5, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0.9, -0.45 0 10 20 30 Lag True PACF 0.0 -1.0 True PACF 1.0 ar: 0.5, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0.9, -0.45 0 10 20 30 Lag 9 - 31 True ACF/PACF for (1 − φ1B)(1 − Φ1B12)Wt = at , φ1 = 0.1, Φ1 = 0.9 plot.true.acfpacf(model=list(ar=c(+0.1,rep(0,10),+0.9,-0.09)),nacf=38) True ACF 0.0 -1.0 True ACF 1.0 ar: 0.1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0.9, -0.09 0 10 20 30 Lag True PACF 0.0 -1.0 True PACF 1.0 ar: 0.1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0.9, -0.09 0 10 20 30 Lag 9 - 32 True ACF/PACF for (1 − φ1B)(1 − Φ1B12)Wt = at , φ1 = −0.5, Φ1 = −0.9 plot.true.acfpacf(model=list(ar=c(-0.5,rep(0,10),-0.9,-0.45)),nacf=38) True ACF 0.0 -1.0 True ACF 1.0 ar: -0.5, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, -0.9, -0.45 0 10 20 30 Lag True PACF 0.0 -1.0 True PACF 1.0 ar: -0.5, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, -0.9, -0.45 0 10 20 30 Lag 9 - 33 True ACF/PACF for (1 − Φ1B12)Wt = (1 − Θ1B12)at , Φ1 = −0.9,Θ1 = 0.9 model=list(ar=c(rep(0,11), -0.9), ma=c(rep(0, 11), +0.9)) True ACF 0.0 -1.0 True ACF 1.0 ma: 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0.9 ar: 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, -0.9 0 10 20 30 Lag True PACF 0.0 -1.0 True PACF 1.0 ma: 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0.9 ar: 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, -0.9 0 10 20 30 Lag 9 - 34 True ACF/PACF for (1 − Φ1B12)Wt = (1 − Θ1B12)at , Φ1 = 0.9,Θ1 = −0.9 model=list(ar=c(rep(0,11), +0.9), ma=c(rep(0, 11), -0.9)) True ACF 0.0 -1.0 True ACF 1.0 ma: 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, -0.9 ar: 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0.9 0 10 20 30 Lag True PACF 0.0 -1.0 True PACF 1.0 ma: 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, -0.9 ar: 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0.9 0 10 20 30 Lag 9 - 35 Module 9 Segment 5 Comparison of Models for the Airline Data Using the Log Transformation 9 - 36 Airline Passenger Model Summary Table 9 - 37 Airline Data esti AR(1) Log Transformation (Model 1) Output Part 1 esti(airline.tsd, gamma=0, model=model.pdq(p=1), y.range=c(100, 1100)) International Airline Passengers Model: Component 1 :: ar: 1 on w= log( Thousands of Passengers ) 0.0 -0.2 -0.1 Residuals 0.1 0.2 Residuals vs. Time 1949 1950 1951 1952 1953 1954 1955 1956 1957 1958 1959 1960 1961 Time • • • • • • • • • • • • • • •• • • • • • • • • • • • • •• • • • • • •• • •• • • •• 0.5 • • • • • • • •• • • • • • • • • • • • ••• • • • • • • • -0.1 • • •• • • • • • • • • • • •• • • • •• •• • • • • • • • • • 5.0 • 5.5 Fitted Values 0.0 0.0 • • • • • • • •• • • • • • • • • • • • • ACF •• • • • 6.0 -0.5 0.1 •• • • • • • Residuals 1.0 • • -0.2 Residual ACF • -1.0 0.2 Residuals vs. Fitted Values 0 10 20 30 Lag 9 - 38 Airline Data esti AR(1) Log Transformation (Model 1) Output Part 2 International Airline Passengers Model: Component 1 :: ar: 1 on w= log( Thousands of Passengers ) 800 600 •• •• •• 400 •• • • ••••• • • •••• •• • ••••• •• 1952 • • • • •• • • • • • • • ••• • ••• 1954 •• • • • ••• • ••• • •• • • ••• • • • • •• ••• • • ••• 1956 1958 • ••• • • • • •• • •• • • •••• • 1960 • • • ••••• ••••••• •••••••••• ••• 1962 Index Normal Probability Plot 1 2 • 0 ••• Normal Scores 1950 ••••• •••• •• -1 • ••••• ••••••• •• •• • ••• -2 200 Thousands of Passengers 1000 Actual Values * * * Fitted Values * * * Future Values * * 95 % Prediction Interval * * • • •• •• •• •••• ••• ••• • •••• •• ••• •• • ••• • ••• ••• •• • • • ••• ••••• •••• •••• •• • • • • •• •••• ••••• •••••• • •• • • • • •• •• •• • • -0.2 -0.1 0.0 0.1 0.2 Residuals 9 - 39 The “Airline Model” Differencing d = 1 and D = 1 to give the working series Wt = (1 − B)(1 − B12)Zt = Zt − Zt−1 − Zt−12 + Zt−13 Model for the working series Wt Wt = (1 − θ1B)(1 − Θ1B12)at = −θ1at−1 − Θ1at−12 + θ1Θ1at−13 + at The unscrambled multiplicative “airline model” for Zt is Zt = Zt−1 + Zt−12 − Zt−13 − θ1at−1 − Θ1at−12 + θ1Θ1at−13 + at and has only 2 parameters. The unscrambled additive “airline model” for Zt is Zt = Zt−1 + Zt−12 − Zt−13 − θ1at−1 − θ12at−12 − θ13at−13 + at has three parameters. 9 - 40 Airline Data esti SARIMA(0, 1, 0)(0, 1, 1)12 Log Transformation (Model 3) Output Part 1 esti(airline.tsd, gamma=0, model=model.pdq(d=1, D=1, Q=1), y.range=c(100, 1100)) International Airline Passengers Model: Component 1 :: ndiff= 1 Component 2 :: period= 12 ndiff= 1 ma: 1 on w= log( Thousands of Passengers ) 0.0 -0.10 -0.05 Residuals 0.05 0.10 Residuals vs. Time 1949 1950 1951 1952 1953 1954 1955 1956 1957 1958 1959 1960 1961 Time Residual ACF • 1.0 Residuals vs. Fitted Values 0.10 • • •• • •• 0.0 • • • • ••• • • • 0.5 • • •• • • • • • •• • • • •• • •• • • • • • • • •• • • • • • • • • • ••• • •• • •• • •••• • • • • • • • • • • • •• • • • • •• • • • •• 5.0 • • • • •• • • • • • • • • • • • • 0.0 • -0.05 • • • • • • ACF • • -1.0 0.05 • -0.10 Residuals • • • • • • • -0.5 • • 5.5 Fitted Values 6.0 6.5 0 10 20 30 Lag 9 - 41 Airline Data esti SARIMA(0, 1, 1)(0, 1, 1)12 Log Transformation (Model 4) Output Part 1 esti(airline.tsd, gamma=0, model=model.pdq(d=1, q=1, D=1, Q=1), y.range=c(100, 1100)) International Airline Passengers Model: Component 1 :: ndiff= 1 ma: 1 Component 2 :: period= 12 ndiff= 1 ma: 1 on w= log( Thousands of Passengers ) 0.0 -0.10 -0.05 Residuals 0.05 0.10 Residuals vs. Time 1949 1950 1951 1952 1953 1954 1955 1956 1957 1958 1959 1960 1961 Time •• • • • • • -0.05 • • • • 0.0 • •• • • • • • • • • • • •• • • • • • • • • • •• • • • • • • • • • • • • • • • •• • • • •• • •• • • • •• •• • • •• • • • • • • • • • • • •• • •• • • • • • • •• • • • • • • • • -0.10 • • • •• • • • • • 0.5 • • • • ACF 0.05 • • • • • 0.0 • • -0.5 0.10 • • • -1.0 Residuals Residual ACF 1.0 Residuals vs. Fitted Values • 5.0 5.5 Fitted Values 6.0 6.5 0 10 20 30 Lag 9 - 42 Airline Data esti SARIMA(0, 1, 1)(0, 1, 1)12 Log Transformation (Model 4) Output Part 2 International Airline Passengers Model: Component 1 :: ndiff= 1 ma: 1 Component 2 :: period= 12 ndiff= 1 ma: 1 on w= log( Thousands of Passengers ) 800 •• •• 600 •• •• •• 400 •• •••• 1952 • • • • •• • • • • •• • • ••• • ••• 1954 •• • • • ••• • ••• • •• • • ••• • • • • •• ••• • • ••• 1956 1958 • ••• • • • • • • • •• • • •••• • 1960 • • • ••• •• • • • • ••• •• • • • • • • • 1962 Index Normal Probability Plot 2 • 1 •••• •• 0 ••••• • •••• •• • ••••• Normal Scores 1950 ••• •••• -1 • ••••• ••••••• •• •• • ••• • -2 200 Thousands of Passengers 1000 Actual Values * * * Fitted Values * * * Future Values * * 95 % Prediction Interval * * • • •• • • • • • •• • • •• ••• •• •• • • • • ••• ••• •••• •••• • • •• •••• •• ••• •••• • • • ••• ••• •••• •• • • ••• •••• •• • -0.10 -0.05 0.0 0.05 0.10 Residuals 9 - 43 Airline Data esti AR(1) Log Transformation (Model 1) Output Part 2 International Airline Passengers Model: Component 1 :: ar: 1 on w= log( Thousands of Passengers ) 800 600 •• •• •• 400 •• • • ••••• • • •••• •• • ••••• •• 1952 • • • • •• • • • • • • • ••• • ••• 1954 •• • • • ••• • ••• • •• • • ••• • • • • •• ••• • • ••• 1956 1958 • ••• • • • • •• • •• • • •••• • 1960 • • • ••••• ••••••• •••••••••• ••• 1962 Index Normal Probability Plot 1 2 • 0 ••• Normal Scores 1950 ••••• •••• •• -1 • ••••• ••••••• •• •• • ••• -2 200 Thousands of Passengers 1000 Actual Values * * * Fitted Values * * * Future Values * * 95 % Prediction Interval * * • • •• •• •• •••• ••• ••• • •••• •• ••• •• • ••• • ••• ••• •• • • • ••• ••••• •••• •••• •• • • • • •• •••• ••••• •••••• • •• • • • • •• •• •• • • -0.2 -0.1 0.0 0.1 0.2 Residuals 9 - 44 Airline Data esti Additive Airline Model Log Transformation (Model 5) Output Part 1 esti(airline.tsd, gamma=0, model=add.airline.model, y.range=c(100,1100)) International Airline Passengers Model: Component 1 :: ndiff= 1 ma: 1 12 13 Component 2 :: period= 12 ndiff= 1 on w= log( Thousands of Passengers ) 0.0 -0.10 -0.05 Residuals 0.05 0.10 Residuals vs. Time 1949 1950 1951 1952 1953 1954 1955 1956 1957 1958 1959 1960 1961 Time • • • • • • • • • ••• • • •• • ••• •• • • • • • • • • •• • • • • • •• • • • 0.5 0.05 0.0 • -0.05 • • • • • • •• • • • • • •• • •• •• • ••• • • • • • •• •• •• • • • • • • • •• • • • •• • • • •• • •• • • • • • • ACF • •• • • • • • • • • • • • •• 0.0 • • • -0.5 0.10 • • • • -1.0 -0.10 Residuals Residual ACF 1.0 Residuals vs. Fitted Values • 5.0 5.5 Fitted Values 6.0 6.5 0 10 20 30 Lag 9 - 45 Airline Data esti Additive Airline Model Log Transformation (Model 5) Output Part 2 International Airline Passengers Model: Component 1 :: ndiff= 1 ma: 1 12 13 Component 2 :: period= 12 ndiff= 1 on w= log( Thousands of Passengers ) 800 •• •• 600 •• •• •• 400 •• • • ••••• • • •••• •• • ••••• •• 1952 • • • • •• • • • • • • ••• • ••• 1954 •• • • • ••• • ••• • •• • • ••• • ••• • • • •• ••• • • 1956 1958 • ••• • • • • • • • •• • • •••• • 1960 • • • ••• •• • • • • •• • • •• • • • • • • 1962 Index Normal Probability Plot 1 2 • 0 ••• Normal Scores 1950 ••••• •••• -1 • ••••• ••••••• •• •• • ••• •• • -2 200 Thousands of Passengers 1000 Actual Values * * * Fitted Values * * * Future Values * * 95 % Prediction Interval * * • •• •• • •• •• ••• •• • • • ••• •• •••• ••• • • • • •••• •••• •••• •• • • • • • ••• ••• • •• ••• • • ••• ••• •• • •• • • • • • -0.10 -0.05 0.0 0.05 0.10 Residuals 9 - 46 Airline Data esti SARIMA(0, 1, 1)(0, 1, 1)12 Log Transformation (Model 4) Output Part 2 International Airline Passengers Model: Component 1 :: ndiff= 1 ma: 1 Component 2 :: period= 12 ndiff= 1 ma: 1 on w= log( Thousands of Passengers ) 800 •• •• 600 •• •• •• 400 •• •••• 1952 • • • • •• • • • • •• • • ••• • ••• 1954 •• • • • ••• • ••• • •• • • ••• • • • • •• ••• • • ••• 1956 1958 • ••• • • • • • • • •• • • •••• • 1960 • • • ••• •• • • • • ••• •• • • • • • • • 1962 Index Normal Probability Plot 2 • 1 •••• •• 0 ••••• • •••• •• • ••••• Normal Scores 1950 ••• •••• -1 • ••••• ••••••• •• •• • ••• • -2 200 Thousands of Passengers 1000 Actual Values * * * Fitted Values * * * Future Values * * 95 % Prediction Interval * * • • •• • • • • • •• • • •• ••• •• •• • • • • ••• ••• •••• •••• • • •• •••• •• ••• •••• • • • ••• ••• •••• •• • • ••• •••• •• • -0.10 -0.05 0.0 0.05 0.10 Residuals 9 - 47 Airline Passenger Model Summary Table 9 - 48 Module 9 Segment 6 Comparison of Models for the Airline Data Using Alternative Transformations 9 - 49 Airline Passenger Model Summary Table 9 - 50 Airline Data esti SARIMA(0, 1, 1)(0, 1, 1)12 No Transformation (Model 7) Output Part 1 esti(airline.tsd, gamma=1, model=model.pdq(d=1, q=1, D=1, Q=1), y.range=c(100, 1100)) International Airline Passengers Model: Component 1 :: ndiff= 1 ma: 1 Component 2 :: period= 12 ndiff= 1 ma: 1 on w= Thousands of Passengers 0 -20 Residuals 20 40 Residuals vs. Time 1949 1950 1951 1952 1953 1954 1955 1956 1957 1958 1959 1960 1961 Time • • • • •• • • • • • • • •• • • • • • • ••• • • • • • •• ••• • • • • • • •• • • • • • • • • • • • • • •• •• • • • • • • • •• • • • • • • •• • ••• • • •• • • • •• •• • • • • • • • • • • • • • • • • 200 300 400 Fitted Values 0.0 •• • •• • •• • • ACF • -0.5 • • • • • -1.0 20 •• • 0 Residuals • 0.5 40 • • -20 Residual ACF 1.0 Residuals vs. Fitted Values • 500 600 0 10 20 30 Lag 9 - 51 Airline Data esti SARIMA(0, 1, 1)(0, 1, 1)12 No Transformation (Model 7) Output Part 2 International Airline Passengers Model: Component 1 :: ndiff= 1 ma: 1 Component 2 :: period= 12 ndiff= 1 ma: 1 on w= Thousands of Passengers 800 600 •• •• 400 •• • •••• •• • ••••• •• 1952 • • • • •• • • • • • • ••• • ••• 1954 •• • • • ••• • ••• • • ••• • ••• • • •• ••• • • 1956 1958 ••• • • • • • • • •• • • •••• • 1960 • • •• • • ••• • • • •• • • ••• • • • • • 1962 Index Normal Probability Plot 1 2 • 0 • • ••••• • Normal Scores ••• • -1 1950 ••••• •••• -2 • ••••• ••••••• •• •• • ••• •• • •• • • •• •• •• 200 Thousands of Passengers 1000 Actual Values * * * Fitted Values * * * Future Values * * 95 % Prediction Interval * * • • • • • •• •• • ••• •••• ••• • • •••• ••••• •• ••• •••• ••• ••• ••• ••• • • •• ••• ••• ••• • • • •• ••• •• •• • • -20 0 20 40 Residuals 9 - 52 Airline Data esti SARIMA(0, 1, 1)(0, 1, 1)12 Log Transformation (Model 4) Output Part 2 International Airline Passengers Model: Component 1 :: ndiff= 1 ma: 1 Component 2 :: period= 12 ndiff= 1 ma: 1 on w= log( Thousands of Passengers ) 800 •• •• 600 •• •• •• 400 •• •••• 1952 • • • • •• • • • • •• • • ••• • ••• 1954 •• • • • ••• • ••• • •• • • ••• • • • • •• ••• • • ••• 1956 1958 • ••• • • • • • • • •• • • •••• • 1960 • • • ••• •• • • • • ••• •• • • • • • • • 1962 Index Normal Probability Plot 2 • 1 •••• •• 0 ••••• • •••• •• • ••••• Normal Scores 1950 ••• •••• -1 • ••••• ••••••• •• •• • ••• • -2 200 Thousands of Passengers 1000 Actual Values * * * Fitted Values * * * Future Values * * 95 % Prediction Interval * * • • •• • • • • • •• • • •• ••• •• •• • • • • ••• ••• •••• •••• • • •• •••• •• ••• •••• • • • ••• ••• •••• •• • • ••• •••• •• • -0.10 -0.05 0.0 0.05 0.10 Residuals 9 - 53 Airline Data esti SARIMA(0, 1, 1)(0, 1, 1)12 γ = −0.333 Transformation (Model 6) Output Part 1 esti(airline.tsd, gamma=-0.333, model=model.pdq(d=1, q=1, D=1, Q=1), y.range=c(100, 1100)) International Airline Passengers Model: Component 1 :: ndiff= 1 ma: 1 12 13 Component 2 :: period= 12 ndiff= 1 on w= -( Thousands of Passengers ) ^ -0.3333 0.002 -0.002 -0.006 Residuals 0.006 Residuals vs. Time 1949 1950 1951 1952 1953 1954 1955 1956 1957 1958 1959 1960 1961 Time Residual ACF 1.0 Residuals vs. Fitted Values 0.006 • • • • • • • • • • -0.002 • • • • • •• •• • •• • • • •• •• • • • • • •• • • • • • •• • ••• • •• •• • •• •• • • • •• •• • • •• • •• • • • • • • 0.5 • • • ••• • • •• • • • • • •• • • • • • • • • • • • • -0.18 • • • • • • -0.20 • -1.0 • • • • • • ACF 0.002 • • -0.006 Residuals • • • 0.0 • • • -0.5 • • -0.16 Fitted Values -0.14 -0.12 0 10 20 30 Lag 9 - 54 Airline Data esti SARIMA(0, 1, 1)(0, 1, 1)12 γ = −0.333 Transformation (Model 6) Output Part 2 International Airline Passengers Model: Component 1 :: ndiff= 1 ma: 1 12 13 Component 2 :: period= 12 ndiff= 1 on w= -( Thousands of Passengers ) ^ -0.3333 800 •• •• 600 •• •• •• 400 •• • • ••••• • • •••• •• • ••••• •• 1952 • • • • •• • • • • • • ••• • •• • • ••• 1954 • ••• • • •• • ••• • ••• • ••• • • • •• ••• • • 1956 1958 • ••• • • • • • • • •• • • •••• • 1960 • • • • • • •• • • • •• • • • • • • • • • • • 1962 Index Normal Probability Plot 1 2 • 0 ••• Normal Scores 1950 ••••• •••• -1 • ••••• ••••••• •• •• • ••• •• • -2 200 Thousands of Passengers 1000 Actual Values * * * Fitted Values * * * Future Values * * 95 % Prediction Interval * * • • •• • • • • •• •• • • ••• •• ••• ••• • • •• ••• ••• ••• ••••• • ••• •• •••• •••• • •• ••• •••• •• • • • ••• •• • • -0.006 -0.002 0.002 0.006 Residuals 9 - 55 Airline Data esti SARIMA(0, 1, 1)(0, 1, 1)12 Log Transformation (Model 4) Output Part 2 International Airline Passengers Model: Component 1 :: ndiff= 1 ma: 1 Component 2 :: period= 12 ndiff= 1 ma: 1 on w= log( Thousands of Passengers ) 800 •• •• 600 •• •• •• 400 •• •••• 1952 • • • • •• • • • • •• • • ••• • ••• 1954 •• • • • ••• • ••• • •• • • ••• • • • • •• ••• • • ••• 1956 1958 • ••• • • • • • • • •• • • •••• • 1960 • • • ••• •• • • • • ••• •• • • • • • • • 1962 Index Normal Probability Plot 2 • 1 •••• •• 0 ••••• • •••• •• • ••••• Normal Scores 1950 ••• •••• -1 • ••••• ••••••• •• •• • ••• • -2 200 Thousands of Passengers 1000 Actual Values * * * Fitted Values * * * Future Values * * 95 % Prediction Interval * * • • •• • • • • • •• • • •• ••• •• •• • • • • ••• ••• •••• •••• • • •• •••• •• ••• •••• • • • ••• ••• •••• •• • • ••• •••• •• • -0.10 -0.05 0.0 0.05 0.10 Residuals 9 - 56 Airline Passenger Model Summary Table 9 - 57 Module 9 Segment 7 Seasonal Differencing of Nonseasonal Data Can be Misleading 9 - 58 Graphical Output from Function iden for Simulated Series #B with 1 Regular Difference 0 10 -20 w Simulated Time Series #B w= (1-B)^ 1 Sales 30 40 50 time -1.0 0.0 Partial ACF 0.0 -1.0 ACF 1.0 PACF 1.0 ACF 0 10 20 Lag 30 0 10 20 30 Lag 9 - 59 Graphical Output from Function iden for Simulated Series #B with 1 Regular and 1 Seasonal Difference -10 -30 w 10 Simulated Time Series #B w= (1-B)^ 1 (1-B^ 12 )^ 1 Sales 30 40 50 time -1.0 0.0 Partial ACF 0.0 -1.0 ACF 1.0 PACF 1.0 ACF 0 10 20 Lag 30 0 10 20 30 Lag 9 - 60 Function esti Output for Simulated Series #B SARIMA(0, 1, 1)(0, 0, 0)12 Model—Part 2 Simulated Time Series #B Model: Component 1 :: ndiff= 1 ma: 1 on w= Sales 200 250 Actual Values * * * Fitted Values * * * Future Values * * 95 % Prediction Interval * * • 150 • • • •• •• • • • • • • • •• •••• • • • • •• •• • • • • • •• • • •• • • • •• • ••• • • • •• ••• •• ••• • • • •• ••• • •• •• • • • ••• •• • • • • • •• • ••••••••••••••••••••••••• • •• • • • • 30 40 50 Index Normal Probability Plot • 2 • • • • • • • •• 1 • •• • • • • ••• • • • 0 20 • •• • • Normal Scores • • ••• •• • •• • •• • • • ••• -1 • • -2 100 •• 50 Sales • • • • • •• •• •• •••• ••••• •• • • • ••• ••• •• ••• •• ••• ••• •• • ••• ••• •••• ••• • • • •• •••• ••• •••• ••• • • ••• • •• • • • -20 -10 0 10 20 Residuals 9 - 61 Function esti Output for Simulated Series #B SARIMA(0, 1, 1)(0, 1, 1)12 Model—Part 2 Simulated Time Series #B Model: Component 1 :: ndiff= 1 ma: 1 Component 2 :: period= 12 ndiff= 1 ma: 1 on w= Sales 200 250 Actual Values * * * Fitted Values * * * Future Values * * 95 % Prediction Interval * * 150 • •• •• • • • • • • • •• •••• • • • • •• •• • • • • • •• • • • •• • • • •• • ••• • • • •• ••• •• ••• • • • ••• •• •• •• •• • ••••••• • ••••••••••• • •••••• •• • • • • 30 40 50 Index Normal Probability Plot • 2 • • • • • • • •• 1 • •• • • • • ••• • • 0 20 • •• • • Normal Scores • • ••• •• • •• • •• • • • • -1 • • ••• -2 100 •• 50 Sales • • •• • • • ••• •• • • • • • • • • • • •• • •• • •• • • •••• •••• ••• •• • • •• ••• •••• •••• ••• • • •• ••• •••• ••• •• • ••• ••• •••• • •• • • • •• •• • • • -30 -20 -10 0 10 20 Residuals 9 - 62 Seasonal Over-Differencing Assume that (1 − B)Zt = at so that Zt has a random walk model. Then Wt = (1 − B)Zt = at will follow a “trivial model” and we will not expect to see anything in the ACF/PACF. What if we take seasonal differences? Wt = (1 − B12)(1 − B)Zt = (1 − B12)at = −a12 + at which is a noninvertible MA(12)! 9 - 63 Module 9 Segment 8 Ohio Power Example Model Identification 9 - 64 Ohio Power Consumption Data 50 40 30 20 Billions of Kilowatt-hours 60 70 Ohio Electric Power Consumption 1954 1956 1958 1960 1962 1964 1966 1968 1970 Time 9 - 65 Ohio Power Consumption Data iden Output No Transformation and No Differencing iden(ohio.tsd, gamma=1) Ohio Electric Power Consumption 20 30 40 w 50 60 70 w= Billions of Kilowatt-hours 1954 1955 1956 1957 1958 1959 1960 1961 1962 1963 1964 1965 1966 1967 1968 1969 1970 1971 time ACF 0.0 -1.0 10 ACF 12 0.5 1.0 Range-Mean Plot 10 20 30 8 Lag 0.5 0.0 -1.0 6 Partial ACF 1.0 PACF 4 Range 0 30 40 50 Mean 60 0 10 20 30 Lag 9 - 66 Ohio Power Consumption Data iden Output No Transformation and One Regular Difference iden(ohio.tsd, gamma=1, d=1) 0 -5 w 5 Ohio Electric Power Consumption w= (1-B)^ 1 Billions of Kilowatt-hours 1954 1956 1958 1960 1962 1964 1966 1968 1970 time -1.0 0.0 Partial ACF 0.0 -1.0 ACF 1.0 PACF 1.0 ACF 0 10 20 Lag 30 0 10 20 30 Lag 9 - 67 Ohio Power Consumption Data iden Output No Transformation and Two Regular Differences iden(ohio.tsd, gamma=1, d=2) 0 -10 w 5 15 Ohio Electric Power Consumption w= (1-B)^ 2 Billions of Kilowatt-hours 1954 1956 1958 1960 1962 1964 1966 1968 1970 time -1.0 0.0 Partial ACF 0.0 -1.0 ACF 1.0 PACF 1.0 ACF 0 10 20 Lag 30 0 10 20 30 Lag 9 - 68 Ohio Power Consumption Data iden Output No Transformation and Three Regular Differences iden(ohio.tsd, gamma=1, d=3) 0 10 -20 w Ohio Electric Power Consumption w= (1-B)^ 3 Billions of Kilowatt-hours 1954 1956 1958 1960 1962 1964 1966 1968 1970 time -1.0 0.0 Partial ACF 0.0 -1.0 ACF 1.0 PACF 1.0 ACF 0 10 20 Lag 30 0 10 20 30 Lag 9 - 69 Ohio Power Consumption Data iden Output No Transformation and One Seasonal Difference iden(ohio.tsd, gamma=1, D=1) -5 0 w 5 10 Ohio Electric Power Consumption w= (1-B^ 12 )^ 1 Billions of Kilowatt-hours 1955 1957 1959 1961 1963 1965 1967 1969 1971 time -1.0 0.0 Partial ACF 0.0 -1.0 ACF 1.0 PACF 1.0 ACF 0 10 20 Lag 30 0 10 20 30 Lag 9 - 70 Ohio Power Consumption Data iden Output No Transformation Regular & Seasonal Difference iden(ohio.tsd, gamma=1, d=1, D=1) -6 -2 w 2 4 6 Ohio Electric Power Consumption w= (1-B)^ 1 (1-B^ 12 )^ 1 Billions of Kilowatt-hours 1955 1957 1959 1961 1963 1965 1967 1969 1971 time -1.0 0.0 Partial ACF 0.0 -1.0 ACF 1.0 PACF 1.0 ACF 0 10 20 Lag 30 0 10 20 30 Lag 9 - 71 Module 9 Segment 9 Ohio Power Example Model Comparison Using No Transformation 9 - 72 Ohio Power Consumption Model Summary Table 9 - 73 Ohio Power Consumption Data esti SARIMA(2, 0, 0)(0, 1, 0)12 No Transformation (Model 1) Output Part 1 esti(ohio.tsd, gamma=1, model=model.pdq(p=2, D=1)) Ohio Electric Power Consumption Model: Component 1 :: ar: 1 2 Component 2 :: period= 12 ndiff= 1 on w= Billions of Kilowatt-hours 0 -4 -2 Residuals 2 4 6 Residuals vs. Time 1954 1955 1956 1957 1958 1959 1960 1961 1962 1963 1964 1965 1966 1967 1968 1969 1970 1971 Time Residual ACF 1.0 Residuals vs. Fitted Values 6 • • •• •• • • • • • •• • • •• • •• -2 0 • • • • • • 0.5 • • •• • • 30 40 50 Fitted Values 60 0.0 • • • ACF 2 • -4 Residuals • • • • • • • • • • • • •• • • • • • • • • • • • • •• • • • • • • • • • •• • • • • • •• •• •• •• • • • • •• • • • • ••• • •• • • •• • •• • • •• •• • • • • •• • • • • • • • •••• •• • •• • • •• •• • • • • • • • • •• • • • • •• • • • • • • •• • • • • • • • • • • • • -0.5 • • • • 70 -1.0 4 • 0 10 20 30 Lag 9 - 74 Ohio Power Consumption Data SARIMA(2, 0, 0)(0, 1, 0)12 No Transformation (Model 1) Output Part 2 Ohio Electric Power Consumption Model: Component 1 :: ar: 1 2 Component 2 :: period= 12 ndiff= 1 on w= Billions of Kilowatt-hours 60 1960 1965 • • •• • • • • • • • • • • • • •• • • • • • • •• • •• • •• • •• • • •• • • • • •• • •• • •• •• • •• •• • 1970 Index 3 Normal Probability Plot 1 2 • 0 1955 Normal Scores • •• •• •• • -1 • • •• •• • • • •• • • • • • • • • • • • • • • • • • •• • •• • • • •• • • • • • • •• • • • •• • • • • • • ••• • • • • •• • • • •• • • • • • • -2 • • • • •• • • • • •• • • •• • • • • • • •• • • • • • • • • • • • •• • • • • • • • • • ••• • •• • •• • • • • • • • • • • •• • •• • ••• •• • • • • •• • -3 40 20 Billions of Kilowatt-hours 80 Actual Values * * * Fitted Values * * * Future Values * * 95 % Prediction Interval * * • • •• • •• ••• •• ••• • • •••• • ••• •••• •••••• • • • ••••• •••• ••• ••• • ••• •••• ••• ••••• • • • • ••• •• ••• •• • • •• • •• • • • -4 -2 0 2 4 6 Residuals 9 - 75 Ohio Power Consumption Data SARIMA(2, 0, 0)(0, 1, 1)12 No Transformation (Model 2) Output Part 1 esti(ohio.tsd, gamma=1, model=model.pdq(p=2, D=1, Q=1)) Ohio Electric Power Consumption Model: Component 1 :: ar: 1 2 Component 2 :: period= 12 ndiff= 1 ma: 1 on w= Billions of Kilowatt-hours 2 0 -4 -2 Residuals 4 6 Residuals vs. Time 1954 1955 1956 1957 1958 1959 1960 1961 1962 1963 1964 1965 1966 1967 1968 1969 1970 1971 Time Residual ACF 1.0 Residuals vs. Fitted Values 6 • 0 • -2 • • •• • • • • • • • • • • • • • • • • •• • • • • • • • • • • • • • • • • • 30 40 50 Fitted Values 60 0.0 • • •• • • • • • •• • • • • • • • • • • •• •• • • •• • • • • • • • • • • • •• • • • •• • • • • • •• • •• • • • •• • ••• •• • • • • • • • •• • • •• • • • • • • •• • ••• • • • • • • • •• •• • • • • • • • • • • •••• • • • • •• • • • • • ACF • -0.5 • • • • -1.0 2 • • • • • -4 Residuals 4 • • 0.5 • 70 0 10 20 30 Lag 9 - 76 Ohio Power Consumption Data SARIMA(2, 0, 0)(0, 1, 1)12 No Transformation (Model 2) Output Part 2 Ohio Electric Power Consumption Model: Component 1 :: ar: 1 2 Component 2 :: period= 12 ndiff= 1 ma: 1 on w= Billions of Kilowatt-hours 60 • •• •• • • • •• • • • • • • • • • • • • • • • • • •• • •• • • • •• • • • • • • •• • • • •• • • • • • • ••• • • • • •• • • • •• • • • • • • 1960 1965 • • •• • • • • •• • •• • • • •• •• • • • • • • • • • • •• • •• • • • • • •• • • • • •• • •• •• • •• •• • 1970 Index 3 Normal Probability Plot 1 2 • 0 1955 Normal Scores • •• •• •• • -1 • -2 • • • • •• • • • • •• • • •• • • • • • • •• • • • • • • • • • • • •• • • • • • • • • • ••• • •• • •• • • • • • • • • • • •• • •• • ••• •• • • • • •• • -3 40 20 Billions of Kilowatt-hours 80 Actual Values * * * Fitted Values * * * Future Values * * 95 % Prediction Interval * * • • • •• •• ••• • • ••• ••• ••• ••• • • •• ••• •••• ••• •••• • • ••• ••• ••• •••• ••• • • •••• ••• ••• ••• • • ••• •• •• • • • -4 -2 0 2 4 6 Residuals 9 - 77 Ohio Power Consumption Data SARIMA(2, 0, 0)(0, 1, 0)12 No Transformation (Model 1) Output Part 2 Ohio Electric Power Consumption Model: Component 1 :: ar: 1 2 Component 2 :: period= 12 ndiff= 1 on w= Billions of Kilowatt-hours 60 1960 1965 • • •• • • • • • • • • • • • • •• • • • • • • •• • •• • •• • •• • • •• • • • • •• • •• • •• •• • •• •• • 1970 Index 3 Normal Probability Plot 1 2 • 0 1955 Normal Scores • •• •• •• • -1 • • •• •• • • • •• • • • • • • • • • • • • • • • • • •• • •• • • • •• • • • • • • •• • • • •• • • • • • • ••• • • • • •• • • • •• • • • • • • -2 • • • • •• • • • • •• • • •• • • • • • • •• • • • • • • • • • • • •• • • • • • • • • • ••• • •• • •• • • • • • • • • • • •• • •• • ••• •• • • • • •• • -3 40 20 Billions of Kilowatt-hours 80 Actual Values * * * Fitted Values * * * Future Values * * 95 % Prediction Interval * * • • •• • •• ••• •• ••• • • •••• • ••• •••• •••••• • • • ••••• •••• ••• ••• • ••• •••• ••• ••••• • • • • ••• •• ••• •• • • •• • •• • • • -4 -2 0 2 4 6 Residuals 9 - 78 Ohio Power Consumption Data SARIMA(2, 0, 1)(0, 1, 1)12 No Transformation (Model 3) Output Part 1 esti(ohio.tsd, gamma=1, model=model.pdq(p=2,q=1,D=1,Q=1)) Ohio Electric Power Consumption Model: Component 1 :: ma: 1 ar: 1 2 Component 2 :: period= 12 ndiff= 1 ma: 1 on w= Billions of Kilowatt-hours 2 -4 -2 0 Residuals 4 6 Residuals vs. Time 1954 1955 1956 1957 1958 1959 1960 1961 1962 1963 1964 1965 1966 1967 1968 1969 1970 1971 Time Residual ACF 1.0 Residuals vs. Fitted Values • • • • • • •• • • • • • •• • • • • • • • • • • •• • • • • • • • • • • • • 30 40 50 Fitted Values 0.0 • • • • • • • • • • • • • • • • •• • • • •• • • • • • • •• • • • • • • • • • • • • • • • • • • ••••• • • ••• • •• • •• • • • • • • •• • • • • • •• • • • ••••• ••• •• • •• • ••• • •• • • • • • •••• • • • • • • • • • • • • ••• • • • • • • ACF 2 -2 • • -4 Residuals • 0 • • • • • -0.5 • • • • 0.5 • • -1.0 4 6 • 60 70 0 10 20 30 Lag 9 - 79 Ohio Power Consumption Data SARIMA(2, 0, 1)(0, 1, 1)12 No Transformation (Model 3) Output Part 2 Ohio Electric Power Consumption Model: Component 1 :: ma: 1 ar: 1 2 Component 2 :: period= 12 ndiff= 1 ma: 1 on w= Billions of Kilowatt-hours 80 Actual Values * * * Fitted Values * * * Future Values * * 95 % Prediction Interval * * 60 • • •• • • •• •• • • • • • •• • • • •• • •• • • • • • • • • •• • •• • • • • •• • ••• •• • • • • • • •• • • • • • •• • • • •• • • • • • • • • • •• • 1960 1965 •• • • • • • • •• • • • • • • • • • • •• •• •• •• • • • • • •• • • • • • •• • • • • • • • •• • 1970 Index 3 Normal Probability Plot 1 2 • 0 1955 Normal Scores • •• •• •• • -1 • -2 • • • • •• • • • • •• • • •• • • • • • • •• • • • • • • • • • • • •• • • • • • • • • • ••• • •• • •• • • • • • • • • • • •• • •• • ••• •• • • • • •• • • -3 40 20 Billions of Kilowatt-hours • •• •• ••• ••• • • •• •• ••• ••• • • ••• ••• ••• •••• •••• • • •• ••• •••• •• ••• ••••• •• •••• •••• •••• • ••• •• •• • • • -4 -2 0 2 4 6 Residuals 9 - 80 Ohio Power Consumption Data SARIMA(2, 0, 0)(0, 1, 1)12 No Transformation (Model 2) Output Part 2 Ohio Electric Power Consumption Model: Component 1 :: ar: 1 2 Component 2 :: period= 12 ndiff= 1 ma: 1 on w= Billions of Kilowatt-hours 60 • •• •• • • • •• • • • • • • • • • • • • • • • • • •• • •• • • • •• • • • • • • •• • • • •• • • • • • • ••• • • • • •• • • • •• • • • • • • 1960 1965 • • •• • • • • •• • •• • • • •• •• • • • • • • • • • • •• • •• • • • • • •• • • • • •• • •• •• • •• •• • 1970 Index 3 Normal Probability Plot 1 2 • 0 1955 Normal Scores • •• •• •• • -1 • -2 • • • • •• • • • • •• • • •• • • • • • • •• • • • • • • • • • • • •• • • • • • • • • • ••• • •• • •• • • • • • • • • • • •• • •• • ••• •• • • • • •• • -3 40 20 Billions of Kilowatt-hours 80 Actual Values * * * Fitted Values * * * Future Values * * 95 % Prediction Interval * * • • • •• •• ••• • • ••• ••• ••• ••• • • •• ••• •••• ••• •••• • • ••• ••• ••• •••• ••• • • •••• ••• ••• ••• • • ••• •• •• • • • -4 -2 0 2 4 6 Residuals 9 - 81 Ohio Power Consumption Data SARIMA(0, 1, 1)(0, 1, 1)12 (Airline) No Transformation (Model 5) Output Part 1 esti(ohio.tsd, gamma=1, model=model.pdq(d=1, q=1, D=1, Q=1)) Ohio Electric Power Consumption Model: Component 1 :: ndiff= 1 ma: 1 Component 2 :: period= 12 ndiff= 1 ma: 1 on w= Billions of Kilowatt-hours 2 0 -4 -2 Residuals 4 6 Residuals vs. Time 1954 1955 1956 1957 1958 1959 1960 1961 1962 1963 1964 1965 1966 1967 1968 1969 1970 1971 Time Residual ACF 1.0 Residuals vs. Fitted Values • 0 • • -2 • • • •• •• • •• •• • •• • •• • •• • • • • •• •• • • •• ••• •••• •• • • • • • • • • • •• ••• • • • •• • •• • • • • • • • •• • ••• •• • •• •• • • •• •• • • • ••• • • • • • • •• • •• • • • • • • • • • • • • • •• • • • • • • • • • • • •• •• • • • • • • • • • • • • • • • • •• • • • • • • • • • • • 30 40 50 Fitted Values 60 0.0 • •• • • • -1.0 2 • • • • ACF • • -4 Residuals • • 0.5 • • -0.5 4 6 • • 70 0 10 20 30 Lag 9 - 82 Ohio Power Consumption Data SARIMA(0, 1, 1)(0, 1, 1)12 (Airline) No Transformation (Model 5) Output Part 2 Ohio Electric Power Consumption Model: Component 1 :: ndiff= 1 ma: 1 Component 2 :: period= 12 ndiff= 1 ma: 1 on w= Billions of Kilowatt-hours 80 Actual Values * * * Fitted Values * * * Future Values * * 95 % Prediction Interval * * 60 • 1960 1965 •• • • • • • • •• • • • • • • • • • • •• •• •• • • • • •• • • • •• • • •• • • • • • • •• •• • 1970 Index 3 Normal Probability Plot 1 2 • 0 1955 Normal Scores • •• •• •• • • •• • • •• •• • • • • • •• • • • •• • •• • • • • • • • • •• • •• • • • • •• • ••• •• • • • • • • •• • • • • • •• • • • •• • • • • • • • • • •• • -1 • -2 • • • • •• • • • • •• • • •• • • • • • • •• • • • • • • • • • • • •• • • • • • • • • • ••• • •• • •• • • • • • • • • • • •• • •• • ••• •• • • • • •• • -3 40 20 Billions of Kilowatt-hours • • • • ••••• •• •• • • •• • •• •• ••• • ••• ••••• • ••• •••• ••• •• • • ••• •• •••• ••• ••••• • ••• ••• •• •••• • •• •• • •• • • • -4 -2 0 2 4 6 Residuals 9 - 83 Ohio Power Consumption Data SARIMA(2, 0, 1)(0, 1, 1)12 No Transformation (Model 3) Output Part 2 Ohio Electric Power Consumption Model: Component 1 :: ma: 1 ar: 1 2 Component 2 :: period= 12 ndiff= 1 ma: 1 on w= Billions of Kilowatt-hours 80 Actual Values * * * Fitted Values * * * Future Values * * 95 % Prediction Interval * * 60 • • •• • • •• •• • • • • • •• • • • •• • •• • • • • • • • • •• • •• • • • • •• • ••• •• • • • • • • •• • • • • • •• • • • •• • • • • • • • • • •• • 1960 1965 •• • • • • • • •• • • • • • • • • • • •• •• •• •• • • • • • •• • • • • • •• • • • • • • • •• • 1970 Index 3 Normal Probability Plot 1 2 • 0 1955 Normal Scores • •• •• •• • -1 • -2 • • • • •• • • • • •• • • •• • • • • • • •• • • • • • • • • • • • •• • • • • • • • • • ••• • •• • •• • • • • • • • • • • •• • •• • ••• •• • • • • •• • • -3 40 20 Billions of Kilowatt-hours • •• •• ••• ••• • • •• •• ••• ••• • • ••• ••• ••• •••• •••• • • •• ••• •••• •• ••• ••••• •• •••• •••• •••• • ••• •• •• • • • -4 -2 0 2 4 6 Residuals 9 - 84 Ohio Power Consumption Model Summary Table 9 - 85 Module 9 Segment 10 Ohio Power Example Model Comparison Using a Log Transformation and an Explanation of the Persistent ACF Spike at Lag 10 9 - 86 Ohio Power Consumption Model Summary Table 9 - 87 Ohio Power Consumption Data SARIMA(0, 1, 1)(0, 1, 1)12 (Airline) Log Transformation (Model 6) Output Part 1 esti(ohio.tsd, gamma=0, model=model.pdq(d=1, q=1, D=1, Q=1)) Ohio Electric Power Consumption Model: Component 1 :: ndiff= 1 ma: 1 Component 2 :: period= 12 ndiff= 1 ma: 1 on w= log( Billions of Kilowatt-hours ) 0.0 -0.05 Residuals 0.05 0.10 Residuals vs. Time 1954 1955 1956 1957 1958 1959 1960 1961 1962 1963 1964 1965 1966 1967 1968 1969 1970 1971 Time • • • • 0.0 • • -0.05 • • • • •• • • • •• • • • • • • •• • •• • •• • • •• • •• • • • • • • • • • • • • • •• • • •• • •• • • • • • • •• • • • • • • • • • • • • • •• •• •• •• • • •• • • • • • •• • • •• •• • • • • • •• • •• • •• • •• • •• • • • •• • • • •• • • • • • • • • 3.4 • • • • • • • • • • • • •• • • 3.6 3.8 Fitted Values 4.0 • •• • • • • • • • 3.2 • • • • • 0.5 • •• 0.0 • • ACF •• -0.5 • • • -1.0 0.05 • • • Residuals 1.0 Residual ACF 0.10 Residuals vs. Fitted Values 4.2 0 10 20 30 Lag 9 - 88 Ohio Power Consumption Data SARIMA(0, 1, 1)(0, 1, 1)12 (Airline) No Transformation (Model 5) Output Part 1 esti(ohio.tsd, gamma=1, model=model.pdq(d=1, q=1, D=1, Q=1)) Ohio Electric Power Consumption Model: Component 1 :: ndiff= 1 ma: 1 Component 2 :: period= 12 ndiff= 1 ma: 1 on w= Billions of Kilowatt-hours 2 0 -4 -2 Residuals 4 6 Residuals vs. Time 1954 1955 1956 1957 1958 1959 1960 1961 1962 1963 1964 1965 1966 1967 1968 1969 1970 1971 Time Residual ACF 1.0 Residuals vs. Fitted Values • 0 • • -2 • • • •• •• • •• •• • •• • •• • •• • • • • •• •• • • •• ••• •••• •• • • • • • • • • • •• ••• • • • •• • •• • • • • • • • •• • ••• •• • •• •• • • •• •• • • • ••• • • • • • • •• • •• • • • • • • • • • • • • • •• • • • • • • • • • • • •• •• • • • • • • • • • • • • • • • • •• • • • • • • • • • • • 30 40 50 Fitted Values 60 0.0 • •• • • • -1.0 2 • • • • ACF • • -4 Residuals • • 0.5 • • -0.5 4 6 • • 70 0 10 20 30 Lag 9 - 89 Ohio Power Consumption Data SARIMA(0, 1, 1)(0, 1, 1)12 (Airline) Log Transformation (Model 6) Output Part 2 Ohio Electric Power Consumption Model: Component 1 :: ndiff= 1 ma: 1 Component 2 :: period= 12 ndiff= 1 ma: 1 on w= log( Billions of Kilowatt-hours ) 80 Actual Values * * * Fitted Values * * * Future Values * * 95 % Prediction Interval * * 60 • 1960 1965 •• • • • • • • •• • • • • • • • • • • •• • • •• • • • • • • • • •• • • • • • •• • • • • • • •• • 1970 Index 3 Normal Probability Plot 1 2 • 0 1955 Normal Scores • •• •• •• • • •• • • •• •• • • • • • •• • • • •• • •• • • • • • • • • •• • •• • • • • •• • ••• •• • • • • • • •• • • • • • •• • • • •• • • • • • • • • • •• • -1 • -2 • • • • •• • • • • •• • • •• • • • • • • •• • • • • • • • • • • • •• • • • • • • • • • ••• • •• • •• • • • • • • • • • • •• • •• • ••• •• • • • • •• • -3 40 20 Billions of Kilowatt-hours • • ••• ••• ••• •• • •• • •• •• •• • ••• • • •••• ••• •••• •••••• • ••• ••• •••• ••••• •••• • • • •••• •••• •••• ••••• • • •• •••• ••• ••• • • • -0.05 0.0 0.05 0.10 Residuals 9 - 90 Ohio Power Consumption Data SARIMA(0, 1, 1)(0, 1, 1)12 (Airline) No Transformation (Model 5) Output Part 2 Ohio Electric Power Consumption Model: Component 1 :: ndiff= 1 ma: 1 Component 2 :: period= 12 ndiff= 1 ma: 1 on w= Billions of Kilowatt-hours 80 Actual Values * * * Fitted Values * * * Future Values * * 95 % Prediction Interval * * 60 • 1960 1965 •• • • • • • • •• • • • • • • • • • • •• •• •• • • • • •• • • • •• • • •• • • • • • • •• •• • 1970 Index 3 Normal Probability Plot 1 2 • 0 1955 Normal Scores • •• •• •• • • •• • • •• •• • • • • • •• • • • •• • •• • • • • • • • • •• • •• • • • • •• • ••• •• • • • • • • •• • • • • • •• • • • •• • • • • • • • • • •• • -1 • -2 • • • • •• • • • • •• • • •• • • • • • • •• • • • • • • • • • • • •• • • • • • • • • • ••• • •• • •• • • • • • • • • • • •• • •• • ••• •• • • • • •• • -3 40 20 Billions of Kilowatt-hours • • • • ••••• •• •• • • •• • •• •• ••• • ••• ••••• • ••• •••• ••• •• • • ••• •• •••• ••• ••••• • ••• ••• •• •••• • •• •• • •• • • • -4 -2 0 2 4 6 Residuals 9 - 91 Ohio Power Consumption Model Summary Table 9 - 92 1.0 Contour Plot of SARIMA(0, 1, 1)(0, 1, 1)12 (Airline) Model -2[Log-likelihood] Surface for the Ohio Data -750 -800 -900 -1000 0.0 -0.5 -1000 -1.0 ma(12*1) 0.5 -720 -1300 -1.0 -1200 -1100 -0.5 0.0 -1100 0.5 1.0 ma(1) 9 - 93 0.001 0.001 0.70 0.75 Contour Plot of SARIMA(0, 1, 1)(0, 1, 1)12 (Airline) Model Relative Likelihood Surface for the Ohio Data 0.0001 0.60 0.5 0.1 0.7 0.55 0.9 0.3 0.50 0.45 ma(12*1) 0.65 0.001 0.01 0.001 0.30 0.35 0.001 0.01 0.40 0.45 0.50 0.55 0.60 ma(1) 9 - 94 0 0.2 0.4 Z 0.6 0.8 1 Perspective Plot of SARIMA(0, 1, 1)(0, 1, 1)12 (Airline) Model Relative Likelihood Surface for the Ohio Data 0.7 0.6 0.6 5 0.55 0. ma 6 (1 0 2* 1) .55 0.5 0.4 0.5 0.45 1) ma( 0.35 0.4 5 9 - 95 Ohio Power Consumption Data SARIMA(0, 1, 1)(0, 1, 1)12 (Airline) Log Transformation (Model 6) Output Part 1 esti(ohio.tsd, gamma=0, model=model.pdq(d=1, q=1, D=1, Q=1)) Ohio Electric Power Consumption Model: Component 1 :: ndiff= 1 ma: 1 Component 2 :: period= 12 ndiff= 1 ma: 1 on w= log( Billions of Kilowatt-hours ) 0.0 -0.05 Residuals 0.05 0.10 Residuals vs. Time 1954 1955 1956 1957 1958 1959 1960 1961 1962 1963 1964 1965 1966 1967 1968 1969 1970 1971 Time • • • • 0.0 • • -0.05 • • • • •• • • • •• • • • • • • •• • •• • •• • • •• • •• • • • • • • • • • • • • • •• • • •• • •• • • • • • • •• • • • • • • • • • • • • • •• •• •• •• • • •• • • • • • •• • • •• •• • • • • • •• • •• • •• • •• • •• • • • •• • • • •• • • • • • • • • 3.4 • • • • • • • • • • • • •• • • 3.6 3.8 Fitted Values 4.0 • •• • • • • • • • 3.2 • • • • • 0.5 • •• 0.0 • • ACF •• -0.5 • • • -1.0 0.05 • • • Residuals 1.0 Residual ACF 0.10 Residuals vs. Fitted Values 4.2 0 10 20 30 Lag 9 - 96 ACF of the Residuals for the Ohio Power using the SARIMA(0, 1, 1)(0, 1, 1)12 (Airline) Model show.acf(ohio.model6.out$resid) 0.0 0.05 0.05 -0.05 0.0 0.05 0.10 -0.05 0.0 0.05 0.05 Series lag 4 • • • • • • • • • • • • • • • • • ••• • • •••• • • •• • • • ••• • • •• • • •••••••••••• ••• ••• • • •••• • • •• • • • • • ••••• • ••• • • • • • •• • ••• •• ••••• • ••••• •• •• • • • • • • •••• •••••• ••••••• •• ••• •• • • •• • ••• • • •• • • • • • • •• • • • • • • • • • • • -0.05 0.05 0.05 0.10 • •• •• • • • •• • • • • • • •• • •••• •• • • • • • •• • • • • • • •• •••• • •••••••••• •• •••• •• •• • • • • •• • ••• •••• •••• •• •• ••••• • • • • ••••• ••• •• • ••• • • • • •••••••••••• ••••••• ••• ••• • • • • •••• • ••• ••• • • • • • • • • • • • •• • • • • •• • 0.10 -0.05 0.0 0.05 series series series Lag 5 Lag 6 Lag 7 Lag 8 Lag 9 0.0 0.05 0.10 -0.05 0.0 0.05 • 0.10 -0.05 0.0 0.05 0.10 -0.05 0.0 0.05 Series lag 9 •• • • • • • • •••••••• •• •• ••• • • • • • • •• •••• ••• ••• •• • •••••• •• • • •• • •••• •• ••••• • • •• • • ••• • •• ••••••• ••• • • ••••• ••• •••••• •• • • • •• •••••• •••• •••••• • •••••• • • • • • •••• •• • • • • • ••• • ••• •• • • • • • • • • 0.05 • • -0.05 0.05 • Series lag 8 • • •• •• • • • • • • • •• • • ••••• •••••• •••••••• • • • •• •••••• •• ••• •• • • • • •••• •••• ••••• •••••• ••• ••• • •• • • •• •• •••••••• •••••••••••••••• • • • • • • • • • • • ••••• •••••• • •• •• • • • •• •••• ••• • • •• • • • • • • • • •• • • • • • -0.05 -0.05 0.05 • • • • • •• • •• • • • • • •• • •• •• • •••• •••••• •• • • •••• • ••••••• •• ••••• • • • •• ••• •• ••• ••• •• ••••• • •• • •• • • • • • •• • •••• • ••• • • • • ••••••••••••••••• ••••••• ••• •• •• • ••••••• • ••• • • •• • • ••• • • • • • • • • • • • • •• Series lag 7 • 0.10 • • • • • •• • •• • • ••• •••••• ••• •• •• • • •• • • • ••• • •• ••• •••••••••••••• •••• • • • • •••• •••••• ••••• • • •• •••••••• •• • • • • •• ••••• • ••••••••• ••••• ••••••• •• • • • ••• •••• • ••••• • • • • • •• • •• • • • • • • • • • •• 0.10 -0.05 0.0 0.05 0.10 series series series series Lag 10 Lag 11 Lag 12 Lag 13 Series : timeseries • • • • ••• • •• • • • • • • • • •• • • ••• ••••• • •• • • • •• ••••••••• •• ••••••• •• •• •• •• • • • ••• •• ••••• •••• ••••••• ••• • • • • ••••••• •••••••• •• •••••• • • • • • • • •• •• • • • •• •••• ••• • • • • • • •• • •• •• • •• • • • • • •• • • • • •• • • •• • • • • • •••• •••• • •••• • • • • •• •••••••••• •••••••• ••• ••• • • •••••• • • • • • • • • • • • •• ••• • •••••• •••• •• •••••• •••• •• • • • • • • • • • • • • • • • • • • •••• • •• •• • •• • • • • •• •• • ••• ••• ••• • • • • • • •• •• • • • • • • • • •• • • •• • ••• •• ••• ••• •• • • •• • •••••• ••• • • •• • ••• •••••• •••••• •• •• • • • • • •• •• • ••• • • • • •••• •••••••• ••••••••••• • • • • ••••••••••••• ••••• ••• • • •••• •••• • • • •• • • • •• • • •• • • • • •• • • • • • • • • • • • •• • • •• ••••• • • •••• • • • • • • • • • •• • ••••• • •• •• • •• •• • • ••• •• •• •• •••• • • •• • • •••• ••• ••••••• ••• • •• • • • • • • •• •• •••••••••••••••• ••• ••••• • • ••••••• ••••• •• • • • ••• • •• • • • • • • • • • -0.05 0.0 series 0.05 0.10 -0.05 0.0 series 0.05 0.10 -0.05 0.0 series 0.05 0.10 -0.05 0.0 0.05 0.10 0.6 -0.2 0.2 ACF 0.05 Series lag 13 -0.05 0.05 -0.05 Series lag 12 0.05 Series lag 11 • 1.0 series -0.05 0.05 Series lag 10 0.0 -0.05 0.05 Series lag 1 -0.05 • -0.05 • • • •• • • •• •••••• •••••• • ••••• •• ••• ••••• • •• ••••• • • • • • • • • • • ••• •••••••••• ••••• • • • • •• •• • •• • • •• • • • ••••• ••• •••• •••• ••••••• • • •• • •••• ••••••••• • • ••••••• • • • ••• • • • • • •• •• • • • • • • • • • • • • •• •••• • • • ••• •• •• •• • • •• ••• • • • •• • • • •• • •••••• •••• ••••• •• • • • •• ••• ••• • •• • ••• • •• • • •••• •••• •••• •••••••• • • • •••• •• •• • ••• • • • •• • • ••••••••• ••• ••• ••• • •• • ••• • ••• •• • • • • • • •• • • • • • • • • • • • series • •• •• •• • • •• • • •• • ••••••• •• ••• • • • • • • ••• •••• •• •••• •••• • • • • • • • ••••••••••• •••••••••••• •• • ••••••• ••• •• ••• • • • • • • •••• ••• • •• • • ••• • • •••••• • • • ••• • • ••• •• ••• • ••••• •• • •• • • ••• • • • • • • • • -0.05 -0.05 0.10 • Lag 4 timeseries 0.05 0.05 -0.05 Series lag 5 -0.05 Series lag 6 ••• -0.05 0.05 timeseries -0.05 •• ••• •••• ••••• ••••• •••• • • • ••• ••••• •••••• ••••• •••• • • • •• •••• •• • • ••• Lag 3 Series lag 3 • •• •••• Series lag 2 • Lag 2 -0.05 Lag 1 0 5 10 Lag 15 20 series 9 - 97