[go: up one dir, main page]

Academia.eduAcademia.edu
Ch ơng trình Giảng dạy Kinh tế Fulbright Ph ơng pháp nghiên c u II Bài đọc Nh p môn kinh tế l ng v i các ng d ng ậ 5th ed. Ch.11: Dự báo Ch ơng 11 D BÁO Lý do quan trọng của việc thiết lập mô hình kinh tế lượng là để tạo ra các giá trị dự báo của một hoặc nhiều biến kinh tế. Chương 1 chúng ta đã trình bày một số ví dụ về dự báo, và Mục 3.9 chúng ta đã sử dụng mô hình hồi quy đơn để minh họa các nguyên tắc cơ bản của dự báo1. Trong chương này, chúng ta tiếp tục vấn đề dự báo một cách chi tiết hơn. Chúng ta sẽ mô tả những phương pháp khác nhau, cũng như những phương pháp đánh giá các giá trị dự báo và kết hợp các dự báo được tạo ra b i các mô hình khác nhau. Tuy nhiên, do Dự báo là một chủ đề rất rộng, nên chương này chỉ giới thiệu những vấn đề có liên quan. Đã có rất nhiều sách viết về chủ đề này, độc giả có thể tham khảo nếu muốn biết thêm chi tiết. Mặc dù thuật ngữ dự báo (hoặc thuật ngữ tương đương dự đoán) thư ng được sử dụng trong ngữ cảnh là cố gắng dự đoán tương lai, các nguyên tắc của nó cũng hoàn toàn có thể ứng dụng để dự đoán các biến chéo. Chẳng hạn, ngư i ta có thể sử dụng ví dụ về bất động sản chương 3, 4, 6 và 7 để dự đoán được giá trung bình của ngôi nhà khi cho trước các đặc điểm của nó. Về phân loại các phương pháp dự báo, có thể phân biệt hai nhóm phương pháp. Dự báo kinh tế lượng dựa trên mô hình hồi quy để nối kết một hoặc một vài biến phụ thuộc với một số biến độc lập. Phương pháp này rất phổ biến do nó có khả năng giải thích các thay đổi các biến phụ thuộc theo sự thay đổi của các biến kinh tế hay các biến động thái khác - đặc biệt là những thay đổi trong các biến về chính sách. Ngược với phương pháp kinh tế lượng, phương pháp dự báo chuỗi th i gian chủ yếu dựa trên những nỗ lực để dự đoán các giá trị của một biến căn cứ vào những giá trị trong quá khứ của chính biến ấy. Những nhóm này rất rộng và ranh giới giữa chúng là không rõ ràng. Chẳng hạn, trong khi một số mô hình kinh tế lượng được thiết lập chỉ dựa trên các giá trị quá khứ của biến phụ thuộc, thì một số mô hình chuỗi th i gian thuần túy (phi kinh tế lượng) lại kết nối một biến với các giá trị của các biến khác (ví dụ như các mô hình tự hồi quy vectơ đã đề cập chương 10). Phương pháp chuỗi th i gian thư ng được xem là trội hơn phương pháp kinh tế lượng khi dự báo ngắn hạn. Các mô hình kinh tế lượng sẽ thích hợp hơn trong trư ng hợp mô hình hóa các ảnh hư ng dài hạn hơn. Các mô hình tổng hợp cả hai nhóm phương pháp này thư ng tạo ra được tiềm năng cải thiện các dự báo cả ngắn hạn lẫn dài hạn. Mục 11.6 sẽ thảo luận về dự báo kinh tế lượng và Mục 11.7 sẽ trình bày tổng quan về dự báo chuỗi th i gian. 1 Nên đọc lại Mục 3.9 Ramu Ramanathan 1 Biên dịch: Thục Đoan Hiệu đính: Cao Hào Thi Ch ơng trình Giảng dạy Kinh tế Fulbright Nh p môn kinh tế l Ph ơng pháp nghiên c u II Bài đọc ng v i các ng d ng ậ 5th ed. Ch.11: Dự báo o 11.1 Các Giá Trị Thích H p, D Báo Ki m Định Và Tiên Nghi m Trong môi tr ng dự báo có ba th i đoạn đ ợc quan tâm. Đầu tiên, ng i khảo sát sử dụng dữ liệu trong th i đoạn n1, đến n2 (ví dụ nh từ 1948 đến 1982) để ớc l ợng một hoặc một vài mô hình. Từ việc ớc l ợng đó (đôi khi còn gọi là d báo trong m u) sẽ thu đ ợc các giá trị thích h p, nghĩa là các giá trị dự báo đ ợc tính cho th i đoạn từ n1 đến n2 c a mẫu (từ 1948 đến 1982 nh trong ví dụ). Chẳng hạn, xét mô hình hồi quy sau: Yt  1   2 X t 2   3 X t 3  ... k X tk  ut (11.1) Giá trị thích hợp tính cho th i đoạn t là: Y t   1   X t 2   3 X t 3  ...   k X tk ^     (11.2) Tiếp theo, các giá trị d báo ngoài m u đ ợc tạo ra cho các th i đoạn n2 + 1 tr đi. Th i kỳ sau m u này có thể đ ợc chia thành hai phần: các th i đoạn từ n2 + 1 đến n3 (chẳng hạn nh từ 1983 đến 1994), trong đó giá trị thực tế c a Y và tất cả các Xs đều đư biết; và th i đoạn n3 + 1 tr đi (chẳng hạn, từ 1995 tr đi) trong đó các giá trị c a Xs và Y đều ch a biết. Các giá trị dự báo đ ợc tạo ra cho th i kỳ từ n2 + 1 đến n3 đ ớc gọi là các giá trị d báo ki m định, và các giá trị dự báo đ ợc tạo ra cho th i kỳ từ n3 + 1 tr đi đ ợc gọi là các giá trị dự báo tiên nghiệm. Hình 11.1 minh họa ba th i đoạn dự báo này. Vì Yt đư biết trong th i gian n2 + 1 đến n3 nên có thể so sánh các giá trị dự báo với các giá trị thực tế c a chúng và đánh giá đ ợc việc dự báo ngoài mẫu c a mô hình (sẽ trình bày rõ hơn trong mục tiếp theo). Do dữ liệu trong th i đoạn dự báo kiểm định ch a đ ợc sử dụng tr ớc đó để tính ra các giá trị ớc l ợng c a các tham số nên việc dự báo kiểm định sẽ thực sự cho biết khả năng dự báo c a mô hình. Các dự báo tiên nghiệm đ ợc thực hiện cho những th i đoạn mà giá trị thực c a cả biến phụ thuộc lẫn biến độc lập đều ch a biết, do đó nó là các dự báo trong t ơng lai ch a biết. o Hình 11.1 Các th i đo n d báo trong m u, ki m định và tiên nghi m  Yt Dự báo Kiểm đinh Th i kỳ ớc l ợng Dự báo trong mẫu n1 Ramu Ramanathan n2 2 Dự báo Tiên nghiệm n3 t Biên dịch: Thục Đoan Hiệu đính: Cao Hào Thi Ch ơng trình Giảng dạy Kinh tế Fulbright Nh p môn kinh tế l Ph ơng pháp nghiên c u II Bài đọc ng v i các ng d ng ậ 5th ed. Ch.11: Dự báo o VÍ D 11.1 Lấy ví dụ: Một nhà phân tích trong bộ phận dự báo phụ tải điện c a một đơn vị phục vụ muốn dự báo tổng doanh thu khu vực hộ dân c . Nhà phân tích có một số mô hình tháng nối kết m c tiêu thụ điện các hộ dân với dạng th c th i tiết trong tháng và những tác động theo mùa khác: giá bán điện, tổng các dụng cụ sử dụng điện, thu nhập hộ gia đình, v.v... Giả sử rằng ng i dự báo có dữ liệu theo tháng trong 10 năm (120 quan sát). Để so sánh khả năng dự báo c a các mô hình khác nhau, đầu tiên ng i khảo sát có thể sử dụng các quan sát từ 1 đến 100 để ớc l ợng các mô hình (đây là th i kỳ trong mẫu). Sau đó, cô ta sử dụng các mô hình đư đ ợc ớc l ợng để tạo ra các giá trị dự báo kiểm định về m c sử dụng điện trong các th i đoạn từ 101 đến 120, sử dụng giá trị đư biết c a các biến độc lập. Vì các giá trị c a biến phụ thuộc cũng đư đ ợc biết một cách chắc chắn trong th i kỳ sau mẫu, các giá trị dự báo có thể đ ợc đánh giá căn c theo các giá trị đư biết này và một trong các mô hình sẽ đ ợc chọn lựa là "tốt nhất". Tiếp đó, mô hình đ ợc chọn này sẽ đ ợc ớc l ợng lại, bằng cách sử dụng toàn bộ mẫu (trong ví dụ này là tất cả 120 quan sát) và các giá trị dự báo tiên nghiệm (dựa trên mô hình đư đ ợc ớc l ợng lại) sẽ đ ợc tạo ra cho những th i đoạn sau th i đoạn 120. Những giá trị dự báo tiên nghiệm sẽ là cơ s để hoạch định công suất phát điện trong t ơng lai và giá điện sẽ đ ợc xác định. o 11.2 Đánh Giá Các Mô Hình: Hầu hết các nhà dự báo đánh giá các mô hình c a họ theo năng lực dự báo c a mô hình. Một số ph ơng pháp đ ợc sử dụng để đánh giá năng lực dự báo. Trong mục 3.9, sai s bình ph ơng trung bình (MSE) đư đ ợc giới thiệu là một cách để so sánh các giá trị dự báo từ các mô hình khác nhau. Với một mô hình tổng quát có k hệ số hồi quy, MSE đ ợc định nghĩa nh sau:  (Y MSE  f  Yt ) 2 nk t trong đó n là số các quan sát, Yt là giá trị thực tế c a biến phụ thuộc, Ytf là giá trị đ ợc dự báo từ mô hình. Trong th i kỳ mẫu, MSE t ơng đ ơng với , là ớc l ợng c a ph ơng sai c a số hạng sai số ut. Tiêu chuẩn lựa chọn mô hình đư đề cập trong mục 4.3 cũng có thể đ ợc sử dụng để đánh giá năng lực dự báo. Cách làm là dùng mỗi mô hình so sánh để dự đoán các giá trị c a Y trong th i kỳ kiểm định. Kế đó, tính tổng bình ph ơng sai số (ESS) bằng (Ytf Yt )2 và sau đó dùng tiêu chuẩn chọn mô hình trong bảng 4.3. Mô hình nào có các giá trị thống kê này thấp hơn thì đ ợc xem là tốt hơn xét về năng lực dự báo. Cách th ba để đánh giá mô hình là dựa trên cơ s đơn giữa giá trị dự báo và giá trị quan sát nh sau: Ramu Ramanathan 3 ớc l ợng c a phép hồi quy Biên dịch: Thục Đoan Hiệu đính: Cao Hào Thi Ch ơng trình Giảng dạy Kinh tế Fulbright Ph ơng pháp nghiên c u II Bài đọc Nh p môn kinh tế l ng v i các ng d ng ậ 5th ed. Ch.11: Dự báo Yt = a + b Ytf + et   Nếu việc dự báo là hoàn hảo trong suốt các th i đoạn t, thì ta sẽ có a bằng 0 và b bằng 1. Điều này có thể đ ợc kiểm ch ng chính th c bằng cách sử dụng t - test thích hợp. biến phụ thuộc đều là d ơng thì ng Cuối cùng, nếu tất cả các quan sát i ta có    thể tính sai s ph n trăm tuy t đ i, APEt  100Yt  Y  / Yt và sai s ph n trăm tuy t       100Yt  Y  / Yt   và chọn mô hình nào có giá trị MAPE thấp. Chúng ta đư thấy nhiều ví dụ trong đó MAPE và MSE đ ợc tính và năng lực dự báo c a mô hình đ ợc đánh giá. đ i trung bình (MAPE) đư đ ợc định nghĩa trong ch ơng 3 là (1/n) o 11.3 Giá Trị D Báo Có Đi u Ki n Và Vô Đi u Ki n Khi xét các giá trị dự báo kiểm định hay tiên nghiệm điều quan trọng là phân biệt giữa các giá trị dự báo có điều kiện và không điều kiện. Giá trị d báo có đi u ki n có đ ợc khi biến phụ thuộc đ ợc dự báo với giả thiết là các biến độc lập có các giá trị cụ thể (có thể là các giá trị đư biết). Để có một ví dụ đơn giản về dự báo có điều kiện, hãy xét mô hình sau: Ht =  + Pt + ut (11.3) trong đó Ht là số căn hộ một thành phố nào đó và Pt là dân số c a thành phố đó. Nh đư nêu trong mục 3.9, giá trị dự báo có điều kiện c a H khi cho tr ớc P, chẳng hạn là P0, là H     P0 . Giả sử cho dân số    th i điểm (n+1) là Pn+1, thì giá trị dự báo có điều kiện c a H với điều kiện P = Pn+1 là H n 1     Pn 1 . Do đó, giả thiết rằng dân số    th i điểm tiếp theo là Pn+1 chúng ta sẽ có đ ợc dự báo có điều kiện c a số căn hộ trong th i đoạn tiếp theo là    Pn 1 .   Các giá trị d báo không đi u ki n có đ ợc khi các giá trị c a các biến ngoại sinh không đ ợc cho tr ớc mà đ ợc tạo ra từ chính mô hình hoặc từ một mô hình phụ trợ. Do vậy, các biến độc lập không đ ợc đo một cách chắc chắn mà mang tính bất định. Trong ví dụ về căn hộ, dân số trong t ơng lai c a thành phố là số ch a biết. Một mô hình phụ trợ về nhập c , sinh sản và tử vong có thể đ ợc sử dụng để có đ ợc các dự báo về dân số  th i đoạn n+1 (gọi là P n 1 ). Các giá trị dự báo về số căn hộ có đ ợc bằng cách phối hợp mô hình kinh tế l ợng với mô hình dân số là không điều kiện. Do vậy, ta có H n 1     Pn 1 , trong đó P n 1 là giá trị dự báo c a dân số, có đ ợc từ mô hình phụ      trợ. Các mô hình VAR đư trình bày trong ch ơng tr ớc là những công cụ rất tốt để tạo ra các giá trị dự báo không điều kiện. Ramu Ramanathan 4 Biên dịch: Thục Đoan Hiệu đính: Cao Hào Thi Ch ơng trình Giảng dạy Kinh tế Fulbright Ph ơng pháp nghiên c u II Bài đọc Nh p môn kinh tế l ng v i các ng d ng ậ 5th ed. Ch.11: Dự báo Các giá trị thích hợp đ ợc tạo ra trong th i kỳ trong mẫu là có điều kiện (vì các giá trị c a Xs đ ợc cho tr ớc), nh ng các giá trị dự báo trong th i kỳ tiên nghiệm là không điều kiện vì chúng đòi hỏi các biến độc lập phải đ ợc dự báo tr ớc khi biến phụ thuộc đ ợc dự báo. Các giá trị dự báo trong th i kỳ kiểm định có thể là có điều kiện hoặc không điều kiện tùy thuộc vào cách tạo ra chúng. Đến lúc này, cần l u ý một vài điểm không nhất quán trong các tài liệu lý thuyết có liên quan đến việc sử dụng thuật ngữ có điều kiện và không điều kiện. Một số tác giả định nghĩa những thuật ngữ này hoàn toàn ng ợc lại với định nghĩa đ ợc trình bày đây. Điều này không đúng. Thuật ngữ có điều kiện xuất x từ thuật ngữ trong lý thuyết xác suất trong đó ta xét phân phối có điều kiện, ký hiệu là P (Y/X), c a một biến ngẫu nhiên cho trước giá trị c a một biến ngẫu nhiên khác. Trị trung bình có điều kiện c a phân phối này là E (Y/X). Một giá trị dự báo c a Y là một ớc l ợng c a E (Y/X) và sẽ phụ thuộc vào X. Do đó, giá trị dự báo c a Y với một giá trị c a X cho tr ớc là một giá trị dự báo có điều kiện. Trị trung bình không điều kiện c a Y, ký hiệu là E (Y), là giá trị kỳ vọng c a Y trên mật độ xác suất hợp f(x,y) và không phụ thuộc vào X. Một ớc l ợng c a E(Y) là một giá trị dự báo không điều kiện trong đó X cũng đ ợc xem là một biến ngẫu nhiên. o VÍ D 11.2 Doanh thu trong điều kiện “Bình th ng hóa th i tiết” đ ợc thực hiện b i đơn vị h ng lợi điện là một ví dụ hay về dự báo có điều kiện. Để định giá sử dụng điện, các dụng cụ dùng điện đ ợc các nhân viên phụ trách đơn vị tiện ích công cộng đều đặn yêu cầu để có đ ợc “chuỗi đ ợc điều hỉnh theo th i tiết” về doanh thu điện chuỗi này có đ ợc bằng cách hỏi “L ợng tiêu thụ vừa qua là bao nhiêu nếu th i tiết là bình th ng ?”. Th i tiết bình th ng đ ợc đo một cách điển hình bằng cách lấy giá trị trung bình c a nhiệt độ, độ ẩm, tốc độ gió, v.v… trong suốt th i đoạn 10 năm (hoặc dài hơn). Sau đó, các giá trị ng với “th i tiết bình th ng” đ ợc thay cho các biến th i tiết và một giá trị dự báo đ ợc tạo ra. Hiệu số giữa giá trị dự báo tiêu thụ điện trong điều kiện th i tiết thực tế và giá trị dự báo tiêu thụ điện trong điều kiện “th i tiết bình th ng” chính là số hiệu chỉnh do th i tiết. Rõ ràng, không có chuyện “th i tiết bình th ng” duy nhất. Thực ra, các giá trị trung bình số đo th i tiết trong 10 năm và các giá trị trung bình c a số đo th i tiết trong 20 năm sẽ tạo ra số hiệu chỉnh th i tiết khác nhau. Do vậy, các giá trị dự báo là có điều kiện tùy theo định nghĩa “th i tiết bình th ng”. Nếu ta cũng dự báo th i tiết và dùng nó để dự báo m c sử dụng điện, thì chúng ta sẽ có các dự báo không điều kiện. o 11.4 D Báo T Các Xu H ng Theo Th i Gian Hầu hết các chuỗi th i gian c a các biến tổng hợp đều biểu hiện một dạng th c tăng hoặc giảm từ từ, gọi là xu h ớng. Ng i ta có thể thích hợp bằng một đ ng cong trơn với một xu h ớng rõ nét. Sau đó đ ng cong thích hợp đó có thể đ ợc ngoại suy để tạo ra các giá trị dự báo c a biến phụ thuộc. Ph ơng pháp dự báo này gọi là làm thích hợp bằng đ ng xu h ớng. Không cần có mô hình hay lý thuyết về động thái kinh tế l ợng rõ rệt, chỉ cần một giả thiết đơn giản là các dạng th c trong quá kh sẽ còn tiếp tục trong t ơng lai. Để Ramu Ramanathan 5 Biên dịch: Thục Đoan Hiệu đính: Cao Hào Thi Ch ơng trình Giảng dạy Kinh tế Fulbright Nh p môn kinh tế l Ph ơng pháp nghiên c u II Bài đọc ng v i các ng d ng ậ 5th ed. Ch.11: Dự báo xác định loại đ ng cong xu h ớng để làm thích hợp, ng i khảo sát vẽ đồ thị biến phụ thuộc theo th i gian và nhận dạng xem xu h ớng là tuyến tính, bậc hai hay lũy thừa, hay có dạng th c nào khác. Chúng ta liệt kê một số dạng đ ng xu h ớng đ ợc sử dụng phổ biến: Yt = 1 + 2t + ut Yt = 1 + 2t + 3t2 + ut Yt = 1 + 2t + 3t2 + 4t3 ut Yt = 1 + 2ln ( t ) + ut Yt = 1 + 2 (1 / t) + ut ln ln (Yt) = 1 + 2t + ut ; Yt > 0 ln (Yt) = 1 + 2 ln( t ) + ut ; Yt > 0 (A) Đ ng thẳng (B) Bậc hai (C) Bậc ba (D) Log-tuyến tính (E) Nghịch đảo (F) Tuyến tính-log (G) Log-hai lần  Yt  n   = 1 + 2 t + ut ; 0 < Yt < 1 1  Yt  Năm công th c đầu có Yt là biến phụ thuộc, hai công th c tiếp theo có ln(Yt) là biến phụ thuộc, và công th c cuối cùng có dạng log hóa đối với Yt. Cần nhấn mạnh rằng các giá trị c a chỉ so sánh đ ợc giữa hai mô hình có cùng biến phụ thuộc. Hơn nữa, dạng log hóa đòi hỏi Yt và Yt / (1 - Yt) phải d ơng. Đ ng cong log là dạng hữu ích khi Yt giữa 0 & 1 hoặc khi Yt là trị số phần trăm. Nh đư nêu trong mục 6.12, đ ng cong log đảm bảo rằng các giá trị đ ợc dự báo luôn giữa 0 và 1 (hoặc 0 đến 100 nếu biến phụ thuộc là số phần trăm). (H) Logistic Chúng ta đư l u ý trong ch ơng 6 là nếu biến phụ thuộc có dạng log thì các giá trị dự báo sẽ bị thiên lệch. Để tìm hiểu điều này rõ hơn, lấy lũy thừa mô hình log-hai lần bên trên. Ta có: e ln Yt  Yt  e 1  2 ln(t )ut  e 1 t 2 eut Lấy giá trị kỳ vọng c a cả hai vế: E (Yt )  e 1 t 2 E[eut ]  e 1 t 2 b i vì E (ut) = 0 không có nghĩa là E (e ut )  1 . Tuy vậy, có thể ớc l ợng E [e ut ] bằng cách dùng dữ kiện là E [e ut ] = e 2 là e  /2 2 /2 = (không ch ng minh). Một ớc l ợng c a e  . Do đó, một dự báo đúng c a Yt là: Y t  e  1 t  2 e   2 2 /2 /2 Để tạo ra các giá trị dự báo từ các đ ng xu h ớng, các quan hệ sau đây sẽ đ ợc sử dụng (cho các sai số không dự đoán đ ợc ut bằng 0): Đ ng thẳng Bậc hai Ramu Ramanathan Y t  1  2 t    Y t  1  2 t   3 t2     6 Biên dịch: Thục Đoan Hiệu đính: Cao Hào Thi Ch ơng trình Giảng dạy Kinh tế Fulbright Ph ơng pháp nghiên c u II Bài đọc Nh p môn kinh tế l ng v i các ng d ng ậ 5th ed. Ch.11: Dự báo Y t  1  2 t   3 t2   4 t3  Bậc ba Log- tuyến tính Nghịch đảo    Y t   1   2 ln(t )    Y t   1   2 (1 / t )     Yt e Tuyến tính-log  Yt e t e Log-hai lần   1  2   2  1   2 t  ( / 2 ) 2 ( / 2 )  Yt  Logistic  1 1 e   2 [  1   2 t ( / 2 )] Nếu đ ng xu h ớng biểu hiện mối t ơng quan chuỗi trong các phần d thì các giá trị dự báo có thể đ ợc cải thiện bằng cách khai thác cấu trúc c a phần d , nh đư đ ợc mô tả trong ch ơng 9 và 10. ng dụng phổ biến c a các đ ng xu h ớng là để tách một xu h ớng rõ nét (gọi là tách xu h ng) và sau đó khảo sát sự phân tán c a biến phụ thuộc đ ợc quan sát từ đ ng xu h ớng đ ợc thích hợp hóa. Trong tr ng hợp này, đầu tiên nhà phân tích làm thích hợp bằng một trong số các đ ng cong đ ợc liệt kê bên trên và sau đó thu đ ợc các  phần d u t . Sau đó, các giá trị c a các phần d này có thể đ ợc kết nối với các biến mà có thể lý giải sự dao động chung quanh xu h ớng. Ph ơng pháp này th ng đ ợc các nhà phân tích chu kỳ kinh doanh sử dụng, đầu tiên họ làm thích hợp một xu h ớng dài hạn cho biến phụ thuộc đang xét (giá cổ phiếu, GNP, thất nghiệp, v.v...), tách phần xu h ớng  và thu đ ợc u t , và sau đó nối kết phần d với những biến rất ngắn hạn nh mùa vụ, các thông báo về chính sách nhà n ớc, các sự kiện quốc tế nổi bật, v.v... Cần nhấn mạnh là riêng việc làm thích hợp bằng một đ ng xu h ớng th ng là ch a đ , nh ng nó là việc hữu ích trong một chiến l ợc mô hình hóa rộng hơn, trong đó một biến phụ thuộc đ ợc nối kết với nhiều biến độc lập có thể bao gồm các xu h ớng. Việc thích hợp hóa đ ng cong đơn giản thì không dựa trên bất kỳ một cơ chế rõ rệt nào mà là trên giả thiết, mà th ng là sai, là các động thái trong quá kh sẽ còn tiếp diễn. o Bài T p Th c Hành 11.1 Trong các đ ng cong tuyến tính log, log-hai lần và logistic đư nêu, hãy giải ra Yt là hàm  theo t và kiểm ch ng các giá trị dự báo cho tr ớc. Sau đó, vẽ đồ thị Yt theo các giả thiết khác nhau về dấu c a  . Những hình dạng nào mà các đ  Ramu Ramanathan 7 ng cong có thể có? Biên dịch: Thục Đoan Hiệu đính: Cao Hào Thi Ch ơng trình Giảng dạy Kinh tế Fulbright ng D ng: Thích H p Hóa Các Đ Ph ơng pháp nghiên c u II Bài đọc ng Xu H Nh p môn kinh tế l ng v i các ng d ng ậ 5th ed. Ch.11: Dự báo ng C a Ti n Công Lao Đ ng California. DATA 10-5 cho dữ liệu năm về tiền công trung bình gi California từ 1960 - 1994. Hình 11.2 vẽ dữ liệu này theo th i gian, cho thấy rằng m c tiền công rất ổn định cho đến năm 1965, từ đó nó tăng lên theo m c tăng dần trong suốt 2 thập kỷ và giảm lại vừa phải. Tất cả 8 đ ng xu h ớng đư trình bày tr ớc đây đ ợc ớc l ợng bằng cách dùng dữ liệu trong th i kỳ 1960 - 1989. Do có ch ng c rõ rệt về t ơng quan chuỗi, các thông số đ ợc ớc l ợng theo quy trình Cochrane - Orcutt đư đ ợc mô tả trong ch ơng 9. Sau đó, các giá trị dự báo ngoài mẫu đ ợc phát ra cho th i kỳ 1990 - 1994, sau khi cho phép điều chỉnh tự t ơng quan đối với các giá trị dự báo cũng nh các sai lệch trong dự báo do các công th c logarit. Kế đến, hàm hồi qui Yt = a + b Ytf + et, nối kết giá trị thực tế c a biến phụ thuộc với giá trị dự báo c a chúng, sẽ đ ợc ớc l ợng. Sau đó, tính toán sai số phần trăm tuyệt đối trung bình (MAPE) và các thông số thống kê để chọn mô hình đư mô tả trong ch ơng 4. Bảng 11.1 trình bày tóm tắt các thống kê (Phần thực hành máy tính mục 11.1 sẽ cung cấp chi tiết để tạo ra lại các kết quả này). Khi việc dự báo là tốt, chúng ta   mong đợi a tiến gần đến 0 và b tiến gần đến 1. Xét về các độ đo này thì mô hình bậc hai (B) là tốt nhất. Mô hình (B) cũng là tốt nhất xét theo MAPE và tất cả các trị thống kê để chọn lựa mô hình. Bảng 11.2 cho các giá trị tiền công thực tế và dự báo cũng nh các sai số phần trăm tuyệt đối (APE) đối với mô hình (B) trong suốt các năm (xin xem phần thực hành máy tính 11.2 để biết thêm chi tiết). Chúng ta l u ý là APE v ợt quá giá trị 5% chỉ năm 1961 và 1981, nh ng thấp hơn 5% trong tất cả các năm còn lại. Nh đư đề cập tr ớc đây, kiểm định thực sự về năng lực dự báo c a một mô hình là mô hình đó dự báo tốt đến m c nào ngoài th i kỳ mẫu đ ợc dùng trong quá trình đánh giá. Điều cần quan tâm l u ý là APE trong giai đoạn hậu mẫu 1990 - 1994 là không v ợt quá 1.68%. Do vậy, mô hình B, sử dụng xu h ớng th i gian bậc hai thực hiện khả năng dự báo khá tốt nói chung. Hình 11.2 M c Ti n Công Lao Đ ng Trung Bình Gi Ramu Ramanathan 8 California Biên dịch: Thục Đoan Hiệu đính: Cao Hào Thi Ch ơng trình Giảng dạy Kinh tế Fulbright Nh p môn kinh tế l Ph ơng pháp nghiên c u II Bài đọc ng v i các ng d ng ậ 5th ed. Ch.11: Dự báo o BÀI T P TH C HÀNH 11.2 Thực hiện lại phân tích bên trên, sử dụng dữ liệu về tiền công DATA 10 - 5. o Bảng 11.1 So sánh khả năng d báo c a các đ Các mô hình ng xu h ng. Mỹ đ ợc trình bày trong A B C D E F G  2.879 1.818 -6.296 2.449 2.498 3.854 3.299  0.748 0.849 1.582 0.799 0.795 0.648 0.712 MAPE 1.799 0.610 3.794 0.850 0.876 4.950 2.002 SGMASQ 0.112 0.013 0.385 0.021 0.023 0.673 0.142 AIG 0.149 0.017 0.514 0.029 0.030 0.898 0.190 FPE 0.156 0.018 0.539 0.030 0.032 0.942 0.199 HQ 0.098 0.011 0.338 0.019 0.020 0.590 0.125 SCHWARZ 0.128 0.015 0.440 0.024 0.026 0.768 0.163 SHIBATA 0.121 0.014 0.416 0.023 0.024 0.726 0.154 GCV 0.186 0.022 0.642 0.036 0.038 1.121 0.237 RICE 0.335 0.039 1.156 0.064 0.068 2.018 0.427 a b o Bảng 11.2 Các Sai S Ph n Trăm Tuy t Đ i (APE) C a Mô Hình B. Ramu Ramanathan Year Wage Wagehat APE Year Wage Wagehat APE 1961 2.72 2.55 6.64 1978 6.43 6.42 0.59 1962 2.79 2.70 3.64 1979 7.03 6.86 2.97 1963 2.88 2.82 2.57 1980 7.70 7.45 3.72 1964 2.96 2.96 0.65 1981 8.56 8.11 8.71 1965 3.05 3.08 1.44 1982 9.24 8.96 3.54 1966 3.16 3.21 2.06 1983 9.52 9.63 1.60 1967 3.29 3.36 2.55 1984 9.77 9.90 1.83 1968 3.44 3.52 2.90 1985 10.12 10.14 0.73 1969 3.62 3.71 2.84 1986 10.36 10.48 1.68 1970 3.80 3.91 3.51 1987 10.75 10.71 0.84 1971 4.02 4.12 3.02 1988 10.80 11.09 3.14 1972 4.25 4.37 3.21 1989 11.16 11.13 0.80 1973 4.44 4.62 4.47 1990 11.48 11.47 0.62 1974 4.76 4.83 1.90 1991 11.87 11.76 1.39 1975 5.22 5.16 1.62 1992 12.19 12.13 1.00 1976 5.59 5.63 1.21 1993 12.38 12.42 0.84 1977 6.00 6.01 0.63 1994 12.44 12.59 1.68 9 Biên dịch: Thục Đoan Hiệu đính: Cao Hào Thi Ch ơng trình Giảng dạy Kinh tế Fulbright Ph ơng pháp nghiên c u II Bài đọc Nh p môn kinh tế l ng v i các ng d ng ậ 5th ed. Ch.11: Dự báo Làm Trơn M t Chuỗi Th i Gian V Kinh Tế Khi một chuỗi đ ợc vẽ theo th i gian, ta có thể thấy có những dao động xung quanh một đ ng xu h ớng trơn. Một nhà quan sát chỉ quan tâm đến một xu h ớng rõ nét có thể muốn thử làm trơn các chuỗi bằng cách làm giảm những biến động ngắn hạn c a chuỗi. Điều này có thể đ ợc thực hiện bằng nhiều cách. Một cách là tính giá trị trung bình tr ợt có dạng: Yt  1  ( X t  X t 1  ...  X t m1 ) m trong đó Xt là chuỗi gốc và Yt là chuỗi mới có đ ợc bằng cách lấy trung bình m số liệu liên tiếp. Ví dụ, với m = 3, ta lấy trung bình 3 giá trị quan sát đầu tiên, kế đó lấy trung bình 3 giá trị quan sát th 2, 3 & 4, kế đó là 3, 4 & 5 v.v... M c độ trơn tùy thuộc vào độ lớn c a m, m càng lớn thì chuỗi kết quả thu đ ợc càng trơn. Tuy nhiên, khi sử dụng Yt trong hồi quy, cần phải nhớ là Yt chỉ đ ợc xác định trong dưy (m,n) và do đó, ta bị mất đi (m-1) số liệu quan sát. Một cách khác nữa là làm trơn theo lũy th a trong đó chuỗi mới là giá trị trung bình có trọng số c a các giá trị hiện tại và quá kh c a chuỗi với các trọng số giảm dần theo hình học. Do đó, ta có:   Yt   X t  (1   ) X t 1  (1   ) 2 X t 2  ... với 0 <  <1. Có thể biểu diễn chuỗi dạng đơn giản hơn bằng cách l u ý là với t-1   Yt 1   X t 1  (1   ) X t 2  (1   ) 2 X t 3  ... từ đó rút ra ph ơng trình sau đây: Yt  X t  (1   )Yt 1 Nếu tiến gần đến 1 thì Xt đ ợc gán cho trọng số lớn và do đó chuỗi kết quả sẽ không trơn giống nh Xt. Do vậy, giá trị càng nhỏ thì Yt sẽ càng trơn. L u ý là cách làm trơn theo lũy thừa chỉ làm mất đi một giá trị quan sát. o VÍ D 11.3 Hình 11.3 biểu diễn tổng số những lao động phi nông nghiệp Mỹ, tính theo đơn vị trăm ngàn ng i, và hai chuỗi đư đ ợc làm trơn theo lũy thừa với = 0.2 và 0.7 (Phần thực hành máy tính 11.3 chỉ rõ các b ớc để tạo ra các con số thực tế). L u ý là đồ thị với = 0.2 trơn hơn đồ thị c a 2 chuỗi kia. Làm trơn theo lũy thừa cũng hữu ích khi điều chỉnh các giá trị dự báo để cho phép các sai số dự báo đ ợc tạo ra trong quá kh gần. Cụ thể, gọi Yt là giá trị thực c a Y vào th i điểm t và Yt a1 là giá trị dự báo đ ợc tạo ra vào th i điểm t+1 bằng một mô hình nào đó (ký hiệu là a). Ramu Ramanathan 10 Biên dịch: Thục Đoan Hiệu đính: Cao Hào Thi Ch ơng trình Giảng dạy Kinh tế Fulbright Nh p môn kinh tế l Ph ơng pháp nghiên c u II Bài đọc o Hình 11.3 Chuỗi nh ng ng i lao đ ng th c tế và chuỗi đ ng v i các ng d ng ậ 5th ed. Ch.11: Dự báo c làm trơn theo lũy th a Trị số điều chỉnh đ ợc thực hiện tại th i điểm t+1 đối với giá trị dự báo đầu tiên là một tổ hợp tuyến tính c a giá trị dự báo tr ớc đó và các sai số điều chỉnh. Do đó, chúng ta có d báo thích nghi Yt b1 cho th i đoạn t+1 là:     Yt b1  Yt a1   Yt  Yt a  1    Yt b  Yt a 0 <  <1 Trong đó Ytb là dự báo thích nghi đ ợc tạo ra b i th i đoạn tr ớc. M rộng biểu th c này, đồng th i sắp xếp lại, ta có ph ơng trình sau:   Yt b1  Yt a1  Yt b  Yt a   (Yt  Yt b ) Trong đó, yếu tố điều chỉnh  th th ng đ ợc chọn là một số nhỏ. Để bắt đầu quá trình, ng giả thiết là Yt a  Yt b . Do đó, ph ơng pháp này có một quá trình tự nhận th c trong đó các sai số dự báo gần nhất đ ợc sử dụng để điều chỉnh các giá trị dự báo trong những th i đoạn tiếp sau. o 11.5 Kết H p Các D Báo Trong nghiên c u thực tế, quy trình phổ biến đ ợc các nhà phân tích chấp nhận là ớc l ợng một số các ph ơng án mô hình, cho chúng trải qua các kiểm định giả thuyết và cuối cùng chọn lấy mô hình nào là “tốt nhất” theo mục tiêu mà mô hình đ ợc dự định. Nếu mục tiêu là để dự báo, cách điển hình (nh đư đ ợc ghi chú tr ớc đây) là để dành một phần c a dữ liệu có đ ợc để thực hiện dự báo sau mẫu, có đ ợc các giá trị dự báo từ các mô hình khác nhau và chọn mô hình nào có khả năng dự báo tốt nhất trong giai đoạn sau mẫu. Trong phần tr ớc, chúng ta đư sử dụng nhiều ph ơng án để dự báo m c tiền Ramu Ramanathan 11 Biên dịch: Thục Đoan Hiệu đính: Cao Hào Thi Ch ơng trình Giảng dạy Kinh tế Fulbright Ph ơng pháp nghiên c u II Bài đọc Nh p môn kinh tế l ng v i các ng d ng ậ 5th ed. Ch.11: Dự báo công và kết luận là mô hình bậc hai là tốt nhất theo quan điểm dự báo. Các mô hình đư đ ợc đánh giá là kém hơn xét theo quan điểm dự báo th ng đ ợc bỏ đi. Tuy nhiên, năm 1969 Bates & Granger đư chỉ ra là các mô hình bị bỏ đi vẫn ch a những thông tin về các động thái rõ nét c a biến phụ thuộc và lập luận rằng việc kết h p d báo từ nhiều mô hình sẽ tốt hơn là từ một mô hình duy nhất. Lấy một ví dụ đơn giản, giả sử f1 và f2 là các giá trị dự báo từ 2 mô hình hoặc ph ơng pháp khác nhau. Để trình bày đơn giản, giả sử chúng là độc lập nhau và có ph ơng sai 2 bằng nhau. Xét giá trị trung bình số học c a 2 giá trị dự báo f = 1 ( f1  f 2 ) . Ph ơng sai c a giá trị dự báo kết hợp f là:  /2, nghĩa là ít hơn ph ơng sai c a mỗi dự báo riêng lẻ. Do đó, rõ ràng là việc kết hợp các giá trị dự báo cũng đáng đ ợc thực hiện. Trong phần ng dụng mục 11.2, ta thấy rằng các mô hình bậc 2, log tuyến tính và nghịch đảo đư cho các giá trị dự báo khá hợp lý. Việc kết hợp các giá trị dự báo có thể hữu ích, nh ng các mô hình khác đư tạo ra các giá trị dự báo rất tồi và do vậy nên đ ợc h y bỏ. 2 2 Trong phần này, chúng ta sẽ thảo luận 1 số ph ơng pháp đối với kết hợp các dự báo và nghiên c u các đặc tính c a việc kết hợp nh thế. đây chúng ta chỉ xét có thể các tổ hợp tuyến tính c a các dự báo. Câu hỏi cần quan tâm là làm sao để xác định các trọng số tối u cho các dự báo khác nhau. Các b ớc nh sau: B ớc 1: B ớc 2: B ớc 3: Dùng dữ liệu trong th i kỳ mẫu để ớc l ợng các mô hình khác nhau. Dự báo các giá trị c a biến phụ thuộc trong th i kỳ mẫu. Dùng các giá trị đư thích hợp hóa và các giá trị thực c a biến phụ thuộc để xây dựng tập các trọng số để kết hợp các dự báo. B ớc 4: Tạo các giá trị dự báo ngoài mẫu từ các mô hình riêng biệt. B ớc 5: Kết hợp các dự báo này bằng cách sử dụng các trọng số đư tìm đ ợc b ớc 3. Nếu các mô hình sẽ đ ợc đánh giá về năng lực dự báo trong th i kỳ hậu mẫu thì chúng ta cần các giá trị thực c a biến phụ thuộc. Chúng tôi trình bày ba ph ơng pháp kết hợp dự báo khác nhau và so sánh giá trị t ơng đối c a chúng. Phân tích trình bày đây đ ợc trích từ một bài nghiên c u c a Granger và Ramanathan năm 1984. Ph ơng pháp A Gọi Yt là giá trị thực tại th i điểm t c a biến phụ thuộc, và ft1, ft2, ..., ftk là các giá trị dự báo đ ợc tạo ra b i k ph ơng pháp dự báo hoặc mô hình khác nhau. Một số dự báo từ các mô hình kinh tế l ợng, một số khác từ các mô hình chuỗi th i gian và cũng có một số từ “ý kiến chuyên gia” c a những nhà phân tích có hiểu biết về động thái c a Y. Một cách cảm tính, ph ơng pháp đ ơng nhiên là tạo ra giá trị trung bình có trọng số c a các giá trị dự báo này, các trọng số sẽ đ ợc xác định từ một đặc điểm tối u nào đó. Do vậy, giá trị dự báo kết hợp sẽ là: f t  1 f t1   2 f t 2  ...   k f tk Trong ph ơng pháp đầu tiên, chúng ta giả thiết rằng tổng các trọng số bằng 1, nghĩa là   i  1. Sai số trong giá trị dự báo tổ hợp là: ut =Yt - ft. Do đó, tổng bình ph ơng c a Ramu Ramanathan 12 Biên dịch: Thục Đoan Hiệu đính: Cao Hào Thi Ch ơng trình Giảng dạy Kinh tế Fulbright Nh p môn kinh tế l Ph ơng pháp nghiên c u II Bài đọc ng v i các ng d ng ậ 5th ed. Ch.11: Dự báo các sai số dự báo là trong đó phép tổng sẽ lấy từ th i đoạn 1 đến T, sao cho các giá trị dự báo và thực tế đều sẵn có. Ph ơng pháp kết hợp “tối u” là chọn các trọng số i sao cho tổng bình ph ơng sai số dự báo là nhỏ nhất. Dễ thấy là các giá trị dự báo có thể đ ợc ớc l ợng bằng cách sử dụng bất kỳ ch ơng trình hồi quy nào. Để thấy điều đó, l u ý là: Yt  f t  ut  1 f t1   2 f t 2  ...   k f tk  ut (11.4) với 1 + 2 + ...+ k = 1 hay k = 1 - 1 - 2 - ... k-1 thay vào ph ơng trình (11.4) ta có: Yt = 1ft1 + 2ft2 + … + k-1ft, k-1 + (1 - 1 - 2 - k-1) + ut Chuyển ftk sang vế trái và đặt thừa số chung, ta có: Yt - ftk = 1( ft1 – ftk) + 2 (ft2 – ftk) + … + k-1 (ft, k-1 – ftk) + ut (11.5) Chúng ta dễ thấy là các giá trị  có thể đ ợc ớc l ợng bằng cách hồi quy Yt - ftk theo ft1 – ftk, ft2 – ftk, ... , ft, k-1 – ftk, không có hằng số trong ớc l ợng. k đ ợc ớc l ợng là 1 -  1   2  ...   k 1 . L u ý là các trọng số đ ợc ớc l ợng có thể dấu âm.     Giá trị trung bình c a sai số dự báo (u t ) do f có bằng 0 không? nghĩa là (1/n) ut  0 ?   u t   (Yt  f t )   (Yt   1 f t1   2 f t 2  ...   k f tk )      (11.6) Giả thiết rằng mỗi mô hình dự báo riêng lẻ đều có sai số dự báo trung bình bằng 0; nghĩa là giả thiết là  (Yt  f ti )  0 ng với mỗi giá trị i. Thì  f ti   Y t . Thay vào ph ơng trình (11.6) ta có:  u  Y  t t   1  Yt   2  Yt  ...   k    Y t = ( Yt )(1   1   2  ...   k )  0 (11.7)    do tổng c a các trọng số đ ợc ớc l ợng bằng 1. Suy ra, điều kiện đ cho sai số tổ hợp dự báo trung bình bằng 0 là mỗi dự báo có sai số dự báo trung bình bằng 0. Tổng quát, không có gì đảm bảo là mỗi dãy dự báo là không bị thiên lệch - nghĩa là chúng không bị dự đoán quá lớn hơn cũng không quá nhỏ hơn, về mặt trung bình. Vì lý do này, giá trị dự báo kết hợp có thể có sai số dự báo trung bình khác không. Ramu Ramanathan 13 Biên dịch: Thục Đoan Hiệu đính: Cao Hào Thi Ch ơng trình Giảng dạy Kinh tế Fulbright Nh p môn kinh tế l Ph ơng pháp nghiên c u II Bài đọc ng v i các ng d ng ậ 5th ed. Ch.11: Dự báo Ph ơng Pháp B Chẳng có gì bất khả xâm phạm về yêu cầu rằng tổng các trọng số trong các dãy giá trị dự báo bằng 1. Giả sử rằng chúng ta không đặt ra hạn chế đó. Chúng ta có thể có đ ợc dãy dự báo kết hợp tốt hơn không ? Câu trả l i là có, với điều kiện tiêu chuẩn để “tốt hơn” là cực tiểu sai số bình ph ơng trung bình c a dự báo. Từ ph ơng trình (11.4) ta thấy rằng quá trình bây gi là lấy hồi qui Y theo f1, f2 ...fk một lần nữa với không có hằng số, nh ng không có ràng buộc. B i vì chúng ta lấy cực tiểu tổng không có ràng buộc c a các sai số bình ph ơng trung bình c a dự báo, giá trị cực tiểu sẽ không lớn hơn trong tr ng hợp ph ơng pháp A. Do vậy, nếu ESSA là tổng bình ph ơng các sai số ớc l ợng trong ph ơng trình (11.5) và ESSB là tổng bình ph ơng các sai số ớc l ợng trong ph ơng pháp B, thì ESSB  ESSA, khoảng dôi sẽ là ESSA - ESSB. Trong tr ng hợp này trung bình c a các sai số kết hợp dự báo có = 0 không? đây ta cũng thấy: u  t   Y 1     t   1      2  ...   k     Nếu mỗi dự báo riêng lẻ có sai số trung bình = 0. Nh ng chỉ trừ khi tình c tổng các trọng số ớc l ợng = 1, còn thì sai số trung bình dự báo sẽ  0. Do đó, mặc dù chúng ta có lợi về MSE, nh ng chúng ta có thể tạo ra một dự báo kết hợp có sai số trung bình  0 ngay cả khi mỗi dự báo riêng lẻ có trung bình các sai số bằng 0. L u ý là nếu bất kỳ một dự báo nào trong số đó bị thiên lệch thì dự báo kết hợp cũng có thể sẽ bị thiên lệch. Có thể có giải pháp tốt nhất cho cả hai thế giới không? nghĩa là, có thể có sai số bình ph ơng trung bình cực tiểu và sai số trung bình = 0, thậm chí nếu một vài dự báo riêng lẻ có trung bình các số  0. Granger và Ramanhan (1984) đư đ a ra một ph ơng pháp dự báo kết hợp nh thế. Điều này sẽ đ ợc mô tả tiếp theo. Ph ơng Pháp C Nếu các dãy dự báo riêng lẻ bị thiên lệch, thì giá trị trung bình có trọng số c a chúng cũng có thể bị thiên lệch. Giả sử chúng ta có thể có đ ợc ớc l ợng c a khoảng thiên lệch này. Thì bằng cách trừ khoảng thiên lệch đ ợc ớc l ợng này chúng ta sẽ có thể có một dự báo không thiên lệch c a biến phụ thuộc, mặc dù một vài dự báo riêng lẻ bị thiên lệch. Đây là động cơ đằng sau ph ơng pháp c a Granger - Ramanathan (GR). Th thuật mẹo đây là cộng thêm một thành phần hằng số vào dự báo và để cho thành phần hằng số đ ợc ớc l ợng sẽ điều chỉnh theo khoảng thiên lệch. Do đó, dự báo cải biến sẽ là: f t   0  1 f t1   2 f t 2  ...   k f tk . Không có ràng buộc nào đối với các giá trị  cả. Sai số dự báo là ut = Yt – ft. Do đó công th c tr thành mô hình hồi quy bội quen thuộc. f t   0  1 f t1   2 f t 2   3 f t 3  ...   k f tk  ut Ramu Ramanathan 14 (11.8) Biên dịch: Thục Đoan Hiệu đính: Cao Hào Thi Ch ơng trình Giảng dạy Kinh tế Fulbright Ph ơng pháp nghiên c u II Bài đọc Nh p môn kinh tế l ng v i các ng d ng ậ 5th ed. Ch.11: Dự báo L u ý là ph ơng pháp B là một tr ng hợp đặc biệt c a mô hình này, với ràng buộc 0 =0, và ph ơng pháp A là tr ng hợp đặc biệt với 0 =0 và 1 + 2 +...+k = 1. Quá trình để đánh giá các trọng số là tiến hành hồi quy Yt theo hằng số ft1, ft2,... và ftk không ràng buộc. B i vì giá trị cực tiểu không ràng buộc thì không lớn hơn cực tiểu có ràng buộc nên ta có ESSC  ESSB  ESSA. Do vậy, ph ơng pháp C là tốt nhất xét theo sai số dự báo bình ph ơng trung bình cực tiểu. Vậy sai số dự báo kết hợp trung bình có bằng 0 hay không? Để trả l i hưy l u ý là:  u^ t = (Yt - ^f t )=  (Yt - ^ 1ft1 - ^ 2ft2 - … - ^ kftk) Nh ng việc cực tiểu hóa sai số dự báo bình ph ơng trung bình (11.9)  u 2 theo sẽ cho ph ơng  trình chuẩn là:       (Yt   0  1 f t1   2 f t 2  ...   k f tk   u t  0 Từ đây suy ra rằng  u t  0 và do vậy, sai số dự báo kết hợp trung bình = 0. L u ý là  chúng ta đư không đặt điều kiện các dãy sai số dự báo riêng lẻ bất kỳ phải có sai số dự báo trung bình bằng 0. Do đó, ph ơng pháp C là tốt nhất b i vì nó cho sai số dự báo bình ph ơng trung bình nhỏ nhất và có dự báo kết hợp không thiên lệch thậm chí nếu các dãy dự báo riêng lẻ bị thiên lệch. Vì lý do này Granger và Ramanathan ch tr ơng là nên bỏ thông lệ trong thực tế là tính trung bình có trọng số c a các ph ơng án dự báo và thay vào đó nên sử dụng kết hợp tuyến tính không ràng buộc bao gồm cả thành phần bằng số. M t S M R ng Đ i V i Kết H p D Báo Chu n. Trong ph ơng pháp hồi quy đối với kết hợp dự báo vừa đ ợc trình bày (ph ơng pháp C), chúng ta ngầm giả định là các sai số trong ph ơng trình (11.8) là độc lập với nhau theo chuỗi với ph ơng sai không đổi. Điều này có thể không thỏa, b i vì các sai số có thể tự t ơng quan hoặc có biểu hiện c a hiệu ng ARCH. Trong những tr ng hợp nh thế, chúng ta có thể áp dụng những kỹ thuật đư đề nghị ch ơng 9 để chỉnh sửa các vấn đề này. Ng i ta cũng có thể nghi ng rằng các trọng số đối với các kết hợp (nghĩa là các giá trị  trong ph ơng trình 11.8) không là hằng số mà thay đổi theo th i gian. L u ý là điều này khác với các sai số bị t ơng quan theo th i gian (t ơng quan chuỗi) hay bị ph ơng sai c a sai số thay đổi (ARCH). Dễ dàng cho phép các trọng số thay đổi theo th i gian nh thế. Cách đơn giản là giả định rằng trong ph ơng trình (11.8),  i   io   i1t với t thể hiện th i gian từ 1 đến n, và i = 0, 1,..., k. Điều này dẫn đến mô hình cải biến: Yt  00   01t  10 f t1  11(tf t1 )  ...   k 0 f tk   k1 (tf tk )  ut Việc phải làm là tạo ra các thành phần t ơng tác, giữa th i gian và mỗi dự báo, và kế đó là đ a các biến mới này vào mô hình trong ph ơng trình (11.8) Ramu Ramanathan 15 Biên dịch: Thục Đoan Hiệu đính: Cao Hào Thi Ch ơng trình Giảng dạy Kinh tế Fulbright Ph ơng pháp nghiên c u II Bài đọc Nh p môn kinh tế l ng v i các ng d ng ậ 5th ed. Ch.11: Dự báo o VÍ D 11.4 Bessler và Brandt (1981) đư kết hợp các dự báo về giá lợn theo quý trong giai đoạn 1976.1 đến 1979.2 từ một mô hình kinh tế l ợng, một mô hình chuỗi th i gian gọi là ARIMA (đ ợc mô tả mục 11.7), và từ các ý kiến chuyên gia. Granger và Ramanathan đư áp dụng riêng từng mô hình trong 3 ph ơng pháp với 16 giá trị quan sát từ tập dữ liệu này và thu đ ợc các trọng số tối u. Sau đó họ mang các ph ơng pháp này vào một kiểm định dự báo hậu mẫu trong th i đoạn 17 đến 24. Họ cũng thực hiện một so sánh trong mẫu với tất cả 24 giá trị quan sát để ớc l ợng các trọng số. Bảng 11.3 cho thấy rằng các ph ơng pháp dự báo ban đầu cho ra các giá trị dự báo có vẻ nh bị thiên lệch, mặc dù các khoảng thiên lệch này không góp phần nhiều vào MSE. Dự báo riêng lẻ tốt nhất là dự báo theo ph ơng pháp chuỗi th i gian ARIMA. Chúng ta cũng l u ý là bất kỳ loại hình dự báo kết hợp nào cũng cải thiện MSE một cách đáng kể. Nh lý thuyết đư dự đoán, ph ơng pháp C cho sai số dự báo trung bình = 0 và MSE thấp nhất. Hơn nữa, nh kiểm định hậu mẫu trong bảng 11.4 cho thấy, các sai số trung bình không còn bằng 0 nữa nếu các trọng số đ ợc ớc l ợng từ các th i đoạn đến 16 đ ợc dùng để dự báo giá cho các th i đoạn từ 17 - 24. Mặc dù ph ơng pháp C luôn tốt hơn các ph ơng pháp kia, việc kết hợp 3 dự báo không luôn luôn tốt hơn việc kết hợp chỉ 2 dự báo thôi. Bảng 11.3 - Các trọng s và các sai s d báo trong m u đ i v i d li u giá l n. Các trọng số Sai số trung bình Tổng bình ph ơng các sai số Hằng số Kinh tế l ợng ARIMA Chuyên gia Kinh tế l ợng -1.71 610.4 – 1.00 – – ARIMA -0.03 420.7 – – 1.00 – Chuyên gia 0.59 522.7 – – – 1.00 Dự báo Đầu tiên Phương pháp kết hợp A (không có hằng số, tổng các trọng số = 1) Cả ba -0.26 334.7 0.00 0.30 0.27 0.43 Kinh tế l ợng và ARIMA -0.35 409.8 0.00 0.19 0.81 0.00 ARIMA và chuyên gia 0.21 360.8 0.00 0.00 0.45 0.55 Chuyên gia và kinh tế l ợng -0.44 344.6 0.00 0.62 0.00 0.38 Phương pháp kết hợp B (không ràng buộc, không hằng số) Cả ba 0.06 331.4 0.00 0.35 0.22 0.43 Kinh tế l ợng và ARIMA 0.11 403.4 0.00 0.26 0.73 0.00 ARIMA và chuyên gia 0.14 360.7 0.00 0.00 0.62 0.38 Chuyên gia và kinh tế l ợng 0.06 337.4 0.00 0.51 0.00 0.48 Cả ba 0.00 319.6 7.57 0.19 0.26 0.38 Kinh tế l ợng và ARIMA 0.00 372.6 11.80 0.03 0.70 0.00 ARIMA và chuyên gia 0.00 325.4 10.65 0.00 0.42 0.34 Phương pháp kết hợp Ramu Ramanathan 16 Biên dịch: Thục Đoan Hiệu đính: Cao Hào Thi Ch ơng trình Giảng dạy Kinh tế Fulbright Chuyên gia và kinh tế l ợng Ph ơng pháp nghiên c u II Bài đọc Nh p môn kinh tế l 0.00 6.80 327.8 ng v i các ng d ng ậ 5th ed. Ch.11: Dự báo 0.36 0.00 0.48 Nguồn: Granger và Ramanathan (1984) o Bảng 11.4 - Các trọng s và các sai s d báo ngoài m u đ i v i d li u giá l n. Sai số trung bình Tổng bình ph ơng các sai số Các trọng số Hằng số Kinh tế l ợng ARIMA Chuyên gia Kinh tế l ợng -0.95 322.8 – 1.00 – – ARIMA 0.78 245.1 – – 1.00 – Chuyên gia -2.13 160.2 – – – 1.00 Dự báo Đầu tiên Phương pháp kết hợp A (không có hằng số, tổng các trọng số = 1) Cả ba -1.14 199.1 0.00 0.47 0.15 0.38 Kinh tế l ợng và ARIMA 0.51 238.6 0.00 0.16 0.84 0.00 ARIMA và chuyên gia 0.32 212.2 0.00 0.00 0.84 0.16 Chuyên gia và kinh tế l ợng -1.47 206.6 0.00 0.55 0.00 0.45 Phương pháp kết hợp B (không ràng buộc, không hằng số) Cả ba -0.59 199.8 0.00 0.50 0.16 0.33 Kinh tế l ợng và ARIMA 1.16 246.1 0.00 0.30 0.68 0.00 ARIMA và chuyên gia 0.56 217.3 0.00 0.00 0.86 0.14 Chuyên gia và kinh tế l ợng -0.94 205.0 0.00 0.59 0.00 0.40 Phương pháp kết hợp C (không ràng buộc, có hằng số) Cả ba -0.86 193.4 3.50 0.45 0.13 0.34 Kinh tế l ợng và ARIMA 0.96 233.5 2.89 0.25 0.66 0.00 ARIMA và chuyên gia -0.32 180.2 7.72 0.00 0.63 0.20 Chuyên gia và kinh tế l ợng -1.17 198.8 3.79 0.51 0.00 0.39 Nguồn: Granger và Ramanathan (1984) Cần nhấn mạnh rằng, một cách tổng quát, kết quả ví dụ có thể không đúng cho các tập dữ liệu khác. Hoàn toàn có khả năng là MSE và sai số trung bình có thể xấu hơn trong th i kỳ hậu mẫu so với th i kỳ trong mẫu. Bohara, Mc.Nown và Bath (1987) đư ch ng minh là trong một số tr ng hợp các dự báo riêng lẻ trong th i kỳ hậu mẫu có thể tốt hơn ph ơng pháp kết hợp dự báo bằng cách sử dụng mô hình C c a Granger - Ramanathan, mặc dù trong giai đoạn trong mẫu ph ơng pháp GR luôn luôn tốt hơn. Các nghiên c u khác cho thấy rằng ph ơng pháp GR cũng sẽ tốt hơn các ph ơng pháp khác trong các tr ng hợp hậu mẫu. Nh Granger (1989a) đư chỉ rõ, việc kết hợp các dự báo chỉ thật sự thích hợp khi các ph ơng pháp khác nhau rất cơ bản đ ợc sử dụng để tạo ra các dự báo, chẳng hạn nh kinh tế l ợng và chuỗi th i gian. Tạp chí Journal of Forecasting (1989) và Internaitonal Journal of Forecasting (1981) đều đư dành riêng một kỳ về kết hợp các dự báo, bao gồm nhiều bài báo hay, một số sử dụng các ph ơng pháp tiên tiến. Ramu Ramanathan 17 Biên dịch: Thục Đoan Hiệu đính: Cao Hào Thi Ch ơng trình Giảng dạy Kinh tế Fulbright Nh p môn kinh tế l Ph ơng pháp nghiên c u II Bài đọc o 11.6 D Báo T Các Mô Hình Kinh Tế L ng v i các ng d ng ậ 5th ed. Ch.11: Dự báo ng: Ph ơng pháp dự báo kinh tế l ợng đầu tiên bao gồm việc xây dựng một mô hình kinh tế l ợng để kết nối biến phụ thuộc với một số biến độc lập đ ợc xem là có tác động ảnh h ng đến nó. Kế đó, mô hình đ ợc đánh giá và sử dụng để tạo ra các dự báo có điều kiện và/hoặc không điều kiện cho biến phụ thuộc. Các mô hình th ng đ ợc xây dựng trên cơ s cả thống kê lẫn kinh tế l ợng. Ví dụ, xét bài toán dự báo doanh số bán điện hằng tháng c a một đơn vị phục vụ. Lý thuyết kinh tế cho ta biết rằng ng i tiêu dùng sẽ lựa chọn những đồ dùng điện (bao gồm thiết bị s i, điều hòa và đun n ớc nóng trong gia đình) trên cơ s m c thu nhập, giá c a thiết bị, và các đặc điểm nhân khác nh thành phần nhân khẩu c a hộ gia đình. M c độ sử dụng thực tế c a các thiết bị này th ng là thay đổi theo th i tiết và các tác động theo mùa khác nh ngày th ng hay cuối tuần, kỳ nghỉ hay kỳ hè, v.v... Do đó, mô hình kinh tế l ợng về doanh số điện sẽ kết nối doanh số điện hàng tháng với các số đo th i tiết nh số ngày lạnh và nóng gặp phải trong tháng (xem ng dụng mục 9.7), các biến giả hàng tháng để xét đến các tác động theo mùa khác, thu nhập, số l ợng thiết bị và giá điện. Để đánh giá các ph ơng pháp và mô hình khác nhau, th ng nhà dự báo tạo ra các giá trị dự báo có điều kiện dựa trên những giá trị đư biết c a các biến độc lập trong th i kỳ hậu mẫu. Các giá trị dự báo có điều kiện cũng th ng đ ợc tạo ra d ới những tình huống khác nhau trong t ơng lai. M c tăng tr ng nhanh về dân số và thu nhập, m c tăng tr ng trung bình về các biến kinh tế/nhân khẩu học, hay m c tăng tr ng thấp. Các ph ơng án khác nhau về thay đổi giá điện cũng đ ợc chọn lựa. Để có đ ợc các thay đổi giá trị dự báo không điều kiện về doanh thu điện, nhà phân tích đơn vị phục vụ cũng phải mô hình hóa động thái c a chính các biến độc lập. Các ph ơng pháp thông dụng là làm thích hợp các xu h ớng th i gian hoặc sử dụng đơn thuần các ph ơng pháp chuỗi th i gian nh đ ợc trình bày trong phần tiếp theo. Sau đây là một số các công th c thông dụng trong dự báo. D Báo Kinh Tế L Quan Chuỗi. ng V i Các Biến Ph Thu c Không Tr Hay Các Sai S Có T ơng Đây là tr ng hợp đơn giản nhất c a dự báo kinh tế l ợng. Mô hình rõ nét nhất có dạng ph ơng trình (11.1) trong đó các sai số có động thái tốt và thỏa mãn giả thiết 3.2 đến 3.7. Một giá trị dự báo cho th i đoạn n + h (nghĩa là, dự báo tr ớc h b ớc) đ ợc cho b i: Yn h   1   2 X n h, 2   3 X n h,3  ...   k X n h,k      (11.10) Nh đư đề cập tr ớc đây, giá trị dự báo là có điều kiện nếu nh các giá trị Xn+h, i giả định là đ ợc cho từ một cơ chế ngoại sinh nào đó. Ramu Ramanathan 18 Biên dịch: Thục Đoan Hiệu đính: Cao Hào Thi Ch ơng trình Giảng dạy Kinh tế Fulbright D Báo Kinh Tế L Quan Theo Chuỗi. Nh p môn kinh tế l Ph ơng pháp nghiên c u II Bài đọc ng v i các ng d ng ậ 5th ed. Ch.11: Dự báo ng V i Các Biến Ph Thu c Không Tr Nh ng Các Sai S Có T ơng Chúng ta đư thấy trong ch ơng 9 rằng nếu các sai số c a mô hình hồi quy là có t ơng quan chuỗi thì chúng ta có thể có đ ợc các dự báo cải tiến bằng cách dùng thông tin đó. Trong ph ơng trình (11.1) giả sử rằng ut tuân theo quá trình tự hồi quy bậc một (t đ ợc giả định là có động thái tốt) ut  t 1   t (11.11) Nếu  là ớc l ợng c a hệ số t ơng quan theo chuỗi, ta có:  u n 1   u n  u n 2   u n1   u n      u nh   u n  2    h   Vì u n có thể rút ra đ ợc từ mẫu, nên ta có thể có đ ợc sai số dự báo h b ớc tốt hơn tr ớc và do đó sẽ có đ ợc dự báo Yn+h cải thiện nh sau: Y n h   1   2 X nh, 2   3 X n h,3  ...   k X n h,k   u n  Trong tr      h  (11.12) ng hợp tổng quát c a một cấu trúc sai số tự hồi quy bậc q ut  1ut 1   2 ut 2  ..   q ut q   t (11.13) Sai số dự báo tr ớc 1 b ớc đ ợc ớc l ợng là: u n1  1 u n   2 u n1  ...   q u n1q        (11.14) Do đó, dự báo tr ớc 1 b ớc Yn+1 là: Y n1   1   2 X n1, 2   3 X n1,3  ...   k X n1,k  u n1       (11.15) Các dự báo tiếp theo sau đó sẽ đ ợc tạo ra theo cách t ơng tự nh vậy. D Báo Kinh Tế L Chuỗi. ng V i Các Biến Ph Thu c Tr Và Các Sai S Có T ơng Quan Công th c kinh tế l ợng tổng quát nhất c a một biến phụ thuộc riêng lẻ là công th c có cả các biến phụ thuộc trễ và các sai số tự t ơng quan: Yt   0  1Yt 1  ...   PYt  P  1 X t1  ...   k X tk  ut ut  1ut 1   2 ut 2  ...   q ut q   t Ramu Ramanathan 19 (11.16) (11.17) Biên dịch: Thục Đoan Hiệu đính: Cao Hào Thi Ch ơng trình Giảng dạy Kinh tế Fulbright Nh p môn kinh tế l Ph ơng pháp nghiên c u II Bài đọc ng v i các ng d ng ậ 5th ed. Ch.11: Dự báo Quy trình ớc l ợng một dạng đơn giản hơn c a mô hình này đ ợc mô tả Mục 10.2. Với các giá trị cho tr ớc Xn+1,1, Xn+1,2, ..., Xn+1,k, giá trị dự báo tr ớc 1 b ớc đ ợc cho b i: Y n 1   0   1 Yn   2 Yn1  ...   p Yn1 p      (11.18) Trong đó: u n1   1 u n   2 u n1  ...   q u n1q (11.19)         Đối với những b ớc xa hơn, quá trình này sẽ đ ợc lập lại với Y n 1 thay vì Yn+1 Ví D Th c Nghi m: D Báo Ng n H n V Doanh S Đi n Enghe & Granger (1986) đư thực hiện một nghiên c u so sánh nhiều mô hình khác nhau và ph ơng pháp luận dự báo khác nhau đối với doanh số điện hằng tháng. Một phần c a nghiên c u c a họ sẽ đ ợc trình bày đây. Muốn biết thêm chi tiết, xin đọc bài báo c a họ. Dữ liệu đề cập đến chuỗi theo tháng từ 1964 đến 1981 California. Việc ớc l ợng đ ợc tính cho 168 th i đoạn (khoảng 1961 - 1977). Các dự báo kiểm định có đ ợc 36 th i đoạn từ 1978 - 1980. Bảng 11.5 trình bày các giá trị ớc l ợng c a 1 trong số các mô hình đ ợc sử dụng, và bảng 11.6 trình bày các giá trị thống kê kiểm định đối với một số loại đặc tr ng c a mô hình. Biến phụ thuộc là l ợng tiêu thụ điện dân dụng cho mỗi khách hàng. CDD và HDD là số ngày mát & nóng, đ ợc định nghĩa trong ví dụ ng dụng mục 9.7. Trong bảng 11.6, RPINC/C là thu nhập trung bình thực và RELCP750 là giá điện trung bình thực. Mô hình còn có các biến giả theo tháng (MAY bị loại bỏ để tránh đa cộng tuyến hoàn toàn). AUTO biểu diễn các thành phần t ơng quan theo chuỗi (các độ trễ 1, 12 và 13 đ ợc sử dụng). Các biến ký hiệu “% Dist” (bảng 11.5) là các xác suất trong phân phối chi-square về phía bên trái c a chi-square quan sát đ ợc (100 trừ đi trừ đi m c ý nghĩa). Những số liệu cao hơn 95% biểu thị m c ý nghĩa 5%. Chỉ có sự t ơng tác giữa CDD và th i gian cũng nh giữa HDD và th i gian là những t ơng tác đáng kể. Engle và Granger đư đánh giá lại mô hình để đ a vào những thành phần t ơng tác này. Các trị dự báo không điều kiện có đ ợc từ mô hình này (ký hiệu là AUTO-B) và một mô hình đơn giản không có t ơng quan theo chuỗi (ký hiệu là OLS-A) đ ợc vẽ trên hình 11.4. Căn bậc hai c a sai số bình ph ơng trung bình (RMSE) đối với dự báo tr ớc một th i đoạn là 15.4 đối với OLS-A và 13.6 đối với AUTO-B. Cả hình vẽ và các giá trị RMSE cho thấy mô hình có các thành phần tự hồi quy có khả năng dự báo tốt hơn. Engle và Granger cũng đư ớc l ợng một loạt các mô hình khác cho m i tiểu bang khác. Việc này đư đ ợc trình bày trong bài báo c a họ. Bảng 11.5 Các ki m định ch n đoán đ i v i Mô hình California Auto-A Ramu Ramanathan Test Stat. d.f. % of Dist. Test Test Dist. 2.749 1 90.269 AUTO1 CHI-SQ 1.998 1 84.254 AUTON CHI-SQ 20 Biên dịch: Thục Đoan Hiệu đính: Cao Hào Thi Ch ơng trình Giảng dạy Kinh tế Fulbright Ph ơng pháp nghiên c u II Bài đọc Nh p môn kinh tế l ng v i các ng d ng ậ 5th ed. Ch.11: Dự báo 18.600 10 95.436 AUTO1-N CHI-SQ 0.898 1 65.668 AUTO MAX CHI-SQ 4.019 1 95.501 YLAGD1 CHI-SQ 2.669 1 89.769 YLAGDN CHI-SQ 9.320 12 32.468 YLAG1-N CHI-SQ 0.627 1 57.186 Y-MAX CHI-SQ 13.765 1 99.979 ARCH1 CHI-SQ 0.308 1 42.153 ARCHN CHI-SQ 19.761 12 92.826 ARCH1-N CHI-SQ 26.913 24 69.147 ARCH1-2N CHI-SQ 1.212 1 72.918 TIME TND CHI-SQ 12.175 2 99.773 9.597 6 85.733 6.368 2 95.859 4.432 3 78.158 GDDMA * TIME, HDDMA * TIME CDD2, HDD2, CDD (1)2 HDD ( -1)2, CDD (2), HDD (-2)2 RELCP250, RELCP500 TIME, D70, T70 7.466 3 94.156 TIME, D72, T72 20.915 3 99.989 TIME, D74, T74 2.7491 1 90.269 AUTO-2 3.8405 3 72.079 AUTO-3, AUTO-6 AUTO-4, Nguồn: Engle & Granger, 1986, in lại với sự cho phép của Viện nghiên cứu Điện lực. Bảng 11.6 Các giá trị cl ng c a mô hình Auto - A cho California Biến phụ thuộc Tổng các phần d bình ph ơng Trung bình c a biến phụ thuộc Độ lệch chuẩn Sai số hồi quy chuẩn R2 R2 hiệu chỉnh Trị thống kê F (22.145) Số quan sát = DELC / C = 11.245 = 394,63 = 64,732 = 8,806 = 0,983 = 0,981 = 403,55 = 168 Nguồn: Engle và Granger, 1986 - In lại với sự cho phép của Viện nghiên cứu Điện lực Ramu Ramanathan 21 Biên dịch: Thục Đoan Hiệu đính: Cao Hào Thi Ch ơng trình Giảng dạy Kinh tế Fulbright o Hình 11.4 So sánh d báo Ph ơng pháp nghiên c u II Bài đọc Nh p môn kinh tế l ng v i các ng d ng ậ 5th ed. Ch.11: Dự báo California. o 11.7 D Báo T Các Mô Hình Chuỗi Th i Gian Nh đư đề cập tr ớc đây, các mô hình kinh tế l ợng ch yếu dựa trên một động thái rõ nét c a các đối t ợng có liên quan đến hệ thống kinh tế. Tuy nhiên một họ các mô hình thay thế khác đ ợc sử dụng rộng rưi, đặc biệt trong dự báo ngắn hạn, đ ợc gọi là các mô hình chuỗi th i gian. Ch yếu, các mô hình này nối kết một biến phụ thuộc với các giá trị c a nó trong quá kh và với các sai số ngẫu nhiên mà có thể có t ơng quan theo chuỗi. Một các tổng quát, các mô hình chuỗi th i gian không dựa trên bất kỳ một động thái kinh tế rõ nét nào. Cho đến cách đây 30 năm, các mô hình chuỗi th i gian đ ợc sử dụng phổ biến nhất trong kỹ thuật và các khoa học vật lý. Tuy nhiên, trong khoảng 2 thập kỷ gần đây, các ph ơng pháp chuỗi th i gian đư đ ợc sử dụng rất rộng rãi trong kinh tế học đặc biệt là trong dự báo ngắn hạn, trong đó các mô hình chuỗi th i gian đư ch ng tỏ là thích hợp hơn so với các mô hình kinh tế l ợng. Trong phần này, chúng tôi giới thiệu sơ l ợc về những vấn đề có liên quan đến ph ơng pháp chuỗi th i gian. Để có tài liệu tốt về các mô hình và dự báo chuỗi th i gian m c độ đại học, xin xem các sách Granger (1989b) và Diebold (2001). Còn tài liệu cấp cao hơn thì xin xem Harvey (1990) và Granger & Newbold (1986). Các chuỗi th i gian th ng đ ợc mô hình hóa dạng tổng (hay tích) c a 3 thành phần: (1) thành ph n xu h ng, (2) thành ph n mùa, và (3) thành ph n ng u nhiên. Do đó, ta có: Yt = Tt + St + ut hay Yt = TtStut Ramu Ramanathan 22 Biên dịch: Thục Đoan Hiệu đính: Cao Hào Thi Ch ơng trình Giảng dạy Kinh tế Fulbright Ph ơng pháp nghiên c u II Bài đọc Nh p môn kinh tế l ng v i các ng d ng ậ 5th ed. Ch.11: Dự báo Trong đó, Y là biến phụ thuộc, T là thành phần xu h ớng, S là thành phần mùa và u là thành phần sai số ngẫu nhiên. Ví dụ về một xu h ớng theo th i gian dạng tuyến tính đơn giản là Tt =  +  t. Trong mục 11.4, nhiều dạng th c xu h ớng khác đư đ ợc thích hợp hóa. Nếu Yt tăng tr ng dạng lũy thừa thì tr ớc tiên nên chuyển sang dạng lôgarit. Nh tên gọi, thành phần mùa là thành phần do hiện t ợng mùa vụ xảy ra th ng xuyên chẳng hạn nh tháng, quý, tuần, ngày, gi , các ngày nghỉ lễ, v.v.... Chúng ta đư thấy nhiều ví dụ trong đó các biến giả chỉ mùa có thể đ ợc dùng để ớc l ợng các dạng th c mùa. Các kỹ thuật rất ph c tạp đư đ ợc xây dựng để ớc l ợng các thành phần này, nh ng tr ớc những năm 1930 các nhà khảo sát đư không quan tâm đến những ph ơng pháp này và đư hình thành cấu trúc khác cho các biến chuỗi th i gian. Phần tiếp theo sẽ trình bày cấu trúc này. Cấu Trúc C a Các Mô Hình Chuỗi Th i Gian CÁC MÔ HÌNH T H I QUY (AR): Mô hình chuỗi th i gian tự hồi quy hoàn toàn (tr ng hợp đặc biệt c a ph ơng trình 11.16) có cấu trúc nh sau: Yt  1Yt 1   2Yt 2  ...   pYt  p  ut (11.20) Trong đó Yt là quan sát th t đối với biến phụ thuộc sau khi trừ đi giá trị trung bình c a chính nó, và ut là thành phần sai số có động thái tốt có trung bình bằng 0 và ph ơng sai không đổi và không t ơng quan với us nếu t  s (khái niệm này gọi là nhi u tr ng white noise). Thành phần hằng số đ ợc bỏ qua vì Yt đ ợc biểu diễn dạng độ thiên lệch khỏi giá trị trung bình. Độc giả sẽ nhận ra ngay rằng đây là tr ng hợp đặc biệt c a mô hình độ trễ có phân phối trong ch ơng 10 và là một tr ng hợp đặc biệt c a ph ơng trình (11.16) với tất cả giá trị s cho bằng 0. Nói cách khác, Yt đ ợc mô hình hóa chỉ với quá kh c a nó và không với các biến độc lập khác. Đây là các mô hình t h i qui, AR và mô hình trong ph ơng trình (11.20) đ ợc gọi là mô hình AR (p), với p là bậc tự hồi quy. CÁC MÔ HÌNH TRUNG BÌNH TR T (MA): Mô hình sau đây gọi là mô hình trung bình tr t - MA bậc q, ký hiệu là MA (q). Yt  vt  1vt 1   2 vt 2  ...   q vt q (11.21) với vt là chuỗi sai số nhiễu trắng. Do đó, Yt là tổ hợp tuyến tính c a các biến ngẫu nhiên nhiễu trắng. Chúng ta đư gặp thành phần sai số này Mục 10.2 CÁC MÔ HÌNH ARMA. Phối hợp giữa các công th c tự hồi quy và trung bình tr ợt tạo ra mô hình ARMA. Do đó, mô hình ARMA (p, q) có dạng tổng quát: Yt = 1Yt-1 + 2Yt-2 +...+ pYt-p + vt - 1vt-1 - 2vt-2 - ... - qvt-q Ramu Ramanathan (11.22) 23 Biên dịch: Thục Đoan Hiệu đính: Cao Hào Thi Ch ơng trình Giảng dạy Kinh tế Fulbright Ph ơng pháp nghiên c u II Bài đọc Nh p môn kinh tế l ng v i các ng d ng ậ 5th ed. Ch.11: Dự báo Hàm T T ơng Quan Và Đ Thị T ơng Quan Xét hệ số t ơng quan r(s) giữa ut và ut-s đối với những giá trị c a s từ 0 đến t-1. Hàm này gọi là hàm tự t ơng quan. Định nghĩa hàm tự t ơng quan nh sau: r (s)  Cov(u t , u t s )  Cov(u t , u t s ) E(u t u t s )  Var (u t ) E(u 2t ) nó có thể đ ợc ớc l ợng bằng hệ số t ơng quan c a mẫu giữa ut và ut-s. Đ thị t ơng quan là đồ thị c a r(s) theo s, với s = 0, 1, ..., t-1. Nó là một chỉ dẫn hữu ích để xác định m c độ t ơng quan c a thành phần sai số (ut) với các sai số trong quá kh ut-1, ut-2,... Trong phụ lục 9A cho thấy rằng trong tr ng hợp c a quá trình tự hồi quy bậc nhất AR(1) đ ợc cho b i ph ơng trình (9.2), hàm tự t ơng quan có dạng r(s) = s. Đồ thị t ơng quan c a AR(1) đ ợc trình bày trong hình 11.5 với  =0.3, 0.6 = 0.3, 0.6 và 0.9 và s =1 tới 10. Hình 11.6 trình bày t ơng tự nh ng với các giá trị âm c a . L u ý rằng r(s) là độc lập với t. Hơn nữa, nếu  < 1 thì ph ơng sai c a ut sẽ là xác định (đư ch ng minh trong phụ lục 9A). Do đó, quá trình AR(1) là dừng với điều kiện là trị tuyệt đối c a hệ số tự t ơng quan  không v ợt quá 1. Nếu  âm, r(s) sẽ đổi dấu. Nếu  lớn thì đồ thị t ơng quan c a AR(1) sẽ giảm dần theo th i gian, còn nếu  nhỏ thì hàm sẽ giảm nhanh đến 0. Tính hữu ích c a hàm tự t ơng quan và đồ thị t ơng quan sẽ đ ợc trình bày kỹ hơn phần sau c a ch ơng này. Tính D ng Trong ch ơng này, chúng ta tự hạn chế trong tr ng hợp mà hàm tự t ơng quan r(s) là độc lập với t, th i đoạn mà các t ơng quan c a phần d hiện tại và quá kh đ ợc đo, và chỉ phụ thuộc vào khoảng cách (s) giữa th i đoạn t và th i đoạn (t - s) mà ng i ta tính t ơng quan. Hơn nữa, ut đ ợc giả định là có ph ơng sai hữu hạn. Nh đư ghi chú trong mục 10.10, đặc tính này đ ợc gọi là tính dừng, và bất kỳ chuỗi th i gian nào tuân theo điều này sẽ đ ợc gọi là chuỗi th i gian dừng. Do vậy, quá trình mà tạo ra các nhiễu rối ngẫu nhiên là không biến động theo th i gian. Khi có tính dừng, Var (ut-s) và Var (ut) là nh nhau. Granger (1989a) và Diebold (2001) trình bày chi tiết hơn về đồ thị t ơng quan, tính dừng và các công th c tự hồi quy. Ramu Ramanathan 24 Biên dịch: Thục Đoan Hiệu đính: Cao Hào Thi Ch ơng trình Giảng dạy Kinh tế Fulbright Nh p môn kinh tế l Ph ơng pháp nghiên c u II Bài đọc ng v i các ng d ng ậ 5th ed. Ch.11: Dự báo ( > 0) o Hình 11.5 Đ thị t ơng quan v i mô hình AR (1)  = 0.9 r(s) 1.0 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0.0 - - -  = 0.6 -----  = 0.3 s 1 2 3 4 5 6 7 8 9 10 Hình 11.6 Đ thị t ơng quan v i mô hình AR (1)( < 0) CÁC MÔ HÌNH KHÔNG D NG, SAI PHÂN HÓA VÀ ARIMA: Chúng ta vừa thấy điểm dừng có đặc tính là t ơng quan giữa một biến tại th i đoạn t (Yt) và giá trị c a nó th i đoạn s (Ys) chỉ phụ thuộc vào khoảng cách (t - s) giữa hai th i đoạn. Một chuỗi dừng có giá trị trung bình là hằng số (không nhất thiết = 0) và ph ơng sai không đổi theo th i gian. Quá trình tạo ra chuỗi này là không biến động theo th i gian. Tuy nhiên, hầu hết các chuỗi trong kinh tế có tính không d ng b i vì chúng tăng tr ng dần theo th i gian. Ramu Ramanathan 25 Biên dịch: Thục Đoan Hiệu đính: Cao Hào Thi Ch ơng trình Giảng dạy Kinh tế Fulbright Ph ơng pháp nghiên c u II Bài đọc Nh p môn kinh tế l ng v i các ng d ng ậ 5th ed. Ch.11: Dự báo Chẳng hạn, nếu Yt có xu h ớng theo th i gian dạng tuyến tính hay lũy thừa thì nó sẽ không dừng. Việc ớc l ợng c a quá trình ARMA đòi hỏi Yt phải một chuỗi dừng. Trong tr ng hợp nh thế ta phải làm gì? Hầu hết các chuỗi th i gian không dừng đều có thể đ ợc chuyển thành dạng dừng thông qua quá trình sai phân hóa. Xét một xu h ớng tuyến tính có dạng Yt =  + t. Sai phân b c nhất c a Yt đ ợc định nghĩa là: Yt = Yt Yt-1. Ta thấy: Yt =  +  t –  -  (t-1) =  là hằng số và do đó nó có tính dừng. Do đó, xu h ớng tuyến tính có thể đ ợc loại bỏ bằng cách lấy sai phân một lần. Nếu một chuỗi tăng tr ng theo lũy thừa với m c tăng không đổi, ln(Yt) sẽ có xu h ớng tuyến tính và có thể lấy sai phân. Dễ dàng ch ng minh đ ợc là xu h ớng bậc 2 có thể đ ợc loại bỏ bằng cách lấy sai phân 2 lần. Sai phân b c hai (ký hiệu là 2Y) đ ợc định nghĩa là sai phân bậc nhất c a sai phân bậc nhất. Do đó: 2Yt  (Yt  Yt 1 )  (Yt 1  Yt 2 )  Yt  2Yt 1  Yt 2 (11.23) Một dạng khác mà trong đó tính không dừng th ng xuất hiện đó là tính mùa. Tính không dừng trong các chuỗi theo tháng và theo quý th ng có thể đ ợc loại bỏ bằng cách lấy sai phân thích hợp: 4 = Yt – Yt-4 đối với dữ liệu theo quý và 12 = Yt – Yt-12 đối với dữ liệu theo tháng. o BÀI T P TH C NGHI M 11.3 a) Ch ng minh rằng xu h ớng bậc hai: Yt =  +  t +  t2 có thể đ ợc loại bỏ bằng cách lấy sai phân bậc hai b) Ch ng minh rằng sai phân theo quý: 4 = Yt - Yt-4 cũng loại bỏ đ ợc xu h ớng tuyến tính, và t ơng tự với 12. Giả sử rằng, một chuỗi th i gian không dừng có thể đ ợc chuyển thành một chuỗi dừng bằng cách lấy sai phân d lần. Thì chuỗi đó đ ợc gọi là tích h p b c d và đ ợc viết là I(d). Chuỗi dừng do sai phân sau đó sẽ có thể đ ợc mô hình hóa theo ARMA (p, q). Trong tr ng hợp này quá trình tạo ra chuỗi Yt đ ợc gọi là trung bình tr t tích h p t h i quy, và mô hình là mô hình ARIMA, ký hiệu ARIMA (p, d, q). cL ng và D Báo V i Mô Hình Arima Box & Jenkins (1970) đề xuất một ph ơng pháp cụ thể cho mô hình hóa chuỗi th i gian, bao gồm 3 giai đoạn: 1. Nh n d ng, xác định p, d, q 2. c l ng, bao gồm việc ớc l ợng các tham số c a ph ơng trình (11.22) trong đó vế trái là chuỗi đ ợc lấy sai phân d lần. Ramu Ramanathan 26 Biên dịch: Thục Đoan Hiệu đính: Cao Hào Thi Ch ơng trình Giảng dạy Kinh tế Fulbright Ph ơng pháp nghiên c u II Bài đọc Nh p môn kinh tế l ng v i các ng d ng ậ 5th ed. Ch.11: Dự báo 3. Ki m tra ch n đoán, bao gồm việc áp dụng các kiểm định khác nhau để xem mô hình ớc l ợng có thích hợp với dữ liệu một cách thỏa đáng hay không. Nếu mô hình ch a thích hợp thì lặp lại quá trình. NH N D NG: B i vì hầu hết các chuỗi th i gian trong kinh tế thay đổi theo th i gian một cách có hệ thống, b ớc đầu tiên c a giai đoạn nhận dạng là chọn d, số lần lấy sai phân để làm cho nó xấp xỉ dừng. Đồ thị vẽ chuỗi theo th i gian th ng cho thấy ch ng c về bản chất c a chuỗi. Nếu chuỗi biểu thị sự tăng tr ng theo lũy thừa, thì đầu tiên hãy lấy lôgarit và vẽ nó theo th i gian. Nếu rõ ràng là có xu h ớng tuyến tính, hãy lấy sai phân chuỗi (hay log c a nó) một lần và vẽ chuỗi đư lấy sai phân. Nếu vẫn thể hiện xu h ớng, có thể cần lấy sai phân lần th hai. Chuỗi th i gian về kinh tế hiếm khi cần phải lấy sai phân hơn hai lần. Cách th hai để nhận ra xem có cần thiết phải lấy sai phân là tính hàm tự t ơng quan (ACF) đư đ ợc định nghĩa tr ớc đây và vẽ đồ thị t ơng quan. Đồ thị t ơng quan là đồ thị c a các hệ số t ơng quan giữa một chuỗi và các giá trị c a nó trong quá kh . Nếu đồ thị này giảm từ từ (nh là  =0.9 trong hình 11.4) thì có chỉ định phải lấy sai phân. Tiếp theo vẽ đồ thị t ơng quan c a các sai phân bậc nhất. Nếu đồ thị này cũng giảm từ từ, thì có chỉ định phải lấy sai phân bậc hai. Tính không dừng do các ảnh h ng mùa đ ợc xử lý bằng cách tách mùa cho chuỗi. Cách đơn giản để tách thành phần mùa trong một chuỗi dữ liệu tháng là lấy sai phân Yt Yt-12. Hoặc, ta lấy hồi quy Yt theo các biến giả theo mùa và sau đó lấy phần d c a ph ơng trình đư đ ợc thích hợp hóa, với các ảnh h ng mùa đư bị loại ra. Các ph ơng pháp ph c tạp khác đ ợc trình bày trong Granger (1989a), Granger & Newbold (1986) và Diebold (2001). Nếu các ảnh h ng mùa xuất hiện, ACF sẽ có “đỉnh nhọn” những khoảng đều đặn (xem hình11.7 minh họa về dữ liệu tháng). Sai phân Yt - Yt-12 th ng loại bỏ các ảnh h ng mùa và xu h ớng tuyến tính (xem hình 11.8 minh họa cho cùng một chuỗi theo tháng). Các chọn lựa ban đầu về bậc c a tự hồi quy và các thành phần trung bình tr ợt (p và q) th ng đ ợc thực hiện đồng th i. Đối với những giá trị độ trễ lớn (ký hiệu là k), ACF lý thuyết c a mô hình AR (p) sẽ xấp xỉ dạng Apk (với –1 <  <1). Nếu  là d ơng, thì ACF sẽ giảm dần (xem hình 11.5). Nếu  là âm, thì hàm số sẽ đ ợc bao b i một cặp đ ng cong, nh trong hình 11.9. Với mô hình MA (q) đồ thị t ơng quan về lý thuyết là bằng 0 đối với các độ trễ lớn hơn q nh ng không có dạng cụ thể tr ớc q (xem hình 11.10) Đồ thị t ơng quan ớc l ợng có thể dùng nh một chỉ dẫn để chọn giá trị q. Nếu đồ thị t ơng quan vẫn duy trì gần 0 sau một độ trễ cụ thể nào đó, thì độ trễ đó sẽ là lựa chọn tốt cho giá trị q. Để chọn giá trị ban đầu cho p, sử dụng một hàm khác gọi là hàm t t ơng quan riêng ph n (PACF) và đồ thị đi kèm gọi là đồ thị t ơng quan riêng phần. Giả sử chúng ta thích hợp hóa một mô hình tự hồi quy bậc nhất có dạng: Ramu Ramanathan 27 Biên dịch: Thục Đoan Hiệu đính: Cao Hào Thi Ch ơng trình Giảng dạy Kinh tế Fulbright Ph ơng pháp nghiên c u II Bài đọc Nh p môn kinh tế l ng v i các ng d ng ậ 5th ed. Ch.11: Dự báo o Hình 11.7 Đ thị t ơng quan đ i v i d li u doanh s bán đi n theo tháng o Hình 11.8 Đ thị t ơng quan đ i v i d li u sai phân 12 tháng Yt = a11 Yt-1 + ut và ớc l ợng a11 bằng OLS (thành phần hằng số đ ợc bỏ qua bằng cách lấy Yt là độ lệch khỏi giá trị trung bình c a chuỗi). Tiếp theo, chúng ta ớc l ợng mô  hình AR (2) có dạng Yt = a21Yt-1 + a22Yt-2 + ut và thu đ ợc a 22 . Bằng cách tiến hành này  chúng ta có thể thu đ ợc a kk là hệ số hồi qui ớc l ợng c a Yt-k khi mô hình tự t ơng  quan bậc k đ ợc ớc l ợng. Đồ thị a kk là đồ thị t ơng quan riêng phần. Nó là t ơng quan giữa Yt và Yt-k sau khi ảnh h ng c a các Y khác đư đ ợc loại bỏ. Đồ thị t ơng quan riêng phần về lý thuyết có đặc tính là nếu bậc c a tự hồi quy là p thì akk = 0 với mọi k > p. Ramu Ramanathan 28 Biên dịch: Thục Đoan Hiệu đính: Cao Hào Thi Ch ơng trình Giảng dạy Kinh tế Fulbright Ph ơng pháp nghiên c u II Bài đọc o Hình 11.9 Đ thị t ơng quan Nh p môn kinh tế l ng v i các ng d ng ậ 5th ed. Ch.11: Dự báo Hình 11.10 Đ thị t ơng quan đ i v i AR (p) đ i v i MA (q) Do đó, đồ thị t ơng quan riêng phần đ ợc ớc l ợng có thể đ ợc sử dụng nh một chỉ dẫn để chọn giá trị p. Nếu đồ thị tự t ơng quan riêng phần vẫn duy trì gần 0 sau một độ trễ cụ thể nào đó, thì độ trễ đó sẽ là lựa chọn tốt cho p. H ớng dẫn để nhận dạng mô hình chuỗi th i gian sơ bộ có thể đ ợc tóm tắt nh sau: 1. Nếu đồ thị tự t ơng quan còn lại gần bằng 0 sau một độ trễ nào đó, q chẳng hạn, thì sự lựa chọn thích hợp cho bậc c a MA là q. 2. Nếu đồ thị tự t ơng quan riêng phần còn lại gần 0 sau một độ trễ nào đó, p chẳng hạn, thì sự lựa chọn thích hợp cho bậc c a AR là p. 3. Nếu hai điều trên không xảy ra nh ng cả hai đồ thị rốt cục lại là giảm tới 0, chúng ta có thể bắt đầu với một mô hình ARMA (1,1) đơn giản. CL NG: Quy trình ớc l ợng các tham số c a mô hình chuỗi th i gian khá ph c tạp và gồm cả việc giải hệ ph ơng trình phi tuyến. Có nhiều ch ơng trình máy tính có thể tính đồ thị t ơng quan và đồ thị t ơng quan riêng phần đ ợc sử dụng để nhận dạng mô hình, và sau đó tự động thực hiện quá trình ớc l ợng (EViews, FORECAST MASTER, FORECAST PRO, TSP, MicroTSP, v.v....). KI M TRA CH N ĐOÁN: Giai đoạn kiểm tra chẩn đoán bao gồm việc cho mô hình ớc l ợng chịu các loại kiểm định khác nhau để đảm bảo là nó thích hợp một cách thỏa đáng với dữ liệu. Cách tốt nhất để khảo sát xem một mô hình có thích hợp hay không với dữ liệu là tiến hành kiểm ch ng hậu mẫu, nghĩa là, để dành một phần c a mẫu (không sử dụng để ớc l ợng) để dự báo kiểm định và sau đó đem so sánh các giá trị dự báo với giá trị đư biết c a Y. Các trị thống kê tóm tắt th ng đ ợc sử dụng là sai số bình ph ơng trung bình và tiêu chí thông tin Akaike (xem Mục 4.3). Một cách đơn giản khác là làm thích hợp mô hình quá m c, nghĩa là thích hợp hóa một mô hình có bậc hơi cao hơn và sau đó kiểm định xem các tham số dôi thêm có khác 0 một cách đáng kể không. Trong mọi tr ng hợp, nếu mô hình thích hợp tốt với dữ liệu, thì phần d từ mô hình (trong ph ơng trình 11.22) sẽ là nhiễu trắng. Qui trình thông th ng là tính phần d và hàm tự t ơng quan c a chúng và sau đó khảo sát xem có phải các phần d xấp xỉ một Ramu Ramanathan 29 Biên dịch: Thục Đoan Hiệu đính: Cao Hào Thi Ch ơng trình Giảng dạy Kinh tế Fulbright Nh p môn kinh tế l Ph ơng pháp nghiên c u II Bài đọc ng v i các ng d ng ậ 5th ed. Ch.11: Dự báo chuỗi nhiều trắng. Box và Pierce (1970) đư đề xuất một kiểm định chính th c cho việc này. Qui trình là tính trị th ng kê Box - Pierce. Q  n  rk k K 2 (11.24) k 1  Với rk là tự t ơng quan bậc k c a các phần d ( v t ), n là số quan sát, và K là giá trị đ ợc chọn tr ớc c a các tự t ơng quan (chẳng hạn, 20 hay cao hơn). Nếu chuỗi phần d là nhiễu trắng, thì Q sẽ có phân phối chi - square, với K - p - q bậc tự do. Nếu Q lớn hơn giá trị chuẩn c a chi-square, thì chúng ta kết luận là chuỗi phần d không là nhiễu trắng. Một kiểm định gần đây đ ợc sử dụng phổ biến là c a Ljung & Box (1978). Trị th ng kê ki m định Ljung - Box cho b i  rk 2  LJB = n' (n'+2)    k 1   n'k  k K (11.25) Trong đó n' = n - d là số các quan sát đ ợc sử dụng sau khi chuỗi đ ợc lấy sai phân d lần. D ới giả thiết không cho rằng các phần d thực chất là nhiễu trắng, LJB có phân phối chi-square với độ tự do là K-p-q. Tiêu chuẩn để chấp nhận hay loại bỏ trong kiểm định t ơng tự nh trong kiểm định Box-Pierce. D BÁO: B ớc cuối cùng là thực hiện việc dự báo thật sự. Chúng ta thấy từ ph ơng trình (11.22) rằng giá trị dự báo tr ớc một th i đoạn đ ợc cho b i (cho vn+1 tiến đến 0): Y n1   1 Yn   2 Yn1  ...   p Yn1 p     (11.26)   1 v n   2 v n 1  ...   q v n 1 q          Nếu chuỗi phải đ ợc lấy sai phân để làm cho nó dừng, thì trị dự báo là Y n1  Y n1  Y n    từ đó Y n 1 sẽ đ ợc tính ra là Yn   Y n1 . Nếu chuỗi đ ợc lấy sai phân 2 lần, thì từ ph ơng trình (11.23) ta có:  Yn1  2Yn  Yn1  2Yn1 Ramu Ramanathan 30 Biên dịch: Thục Đoan Hiệu đính: Cao Hào Thi Ch ơng trình Giảng dạy Kinh tế Fulbright Ph ơng pháp nghiên c u II Bài đọc Nh p môn kinh tế l Hình 11.11. Nhu c u tổng c ng c a Năng l ng v i các ng d ng ậ 5th ed. Ch.11: Dự báo ng h th ng Ví D Th c Nghi m: D Báo Doanh S Đi n Hằng Tháng Gurel (1987) đư thực hiện một nghiên c u so sánh về một số các ph ơng pháp khác nhau để dự báo nhu cầu năng l ợng hằng tháng c a hệ thống c a Công ty th y điện Ontario; một trong những ph ơng pháp này là ph ơng pháp Box-Jenkins đ ợc mô tả đây. Hình 11.11 là đồ thị c a nhu cầu tổng năng l ợng hệ thống trong th i kỳ, từ tháng 1/1970 đến tháng 4/1984. Đồ thị cho thấy cả tính mùa mạnh lẫn xu h ớng tăng dần. Tiêu chuẩn AIC và căn bậc hai sai số bình ph ơng trung bình (RMSE) đ ợc trình bày đây cho 4 mô hình ARMA khác nhau. Bậc (1, 1) (4, 1) (1, 4) (0, 4) Ramu Ramanathan ARMA 1.930 1.927 1.926 1.924 AIC 320 312 311 311 RMSE 31 Biên dịch: Thục Đoan Hiệu đính: Cao Hào Thi Ch ơng trình Giảng dạy Kinh tế Fulbright Ph ơng pháp nghiên c u II Bài đọc Hình 11.12 D báo Box - Jerkins v Năng l Nh p môn kinh tế l ng v i các ng d ng ậ 5th ed. Ch.11: Dự báo ng h th ng ARMA (0, 4) là mô hình tốt nhất, nh ng Gunel đư tìm ra tính mùa mạnh đ ợc biểu thị b i ACF. Để loại bỏ tính không dừng do hiệu ng mùa, Gurel hồi quy chuỗi năng l ợng theo một hằng số và 11 biến giả theo tháng và tính các phần d . Các phần d sau đó đ ợc mô hình hóa bằng cách sử dụng ph ơng pháp Box-Jerkins. ARIMA (0, 1, 4) rõ ràng cho thấy là trội hơn các ph ơng án khác mà tác giả đư thử. Các trị dự báo hậu mẫu đ ợc thực hiện đến tháng 6/1985. Hình 11.12 là một so sánh c a một số các mô hình khác nhau. Mặc dù đồ thị không biểu thị rõ, mô hình này (ký hiệu BJ7 trong đồ thị) dự báo tốt. Các số đo thống kê cũng cho thấy rằng mô hình không có t ơng quan chuỗi và sai số dự báo nhỏ nhất. TÓM T T Một trong các ng dụng ch yếu c a mô hình kinh tế l ợng là để dự báo hay dự đoán. Có hai nhóm ph ơng pháp dự báo: Kinh tế lượng và chuỗi th i gian. Dự báo kinh tế l ợng đặt cơ s trên mô hình hồi quy để nối kết một (hay nhiều) biến phụ thuộc với một số biến độc lập. Dự báo chuỗi th i gian nối kết biến phụ thuộc với các giá trị c a nó trong quá kh và cố gắng sử dụng mối quan hệ này để dự báo biến phụ thuộc. Một môi tr ng dự báo bao gồm ba th i đoạn. Một ng i khảo sát sử dụng một mẫu các quan sát và ớc l ợng mô hình. Các giá trị dự báo c a biến phụ thuộc trong th i kỳ trong mẫu này còn đ ợc gọi là các giá trị thích hợp hóa. Các giá trị dự báo ngoài mẫu có thể là kiểm định hay tiên nghiệm. Dự báo kiểm định là đối với giai đoạn mà trong đó Ramu Ramanathan 32 Biên dịch: Thục Đoan Hiệu đính: Cao Hào Thi Ch ơng trình Giảng dạy Kinh tế Fulbright Ph ơng pháp nghiên c u II Bài đọc Nh p môn kinh tế l ng v i các ng d ng ậ 5th ed. Ch.11: Dự báo các giá trị thực tế c a biến phụ thuộc và độc lập đều đư biết. Các giá trị dự báo nh thế th ng đ ợc so sánh với giá trị thực tế để đánh giá năng lực dự báo c a mô hình. Các dự báo tiên nghiệm là dự báo cho t ơng lai với các giá trị c a biến độc lập đ ợc dự báo từ các mô hình khác. Dự báo có thể là có điều kiện hoặc không điều kiện. Khi các giá trị c a các biến độc lập là biết tr ớc thì ta có dự báo có điều kiện. Dự báo không điều kiện đ ợc tạo ra khi các giá trị c a các biến ngoại sinh không đ ợc biết tr ớc mà là đ ợc tạo ra từ bản thân mô hình hay từ một mô hình hỗ trợ khác. Việc đánh giá năng lực dự báo c a một mô hình đ ợc thực hiện theo một số cách. Đầu tiên, chúng ta lấy ra một phần c a mẫu và không sử dụng chúng cho mục đích ớc l ợng. Kế đến, chúng ta tạo ra các dự báo cho mẫu đ ợc lấy ra (đây là dự báo kiểm định) và tính sai số dự báo và tổng bình ph ơng sai số dự báo (ESS). Giá trị này có thể đ ợc dùng để tính các trị thống kê để lựa chọn mô hình đ ợc trình bày trong bảng 4.3. Một mô hình có các giá trị thấp hơn hầu hết các trị thống kê tiêu chuẩn thì đ ợc xem là trội hơn. Hơn nữa, chúng ta tiến hành hồi quy các giá trị dự báo theo 1 hằng số và giá trị thực tế. Nếu dự báo là hoàn hảo, chúng ta sẽ kỳ vọng là thành phần hằng số ớc l ợng sẽ gần bằng 0 và thành phần độ dốc ớc l ợng gần bằng 1. Làm Thích hợp bằng đư ng xu hướng là một kỹ thuật đ ợc sử dụng phổ biến để diễn tả biến phụ thuộc c a một hàm chỉ theo th i gian. Dạng hàm nhận đ ợc có thể là tuyến tính, bậc hai, log tuyến tính, nghịch đảo, tuyến tính log, log-hai lần hay logistic. Một nhà quan sát mà chỉ quan tâm đến xu h ớng rõ nét c a một chuỗi th i gian hơn là đến sự biến động xung quanh xu h ớng đó thì có thể làm trơn dữ liệu bằng cách sử dụng trị trung bình c a một số các thành phần liên tiếp nhau (gọi là trung bình trượt) hoặc làm trơn theo lũy thừa, nghĩa là tạo ra một trung bình có trọng số c a các giá trị hiện tại và quá kh c a chuỗi, các trọng số giảm dần theo lũy thừa khi chúng ta lùi về quá kh . Kỹ thuật này có thể đ ợc sử dụng đối với các sai số dự báo để có đ ợc các dự báo thích nghi. Khi nhiều ph ơng án mô hình có dấu hiệu là tạo ra đ ợc các giá trị dự báo khá tốt, thì tốt hơn ta nên kết hợp các dự báo hơn là chọn lấy một mô hình tốt nhất và bỏ các mô hình khác. Ph ơng pháp tối u để kết hợp dự báo là lấy hồi quy (sử dụng dữ liệu c a mẫu hay dữ liệu giai đoạn kiểm định) các giá trị thực tế theo một hằng số và các trị dự báo đ ợc tạo ra từ các ph ơng án mô hình. Các hệ số ớc l ợng sau đó đ ợc dùng nh các trọng số đối với dự báo kết hợp. Trong th i kỳ mẫu, trị dự báo kết hợp có tổng sai số bình ph ơng nhỏ nhất, với sai số dự báo bình ph ơng bằng 0, ngay cả khi các dự báo riêng lẻ bị thiên lệch. Trong các mô hình kinh tế l ợng, các trị dự báo đ ợc tạo ra bằng cách thay các giá trị dự báo hay giả định cho các biến độc lập. Nếu có t ơng quan chuỗi trong các phần d , các sai số có thể đ ợc mô hình hóa với quá trình tự hồi quy và thông tin đ ợc dùng để thu đ ợc các dự báo có hiệu quả hơn. Ramu Ramanathan 33 Biên dịch: Thục Đoan Hiệu đính: Cao Hào Thi Ch ơng trình Giảng dạy Kinh tế Fulbright Ph ơng pháp nghiên c u II Bài đọc Nh p môn kinh tế l ng v i các ng d ng ậ 5th ed. Ch.11: Dự báo Nh đư đề cập tr ớc đây, các mô hình chuỗi th i gian nối kết một biến phụ thuộc với các giá trị c a nó trong quá kh . Một chuỗi th i gian tự hồi quy hoàn toàn (Mô hình AR) sẽ nối kết biến phụ thuộc với các giá trị c a nó trong quá kh với các sai số nhiễu trắng. Mô hình trung bình tr ợt (Mô hình MA) nối kết một biến phụ thuộc với một tổ hợp tuyến tính c a các thành phần sai số nhiễu trắng. Mô hình ARMA tổ hợp các đặc tính c a AR và MA vào trong một mô hình. Đồ thị tương quan là một đồ thị hữu ích để giúp nhận ra các dạng th c trong mối t ơng quan giữa các chuỗi. Nó vẽ hàm tự tương quan, nghĩa là cho hệ số t ơng quan giữa các giá trị c a một chuỗi tại th i gian t và tại t-s với các giá trị s khác nhau. Đặc tính dừng có tính chất là chuỗi có trị trung bình và ph ơng sai không đổi theo th i gian, và t ơng quan giữa một biến tại th i gian t và tại s (t  s) chỉ tùy thuộc vào khoảng cách t-s giữa 2 th i đoạn. Một chuỗi không dừng th ng có thể đ ợc lấy sai phân (bằng cách tính sự thay đổi giữa một th i đoạn và th i đoạn kế tiếp) để làm cho nó dừng. Đôi khi có thể phải tiến hành lấy sai phân nhiều lần hoặc chuyển sang dạng log tr ớc khi lấy sai phân. Một xu h ớng tuyến tính có thể đ ợc loại bỏ bằng cách lấy sai biệt 1 lần, xu h ớng bậc hai có thể đ ợc loại bỏ bằng cách lấy sai phân 2 lần, v.v.... Dữ liệu theo quý và tháng th ng biểu hiện các tác động mùa. Nó có thể đ ợc loại bỏ bằng cách sai phân bậc 4 hay 12, nghĩa là Yt - Yt-4 hay Yt - Yt-n. Các mô hình ARIMA là những mô hình đ ợc lấy sai phân bậc nhất nhiều lần để tạo ra tình trạng dừng và sau đó lấy một mô hình ARMA để thích hợp chúng. Việc ớc l ợng một mô hình chuỗi th i gian bao gồm 3 giai đoạn: (1) Nhận dạng, (2) ớc l ợng và (3) Kiểm định chẩn đoán. Nhận dạng là quá trình xác định bậc c a sai phân, c a mô hình tự hồi quy và c a mô hình trung bình tr ợt. Các đồ thị t ơng quan và t ơng quan riêng phần đ ợc dùng để nhận dạng các mô hình. Kiểm định chẩn đoán là quá trình cho mô hình trải qua kiểm định để xem nó có thích hợp một cách thỏa đáng hay không? Hai kiểm định th ng đ ợc dùng đây là Box - Pierce và Ljung - Box. Một khi mô hình đư đ ợc đánh giá là phù hợp, các dự báo sẽ đ ợc tạo ra từ mô hình đ ợc ớc l ợng. Ramu Ramanathan 34 Biên dịch: Thục Đoan Hiệu đính: Cao Hào Thi Ch ơng trình Giảng dạy Kinh tế Fulbright Ph ơng pháp nghiên c u II Bài đọc Nh p môn kinh tế l ng v i các ng d ng ậ 5th ed. Ch.11: Dự báo Thu t ng : : Sai số phần trăm tuyệt đối : Dự báo thích nghi : Các mô hình ARIMA : Các môhình ARMA : Hàm tự t ơng quan : Trung bình tr ợt tích hợp tự hồi quy. : Các mô hình tự hồi quy : Trị thống kê Box - Pierce : Dự báo kết hợp : Dự báo có điều kiện : Đồ thị t ơng quan : Tách mùa : Tách xu h ớng : Kiểm định chẩn đoán : Lấy sai phân : Dự báo kinh tế l ợng : ớc l ợng : Dự báo tiên nghiệm : Làm trơn theo lũy thừa : Dự báo kiểm định : Sai phân bậc nhất : Giá trị đ ợc làm thích hợp : Dự báo : Nhận dạng : Dự báo trong mẫu : Đ ợc tích hợp bậc d, I(d) : Trị thống kê kiểm định Ljing-Box : Sai số phần trăm tuyệt đối trung bình : Sai số bình ph ơng trung bình : Mô hình trung bình tr ợt MA : Tính không dừng : Dự báo ngoài mẫu : Hàm tự t ơng quan riêng phần : Đồ thị t ơng quan riêng phần : Th i kỳ hậu mẫu : Dự đoán : Thành phần ngẫu nhiên : Thành phần mùa : Sai phân bậc 2 : Đ ng cong trơn : Làm trơn : Tính dừng : Chuỗi th i gian dừng Absolute percent error (APE) Adaptive forecast ARIMA models ARMA models Autocorrelation function Autoregressive integrated moving average Autoregressive (AR) models Box - Pierce statistic Combining forecast Conditional forecast Correlogram Deseasonalization Detrending Diagnostic checking Differencing Econometric forecasting Estimation Ex-ante forecast Exponential smoothing Ex-post forecast First difference Fitted value Forecasting Identification In-samle forecast Integrated of order d, I(d) Ljing-Box tes statistic Mean absolute percent error (MAPE) Mean squared error (MSE) Moving average (MA) model Non Stationarity Out of sample forecast Partial auto correlation function (PACF) Partial correlogam Post sample period Prediction Random term Seasonal term Second difference Smooth curve Smoothing Stationarity Stationary time series Ramu Ramanathan 35 Biên dịch: Thục Đoan Hiệu đính: Cao Hào Thi Ch ơng trình Giảng dạy Kinh tế Fulbright Ph ơng pháp nghiên c u II Bài đọc Stochatic term Time series forecasting Time varrying weights Trend Trend line fitting Trend term Unconditional forecast White noise Nh p môn kinh tế l ng v i các ng d ng ậ 5th ed. Ch.11: Dự báo : Thành phần ngẫu nhiên : Dự báo chuỗi th i gian : Các trọng số thay đổi theo th i gian : Xu h ớng : Thích hợp bằng đ ng xu h ớng : Thành phần xu h ớng : Dự báo không điều kiện : Nhiễu trắng Tài li u tham khảo - Bates, J.M., and C.W.J.Granger. "The Combination of Forecasts." Operations Research Quanterly 20 (1969): 451-469. - Bessler, D. A., and J. A. Brandt. "Forecasting Livestock Prices with Individual and Composite Methods." Applied Economics 13 (1981): 513-522. - Bohara, A., R. McNown, and J. T. Batts. "A Re-evaluation of the Combination and Adjustment of Forecast." Applied Economics 19 (1987): 437-455. - Box, G. E. P., and G. M. Jenkins. Time Series Analyis, Forecasting, and Control. San Francisco: Holen Day, 1970. - Box, G. E. P., and D. A. Pierce. "Distribution of Residual Autocorrelations in Autoregressive Integrated Moving Average Time Series Models." J. Amer. Stat. Assor. 65 (1970): 1509 - 1526. - Brailsford, Timothy J., and Robert W. Fall. "An Evaluation of Volatility Forecasting Techniques." Journal of Banking and Finance 20, no. 3 (April 1996): 419-438. - Clements, Michael P., and David F. Hendry. "Macro economic Forecasting and Modelling." Economic Journal105, no. 431 (July 1995): 1001-1013. - Diebold, F. X. Elements of Forecasting. Cincinnati: South Western, 2001. - Economic Report of the President. Washington, D.C.: U.S. Government Printing Office, 1987. - Engle, R. F., and C.W. J. Granger. Forecasting Electricity Sales over the Short Term: A Comparison of New Methodologies, Section 2. Electric Power Research Institude, EM-4772, September 1986. - Granger, C. W. J. "Combining Forecasts - Twenty Years Later." Journal of Forecasting, 1989a. - _____, Forecasting in Business and Economics. New York: Academic Press, 1989b. - Granger, C. W. J., and P. Newbold. Forecasting Economic Time Series. Orlando: Academic Press, 1986. - Granger, C. W. J., and Ramu Ramanathan. "Improved Methods of Combining Forecasts." Journal of Forecasting 3 (1984): 197-204. Ramu Ramanathan 36 Biên dịch: Thục Đoan Hiệu đính: Cao Hào Thi Ch ơng trình Giảng dạy Kinh tế Fulbright Ph ơng pháp nghiên c u II Bài đọc Nh p môn kinh tế l ng v i các ng d ng ậ 5th ed. Ch.11: Dự báo - Gunel, I. "Forecasting System Energy Demand." Forecast Master Program Case Studies. Electric Power Research Institude, EM-5114, April 1987. - Hamilton, J. D. Time Series Analysis. Princeton, N.J.: Princeton University Press, 1994. - Harvey, A. C. The Econometric Analysis of Time Series. Cambridge, Mass.: The MIT Press, 1990. - Howrey, E. Philip. "An Analysis of RSQE Forecasts: 1971 - 1992." Atlantic Economic Journal 23, no. 3 (September 1995): 203-219. - International Journal of Forecasting. Special section on combining forecasts (November 1989). Jansen, Dennis W., and Ruby Pandey Kishan. "An Evaluation of Federal Reserve Forecasting." Journal of Macroeconomics 18, no. 1 (Winter 1996): 89-109. - Journal of Forecasting. Special issue on combining forecasts (July 1989). Ramu Ramanathan 37 Biên dịch: Thục Đoan Hiệu đính: Cao Hào Thi