SỰ CẦN THIẾT CỦA MÔ HÌNH HỒI QUY BỘI.
I. Mô hình hai biến – vấn đề về kỳ vọng sai số khác 0.
Ví dụ 2.1: Nghiên cứu tác động của thu nhập (TN) lên chi tiêu (CT) của hộ gia đình,
được thể hiện bởi mô hình hồi quy hai biến sau:
?? = ?1 + ?2?? + ?
Hướng dẫn giải:
Ta biết rằng sai số ngẫu nhiên u thể hiện cho tác động của các yếu tố khác ngoài thu
nhập, lên chi tiêu. Trên thực tế, những yếu tố khác như tài sản của hộ gia đình cũng có
tác động đáng kể đến mức chi tiêu. Do đó u có chứa đựng tác động của yếu tố “tài sản
hộ gia đình”. Ta nhận thấy rằng thông thường một gia đình có thu nhập cao thì cũng
thường sở hữu nhiều tài sản, hay nói cách khác, giữa biến “thu nhập” và biến “tài sản”
thường có tương quan cao. Điều này nói chung sẽ gây ra sự tương quan giữa u và biến
TN: Cov(TN,u)≠0. Và do đó giả thiết 2 không còn được thỏa mãn.
Để khắc phục vấn đề này, chúng ta sẽ đưa thêm biến “tài sản” (TS) vào để được mô
hình ba biến như sau: ?? = ?1 + ?2?? + ?3?? + ?
Mô hình hồi quy tổng thể
Trong mô hình ba biến này, sai số ngẫu nhiên u không còn chứa đựng tác động của yếu
tố “tài sản” nữa, do đó nó không còn là nhân tố gây nên sự vi phạm giả thiết 2 như trong
mô hình hai biến ban đầu.
Các ví dụ về mô hình hồi quy tổng thể:
Ví dụ 2.2: Xét bài toán về quan hệ giữa vốn và sản lượng trong ngành dệt may. Giả sử xét mô hình hai biến: ? = ?1 + ?2? + ?
Hướng dẫn giải:
Trong đó Q là sản lượng và K là vốn của các doanh nghiệp dệt may. Ta biết rằng sản lượng Q còn phụ thuộc vào các biến khác như số lao động L.
Quan hệ giữa biến độc lập và biến phụ thuộc
Một thực tế là các doanh nghiệp dệt may có nhiều máy móc thì cũng thường thuê nhiều lao động, điều này ngụ ý rằng giữa K và L thường có tương quan dương cao. Mà sai số ngẫu nhiên u lại chứa đựng L, do đó giả thiết 2 nói chung sẽ bị vi phạm.
Khi đó thay vì mô hình trên ta xét mô hình hồi quy bội sau:
? = ?1 + ?2? + ?3? + ?
Biến độc lập nội sinh
Các ví dụ trên minh họa một điều rằng: nếu sai số ngẫu nhiên trong mô hình mà
có tương quan với biến độc lập thì giả thiết 2 sẽ bị vi phạm. Khi biến độc lập trong
mô hình có tương quan với sai số ngẫu nhiên, chúng ta gọi nó là biến độc lập nội sinh.
Ước lượng OLS
Như vậy nếu trong mô hình có biến độc lập nội sinh thì các ước lượng OLS
sẽ là ước lượng chệch. Khi mô hình hồi quy có chứa biến độc lập nội sinh
người ta nói rằng mô hình có vấn đề về biến nội sinh.
II. Một số ưu việt khác của mô hình hồi quy bội.
Ngay cả khi mô hình hồi quy hai biến không vi phạm giả thiết 2 thì việc sử dụng
mô hình hồi quy bội vẫn có những ưu việt đáng kể:
a. Mô hình hồi quy bội thường có chất lượng dự báo tốt hơn.
b. Mô hình hồi quy bội cho phép sử dụng dạng hàm phong phú hơn.
c. Mô hình hồi quy bội cho phép thực hiện các phân tích phong phú hơn.
§2. MÔ HÌNH HỒI QUY BỘI VÀ PHƯƠNG PHÁP ƯỚC LƯỢNG OLS
I. Mô hình và các giả thiết.
Xét mô hình hồi quy tuyến tính k biến sau: ? = ?1 + ?2?2 + ?3?3 + ⋯ + ???? + ? (1)
Trong đó Y là biến phụ thuộc và các Xj (j = 2,3,.., k) là các biến độc lập.
Sai số ngẫu nhiên u trong mô hình hồi quy bội là yếu tố đại diện cho các yếu tố có tác
động đến Y nhưng không đưa vào mô hình như các biến số.
1. Các giả thiết của mô hình:
Giả thiết 1: Việc ước lượng được dựa trên cơ sở mẫu ngẫu nhiên.
Giả thiết 2: Kỳ vọng của sai số ngẫu nhiên tại mỗi giá trị (X2i,.., Xki) bằng 0.
Giả thiết 3: Phương sai của sai số ngẫu nhiên tại các giá trị X2i,.., Xki đều bằng nhau:
Giả thiết 4: Giữa các biến độc lập Xj (j=2-k) không có mối quan hệ đa cộng tuyến
hoàn hảo, nghĩa là không tồn tại các hằng số không đồng thời bằng 0 sao
cho:
Ý nghĩa giả thiết 4:
Ta thấy rằng nếu giữa các biến Xj (j=2-k) là có quan hệ đa cộng
tuyến hoàn hảo thì sẽ có ít nhất một biến trong các biến này suy ra được từ các biến
còn lại, hay nói cách khác, thông tin từ biến này đã được chứa đựng trong thông tin của
các biến còn lại. Giả thiết 4 loại trừ tình huống này