Utilizzando questo modello si puo' rispondere a domande del tipo: quanto il livello di criminalita' dell'Emilia Romagna e' influenzato dai livelli di criminalita' delle altre regioni Italiane? Oppure: quanto il livello di tassazione della citta' di Matera e' influenzato dal livello di tassazione delle citta' vicine?
La variabile dipendente viene considerata in funzione dei suoi ritardi spaziali (stessa variabile in altri luoghi) e dei regressori.
Il modello SAR:
$y_{i} =\rho \sum_{j} w_{ij} y_{j} + {\bf x} {\bf \beta} + \varepsilon_{i}$
$y_{i} = \rho {\bf w_{i}}' {\bf y} + {\bf x} {\bf \beta} + \varepsilon_{i}$
${\bf y} =\rho {\bf W} {\bf y} + {\bf X} {\bf \beta} + {\bf \varepsilon}$
Affinche' lo stimatore dei minimi quadrati sia non distorto e consistente il termine d'errore non deve essere correlato con i regressori.
Ma.....in questo modello la variabile ritardata spazialmente $y_{j}$ e' correlata con il termine d'errore $\varepsilon_{i}$:
$y_{i} =\rho y_{j} + x_{i} \beta + \varepsilon_{i}$
$y_{j} = \rho y_{i} + x_{j} \beta + \varepsilon_{j}$
$....$
$y_{i}=\rho (\rho y_{i} + x_{j} \beta + \varepsilon_{j}) + x_{i} \beta + \varepsilon_{i}$
$= \rho(\rho(\rho y_{j} + x_{i} \beta +\varepsilon_{i}) + x_{j} \beta + \varepsilon_{j}) +x_{i} \beta + \varepsilon_{j}$
In generale:
${\bf y} = \rho {\bf W} {\bf y} + {\bf X} {\bf \beta} + {\bf \varepsilon}$
${\bf W} {\bf y} = {\bf W X \beta} + \rho {\bf W}^{2} {\bf X \beta} + \rho^{2} {\bf W} ^{3} {\bf X \beta}......$
$+ {\bf W \varepsilon} + \rho {\bf W}^{2} {\bf \varepsilon} + \rho^{2} {\bf W}^{3} {\bf \varepsilon}....$
La variabile ritardata spazialmente in media include: i termini di errore dei "vicini"; i termini d'errore dei vicini dei vicini; i termini d'errore dei vicini dei vicini dei vicini ecc...
Quindi $y$ in ogni osservazione $i$ dipende dai termini d'errore delle altre osservazioni.
Tipicamente viene utilizzato il metodo della Massima Verosimiglianza per la stima dei parametri:
${\bf y}({\bf I - \rho W}) - {\bf X} \bf{\beta}= {\bf \varepsilon}$
I termini d'errore sono considerati come distribuiti normalmente, omoschedastici,
non autocorrelati: ${\bf \varepsilon}: N(0, \sigma^{2} {\bf I_{n}})$
La funzione di verosimiglianza, che e' la probabilita' di osservare ${\bf y}$, dato un valore per
i parametri $\rho, \sigma, {\bf \beta}$, i regressori ${\bf X}$ e la matrice dei pesi spaziali
${\bf W}$.
La funzione in logaritmi (log-likelihood):
$ln L = -\frac{n}{2} ln 2 \pi - \frac{n}{2} log \sigma^{2} + det ({\bf I} - \rho W)=
-\frac{1}{2 \sigma^{2}} ({\bf y - \rho W y - X \beta})'({\bf y - \rho W y - X \beta})$
Lee (2004) dimostra che il metodo della Massima Verosimiglianza fornisce stimatori consistenti con l'assunzione che il modello econometrico rappresenti il reale processo generatore dei dati.
Referenze:
Appunti dalle Lezioni di Tecniche di Economia Spaziale di Steve Gibbons, Anno 2012 (LSE).
Gibbons and Overman, 2012: "Mostly Pointless Spatial Econometrics?" Journal Of Regional Science, Vol. 52, No. 2 , pp. 172–191.
Lee, Lung-Fei. 2004. "Asymptotic Distributions of Quasi-Maximum Likelihood Estimators for Spatial Econometric Models", Econometrica , 72, 1899–1926.