Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original
* Econometria I EAE0324 AULA 5 * * Viés de inclusão de variável espúria * * Viés de inclusão de variável espúria * * Overfitting * * * * Propriedades assintóticas? As características que acabamos de discutir não são triviais, e dependem da natureza da distribuição dos distúrbios (lembre-se que cada amostra utilizou uma amostra da mesma distribuição de u, que é desconhecida a priori) A distribuição de estimativas produzidas pelo nosso estimador tembém depende do tamanho da amostra utilizada (N) Mesmo estimadores viesados podem ter importante propriedades se fosse possível a observação de uma amostra suficientemente maior Nós então podemos nos basear na característica do estimador sob a suposição de que temos uma amostra gigantesca (estas são denominadas características de aproximação assintótica) * * Propriedades assintóticas Estimador consistente Estimador se tornaria o próprio “beta” se pudessemos observar toda a população! * * Recapitulando as propriedades do MQO We saw that we can approximate distributional and unbiasedness properties of our OLS estimator employing asymptotic (large sample) arguments… * * Brief Recap We, therefore hit the nail in the head (consistent) if: We can also show that our estimator is asymptotically normal: * * Inferência Sabendo qual seria a distribuição do nosso estimador (lembre, esse é uma variável aleatória) estamos em posição para examinar hipóteses sobre o parâmetro populacional de interesse… De modo a ter um parâmetro de comparação, temos que nos basear numa medida que nos dá uma idéia de distância entre a estimativa que observamos e os valores que seriam razoáveis dada a distribuição de nosso estimador em caso da hipótese ser verdadeira: * * Inferência (cont.) Isto significa que ao compararmos nossa medida observada de distância com a esperada considerando a distribuição normal padrão (que seriam as distâncias a serem observadas se a hipótese fosse correta), podemos avaliar a validade da hipótese sobre o parãmetro populacional… A hipótese é invalidada toda vez que o que observamos nos nossos dados está distante o suficiente da medida que esperávamos! Considere a seguinte hipótese (teste de significância): * * Testando uma hipótese simples Em palavras: A variável explicativa k que inlcuímos no modelo na verdade não afeta a variável dependente! Usando a noção de distância que acabamos de definircomputamos a estatítica t-observada: Se a hipótese é correta, deveríamos observar distâncias que conformam com a esperada – a distância predita pela distribuição normal padrão. Reportada pelo STATA diretamente! * * Testando uma hipótese simples (cont.) Temos um poder discricionário nesse teste de hipótese que se resume a: Definição da hipótese alternativa; A significância do teste (ou o quão rigoroso é o mesmo). A hipótese alternativa pode ter diferentes formas: O nível de significância (a) representa o que definimos como “evento raro” na medida de distânica…e esta nos dará uma regra de decisão clara! * * Testando uma hipótese simples (cont.) c nos dá o ponto de corte representando a regra de decisão neste teste de dois lados! * * Testando uma hipótese simples (cont.) c nos dá o ponto de corte representando a regra de decisão neste teste de um lado! * * Testando uma hipótese simples (cont.) As hipóteses podem ser consideradas em forma generalizada. Considere: Construiríamos a medida de distância da mesma forma: E prosseguimos como antes… NÃO é reportado pelo STATA diretamente ! * * Testing hypothesis about a linear combination of parameters Consider the policy deign question regarding the transfer of child benefits to families… The objective here is to identify if there is a difference in child outcomes of interest depending on which parent (mother or father) holds the resources transferred… Consider the model in which child outcomes is represented as a function of resources of each of the parents: * * Testing hypothesis about a linear combination of parameters (ctnd.) We want to test: Note that this hypothesis test can be re-written as: And we would compute: * * Testing hypothesis about a linear combination of parameters (ctnd.) We can eventually use the function in STATA to compute this statistic… But here is a trick! Redefine the model: * * Testing hypothesis about a linear combination of parameters (ctnd.) Therefore, estimating this regression you can directly compute: Which is, after all, what you are interested on… Lecture 3 Lecture 3 PP414 * PP414 Lecture 3 Lecture 3 PP414 * PP414 Lecture 3 Lecture 3 PP414 * PP414 Lecture 3 Lecture 3 PP414 * PP414 Lecture 3 Lecture 3 PP414 * PP414 Lecture 3 Lecture 3 PP414 * PP414 Lecture 3 Lecture 3 PP414 * PP414 Lecture 3 Lecture 3 PP414 * PP414 Lecture 3 Lecture 3 PP414 * PP414 Lecture 3 Lecture 3 PP414 * PP414 Lecture 3 Lecture 3 PP414 * PP414 Lecture 3 Lecture 3 PP414 * PP414 Lecture 3 Lecture 3 PP414 * PP414 Lecture 3 Lecture 3 PP414 * PP414 Lecture 3 Lecture 3 PP414 * PP414 Lecture 3 Lecture 3 PP414 * PP414 Lecture 3 Lecture 3 PP414 * PP414 Lecture 3 Lecture 3 PP414 * PP414 Lecture 3 Lecture 3 PP414 * PP414 Lecture 3 Lecture 3 PP414 * PP414