Sobre la agrupación de niveles del factor explicativo en el modelo logit binario About Joining Explanation Factor Levels in the Binary Logit Model

Se discute el efecto que se produce sobre el modelo logit binario con un único factor explicativo cuando el investigador decide agrupar algunos niveles de dicho factor. Con base en la parametrización de referencia y el modelo saturado se sugiere un procedimiento que, aprovechando los cómputos de un...

Full description

Bibliographic Details
Main Authors: ERNESTO PONSOT BALAGUER, SURENDRA SINHA, ARNALDO GOITÍA
Format: Article
Language:English
Published: Universidad Nacional de Colombia 2009-01-01
Series:Revista Colombiana de Estadística
Subjects:
Online Access:http://www.scielo.org.co/scielo.php?script=sci_arttext&pid=S0120-17512009000200001
Description
Summary:Se discute el efecto que se produce sobre el modelo logit binario con un único factor explicativo cuando el investigador decide agrupar algunos niveles de dicho factor. Con base en la parametrización de referencia y el modelo saturado se sugiere un procedimiento que, aprovechando los cómputos de un primer ajuste logit y corrigiendo el supuesto distribucional sobre la varianza, produce estimaciones más eficientemente y con mayor precisión que las que se producen si solo se decide reiterar un ajuste logit. Una vez colocado el tema en perspectiva, se desarrollan las ecuaciones que sustentan el procedimiento sugerido, apelando a la teoría asintótica. Se ilustra mediante un ejemplo la diferencia entre el procedimiento sugerido y el habitual y, con base en una extensa simulación, se muestran tendencias sólidas a favor del primero, en la medida en que las probabilidades de éxito de la variable respuesta (Y=1), asociadas con las categorías del factor explicativo incluidas en la agrupación, sean más disímiles entre sí.<br>We discuss the effect that is produced on the binary logit model with one explanatory factor, when the researcher decides to join some levels of the factor. Based on the reference parametrization and the saturated model a procedure is suggested, that takes advantage of the calculations of the first adjustment and corrects the distribucional supposition around the variance. As a result, it produces estimations more efficiently and with more precision, than those which take place if it is decided to repeat the usual logit fit. Once placed the topic in perspective, we develop the equations that support the suggested procedure, based on asymptotic theory. We illustrate with an example the difference between the suggested procedure and the usual one. By developing an extensive simulation, some solid trends appear in favour of the first one, especially when the probabilities of success of the response (Y=1), associated with the categories of the explanatory factor included in the group, are less similar each other.
ISSN:0120-1751