Lasso regression in stata forex


Estou tendo confusão e dificuldades usando glmnet com lasso onde meu resultado de interesse é dicotômico. Eu criei um pequeno quadro de dados falsos abaixo: As colunas (variáveis) no conjunto de dados acima são as seguintes: O objetivo deste exemplo é fazer uso de lasso para criar um modelo de previsão do status de asma infantil a partir da lista de 6 variáveis ​​preditoras potenciais (Idade, sexo, bmip, medu, pedu e fcolor). Obviamente, o tamanho da amostra é um problema aqui, mas estou esperando para obter mais informações sobre como lidar com os diferentes tipos de variáveis ​​(ou seja, contínuo, ordinal, nominal e binário) no quadro glmnet quando o resultado é binário (1 asma 0 sem asma). Como tal, alguém estaria disposto a fornecer uma amostra R script, juntamente com explicações para este exemplo bobo usando lasso com os dados acima para prever asma status Embora muito básico, eu sei que eu, e provavelmente muitos outros no CV iria apreciar muito este Obrigado A linha xfactors lt - model. matrix (asma gênero medu pedu fcolor), - 1 codifica a variável categórica fcolor (como declarada por as. factor nas linhas anteriores). Deve usar a codificação da variável dummy R padrão, a menos que o argumento contrastts. arg seja fornecido. Isso significa que todos os níveis de fcolor são igualmente ponderados e não direcionais, exceto o primeiro que é usado como a classe de referência e absorvido na interceptação. Ndash Alex 27 de outubro 15 às 5: 16 sei que isso enlamearia a inferência estatística, mas eu realmente estou apenas preocupado em ficar tão perto de um modelo preciso como posso. Eu tenho uma variável de resultado dicotômica, com um grande conjunto de preditores dicotômicos. Estou pensando que eu gostaria de tentar usar o LASSO para selecionar quais variáveis ​​eu deveria incluir no meu modelo e, em seguida, inserir as variáveis ​​selecionadas em uma regressão Logit. Existe algo que eu estou ignorando quando se trata da praticidade desta abordagem pediu 26 de janeiro às 21:35 Primeiro, não há garantia de que um modelo de probabilidade linear irá aproximar um modelo logit muito bem, consequentemente, o subconjunto de variáveis ​​selecionadas para um pode ser Menos apropriado para o outro. Em segundo lugar, o reajuste não se aplica nenhum encolhimento em tudo, apesar da seleção variável que ocorreu no primeiro passo, arriscando grave mis-calibração amp talvez um pouco de perda de discriminação. Você pode ser capaz de validar o procedimento em um determinado conjunto de dados, mas não parece seguro em geral, ou para oferecer qualquer vantagem sobre uma regressão logística stepwise. E naturalmente sua penalidade LASSOs L1-norma desnecessária pode ser usada para a seleção do amplificador do encolhimento na regressão logística. Respondeu Jan 27 15 às 13: 56LARS: Stata módulo para executar regressão menor ângulo Regressão Least Angle é um algoritmo de construção de modelo que considera a parcimônia, bem como a precisão de previsão. Este método é abordado em detalhes pelo artigo Efron, Hastie, Johnstone e Tibshirani (2004), publicado em The Annals of Statistics. Sua motivação para este método foi um algoritmo computacionalmente mais simples para a regressão Lasso e Forward Stagewise. Há muitas críticas à regressão stepwise, uma das quais é que é um algoritmo quotgreedyquot e que os coeficientes de regressão são muito grandes. Regressão Ridge é um método de construção de modelo que encolhe os coeficientes, tornando a soma dos coeficientes quadrados menos do que alguns constante. O Lasso é semelhante, mas o constaint é que a soma dos coeficientes quotmodquot é menor do que uma constante. Uma implicação disto será que a solução irá conter coeficientes que são exatamente 0 e, portanto, têm a propriedade de parcimônia, ou seja, um modelo mais simples. Se você tiver problemas ao fazer o download de um arquivo, verifique se você tem o aplicativo adequado para visualizá-lo primeiro. Em caso de problemas adicionais, leia a página de ajuda IDEAS. Observe que esses arquivos não estão no site IDEAS. Seja paciente, pois os arquivos podem ser grandes. Componente de software fornecido pelo Boston College Departamento de Economia em sua série Estatística Componentes de Software com o número S456860. Ao solicitar uma correção, mencione, por favor, estes itens handle: RePEc: boc: bocode: s456860. Veja informações gerais sobre como corrigir material no RePEc. Para questões técnicas sobre este item, ou para corrigir seus autores, título, resumo, informações bibliográficas ou download, entre em contato: (Christopher F Baum) Se você é autor deste item e ainda não está registrado no RePEc, recomendamos que o faça aqui . Isso permite vincular seu perfil a este item. Ele também permite que você aceite citações em potencial para este item que estamos incertos sobre. Se as referências estiverem totalmente ausentes, você pode adicioná-las usando este formulário. Se as referências completas listarem um item que está presente no RePEc, mas o sistema não tiver vinculado a ele, você pode ajudar com este formulário. Se você souber de itens ausentes citando este, você pode nos ajudar a criar esses links adicionando as referências relevantes da mesma maneira como acima, para cada item referente. Se você é um autor registrado deste item, você também pode querer verificar a guia de citações no seu perfil, pois pode haver algumas citações esperando confirmação. Tenha em atenção que as correcções podem demorar algumas semanas para filtrar os vários serviços RePEc. Mais serviços MyIDEAS Seguir séries, jornais, autores e mais Novos artigos por e-mail Inscrever-se para novas adições ao RePEc Registro de autor Perfis públicos para pesquisadores de economia Rankings Vários rankings de pesquisa em economia e campos relacionados Genealogia Quem foi um estudante de quem, usando RePEc BiblE Artigos curados artigos de amp papéis vários temas de economia MPRA Carregar seu artigo para ser listado em RePEc e IDEAS EconAcademics Blog agregador para pesquisa de economia Plagiarismo Casos de plágio em Economia Papéis do mercado de trabalho RePEc série de papel de trabalho dedicado ao mercado de trabalho Fantasy League Pretend você está no leme De um departamento de economia Serviços do StL Fed Dados, pesquisa, apps amp mais do St. Louis Fed

Comments

Popular Posts