Sobre este projeto
it-programming / data-science-1
Aberto
Roteiro do trabalho: por favor, uma página para cada variável
I- Para cada variável:
a. Analisem a variável individualmente, representando os gráficos das distribuições de frequências, calculando medidas descritivas adequadas, verificando a existência de outliers e MV, transformar reduzindo assimetria “exagerada” caso seja o caso, etc.
b. Analisem sua relação (para as variáveis previsoras) com a variável alvo (cancel). Comparem as distribuições de frequências de cada variável em cada uma das duas categorias de cancel (tabelas, boxplots , o que lhes parecer mais interessante).
i. Verifiquem se a variável previsora apresenta capacidade de discriminar as duas categorias de cancel (ou seja, comente se seu comportamento difere significativamente entre as duas categorias de cancel).
Ii. Em vossa opinião, quais as variáveis previsoras que mais diferenciam as duas categorias de cancel?
II- Considere a variável RENDA e discretize-a em 8 categorias. Cruze com a variável alvo e verifique se valeria a pena fundir categorias adjacentes.
Justifiquem a resposta
III- Construam um gráfico de dispersão entre as variáveis quantitativas idade(x) e renda (y). Comentem o gráfico. Não é preciso ajustar uma curva aso pontos
• Formatar cópia de outputs do R em Lucida Console para não termos problemas de desalinhamento.
• Não quebrar tabelas ao meio.
Contexto Geral do Projeto
Desenvolvimento do roteiro de acordo com a base de dados ja pronta (ainda não anexada). As análises qualitativas do roteiro, serão feitas posteriormente. Aguardo contato para melhor explicação.
Categoria TI e Programação
Subcategoria Data Science
Tamanho do projeto Pequeño
Isso é um projeto ou uma posição de trabalho? Um projeto
Disponibilidade requerida Conforme necessário
Prazo de Entrega: 03 de Outubro de 2021