Sobre este projeto
it-programming / data-science-1
Aberto
Desenvolver uma versão inicial (v0) de um modelo de Data Science capaz de inferir, dentro de um intervalo pré-definido, o valor médio que uma empresa gasta mensalmente com tecnologia. O modelo deverá classificar as empresas em uma das 7 faixas de gastos estabelecidas, utilizando uma base de dados existente.
Descrição dos Dados:
Quantidade de Registros: 700 empresas.
Informações Disponíveis:
Gastos mensais em tecnologia (variável alvo).
Possíveis variáveis preditoras (a serem detalhadas).
Faixas de Gastos: 7 categorias que representam intervalos de gastos mensais.
Escopo de Trabalho:
Análise Exploratória de Dados (EDA):
Avaliar a qualidade e integridade dos dados fornecidos.
Identificar padrões, tendências e possíveis inconsistências.
Visualizar distribuições e correlações entre variáveis.
Pré-processamento dos Dados:
Tratamento de valores ausentes e outliers.
Codificação de variáveis categóricas, se houver.
Normalização ou padronização de dados, conforme necessário.
Desenvolvimento do Modelo:
Seleção de algoritmos adequados para o problema de classificação (e.g., Regressão logística, árvores de decisão, random forest).
Treinamento do modelo utilizando técnicas de validação cruzada.
Ajuste e otimização de hiperparâmetros para melhorar a performance.
Avaliação do Modelo:
Utilizar métricas de avaliação apropriadas (e.g., Acurácia, precisão, recall, F1-score).
Análise da matriz de confusão para identificar possíveis melhorias.
Validar a capacidade de generalização do modelo com dados de teste.
Documentação e Entrega:
Relatório detalhado com metodologias, resultados e insights obtidos.
Código-fonte bem documentado e organizado.
Recomendações para futuras iterações e aprimoramentos.
Entregáveis:
Modelo Treinado: Pronto para ser utilizado em novas inferências.
Código-Fonte: Scripts ou notebooks com comentários e explicações.
Relatório Final: Documento abrangente contendo:
Metodologia aplicada.
Resultados da análise exploratória.
Performance do modelo.
Conclusões e recomendações.
Categoria TI e Programação
Subcategoria Data Science
Tamanho do projeto Médio
Isso é um projeto ou uma posição de trabalho? Um projeto
Disponibilidade requerida Conforme necessário
Prazo de Entrega: Não estabelecido
Habilidades necessárias