Realizado

Análise de Dados, Usuários Repetidos

Publicado em 03 de Junho de 2020 dias na TI e Programação

Sobre este projeto

Aberto

Projeto de análise de Dados para identificar uma mesma pessoa em diferentes fontes de dados(.csv). Os atributos escolhidos devem usar o máximo de informações possíveis extraídas das fontes de dados utilizadas. Uma sugestão de características sérias: Nome, Data de nascimento, Sexo, cpf, cns, pis.

Com isso mostrar a propabilidade de um usuário ser a mesma pessoa nos dois arquivos.

Escolha o modelo de decisão:
Definir uma abordagem usada para escolher o status da correspondência entre dois registros. As duas abordagens possíveis são:
Probabilística : Retorna a probabilidade de dois registros considerados relacionados à mesma entidade no mundo real.
Empírica : Retorna um status identificado se dois registros se referirem ou não à mesma entidade.

Por exemplo: sim, não, provavelmente ... Etc.
(Jupyter Notebook)

Categoria TI e Programação
Subcategoria Outros
Tamanho do projeto Pequeño
Isso é um projeto ou uma posição de trabalho? Um projeto
Tenho, atualmente Eu tenho especificações
Disponibilidade requerida Conforme necessário
Experiência nesse tipo de projeto Sim (Eu já gerenciei esse tipo de projeto)

Prazo de Entrega: Não estabelecido

Habilidades necessárias