Preciso aplicar em uma base de dados, que pode ser escolhida pelo profissional, ou de preferência um banco de dados disponível e facilmente acessível na internet. Exemplos
https://archive.ics.uci.edu/ml/index.php
https://www.kaggle.com/datasets
Aplicar os seguintes métodos:
1)Clustering
- k-means
- PAM
- Clara
- Algoritmo Clustering Hierarquico Aglomerativo
- Algoritmo DBSCAN
- Complete-linkage clustering.
- Método Ward
Métricas de Avaliação
- Métricas Internas
- Conectividade
- Largura de Silhueta
- Índice de Dunn
- Métricas de Estabilidade
- métrica APN (Average Proportion of Non-overlap)
- A métrica AD (Average Distance)
- A métrica ADM (Average Distance between Means)
- A métrica FOM (Figure of Merit)
-
- Métricas Biológicas
- BHI (Biological Homogeneity Index)
- BSI: Biological Stability Index
2) Regressão Logística
- Chances (odds) e Raz ̃ao de Chances (Odds ratio)
3) K-Fold Cross-Validation
- M ́etodo leave-one-out
4)Lasso Regression
5)Ridge Regression
6)Elastic net
7) Redução de Dimensionalidade
- Mapeamento de Sammon
- Local MDS
- Metodo Supervised mds
- t-distributed stochastic neighbor embedding (t-sne)
preciso de 2 arquivos, um somente com os códigos e que seja replicável e outro com os resultados e uma análise bem sucinta.
Caso exista algum método que não consiga realizar, favor destacar qual seria.
Também possuo arquivos complementares que podem ajudar no trabalho.
Delivery term: July 08, 2022