Modo de Exibição Acessibilidade
Missão 4: Estudo prático
Você está iniciando a quarta missão. Nela, você deverá assistir os
vídeos de conteúdo e realizar as atividades práticas.
Em seguida, você deverá responder ao questionário que irá
registar seu aprendizado acerca do assunto e suas percepções
sobre o material apresentado.
Bom estudo!
Modularização em Python
Neste vídeo, você aprenderá a criar um novo projeto na
linguagem Python para análise de dados, mas, agora, com
destaque para a modularização, utilizando as bibliotecas Pandas,
NumPy e Plotly.
MOD2 Np2 analise de dados em python com pandas
(moderado)
roteiro:
crie uma pasta chamada projeto_modular.
Crie um arquivo
app.py.
Crie uma pasta chamada preprocessing.
Crie um arquivo
__init__.py na pasta preprocessing.
Crie um virtualenv e ativá-lo.
Crie uma pasta data.
Insira na pasta data o arquivo
iris.csv.
Instale as bibliotecas Pandas, NumPy e Plotly.
Faça o pip freeze para um arquivo
requirements.txt.
Crie o arquivo
normalize.py na pasta preprocessing.
Crie chamadas para o dado csv e a função normalize na
app.py.
Rode a
app.py por meio do comando python
app.py.
Atividade
Agora é sua vez!
Com base no projeto que acabamos de desenvolver, crie um novo
arquivo dentro de preprocessing chamado
one_hot_encode.py.
Dentro dele, crie uma função que pegue os valores categóricos
de um dataframe, chame a função pd.get_dummies() e cheque as
novas colunas que serão retornadas ao arquivo
app.py.
Tratamento de dados com a
biblioteca Pandas
Neste vídeo, você aprenderá a criar outro projeto na linguagem
Python para análise de dados, mas, agora, com foco no
tratamento de dados por meio do uso da biblioteca Pandas.
MOD2 Np3 analise de dados em python com pandas
(moderado)
roteiro:
crie uma pasta chamada pandas_experiment.
Crie uma pasta data dentro da pasta do projeto.
Insira um arquivo í
ris.csv dentro da pasta data.
Instale as bibliotecas Pandas, NumPy, Plotly e Sklearn na pasta
pandas_experiment.
Execute o comando Jupyter Notebook no terminal, na pasta do
projeto.
Crie um novo notebook assim que abrir o servidor do Jupyter
no navegador.
Clique no novo notebook e o renomeie para teste.
Crie uma célula com os imports das bibliotecas baixadas.
Leia o arquivo de dados com o Pandas.
Execute o comando de fillna em uma próxima célula.
Execute a função de normalização em uma próxima célula.
Execute a função info em uma próxima célula.
Execute, em uma próxima célula, pd.to_csv() com o dataframe
resultante, nomeando-o para
preprocessed.csv.
Atividade
Agora é sua vez!
Com o mesmo projeto base criado, extraia o formato
one_hot_encode da classe íris, junte-a ao dataframe novamente e
remova a antiga classe de espécie íris original.
Prazo de Entrega: 24 de Outubro de 2022