Want to create interactive content? It’s easy in Genially!
Trabalho Pratico 2
liamu
Created on June 11, 2024
Apresentação do Trabalho Pratico 2
Start designing with a free template
Discover more than 1500 professional designs like these:
Transcript
Trabalho realizado por: Tomás Gomes e João Nuno
ConclusõesGráficas
Recolha e Limpeza de Dados
1ªFase
Construção do Protocolo de Treino e Avaliação
3ªFase
Conclusões
Limpeza e Preprocessamento de Dados
2ªFase
Treino e Avaliação de Modelos de Aprendizagem Automática
4ªFase
Fases do trabalho e seus resultados
Got an idea?
Bring it to life with an interactive window
Create a new layer with all the Genially features.
- Generate experiences with your content.
- It’s got the Wow effect. Very Wow.
- Make sure your audience remembers the message.
- Activate and surprise your audience.
Ja os resultados obtidos do Dataset fornecido pelo "dataprofessor" foram significativamente melhores:Mean Squared Error: 0.007691377136035885 Mean Absolute Error: 0.06954967935026017 R2 Score: 0.7805174782375401 MSE e MAE são ambos bastante baixos, indicando que os erros de previsão do modelo são pequenos em relação à escala dos dados (0 a 1). R² é alto, indicando que o modelo explica uma grande parte da variabilidade nos dados. No geral, estas métricas indicam que o modelo está bem implementado, com previsões precisas e uma boa capacidade de explicar a variabilidade nos dados. Assim podemos averiguar que por melhor que esteja implementado um modelo, se os dados não possibilitarem uma boa previsão nunca se conseguirá tirar o melhor proveito do mesmo.
Conclusões
Como podemos averiguar, o resultado das métricas de avaliação dos diferentes Dataset são bastante distintas: Mean Squared Error: 0.020027839168567613 Mean Absolute Error: 0.10992033226876925 R2 Score: 0.07532155928514905 MSE e MAE indicam que os erros de previsão do modelo são relativamente pequenos, mas não insignificantes, em relação à escala dos dados (MinMax). R² indica que o modelo tem uma capacidade muito limitada de explicar a variabilidade nos dados.
Treino e Avaliação de Modelos de Aprendizagem Automática
Após percorrer o codigo implementado obtiveram-se resultados medíocres, tanto na dispersão grafica como o resultado das métricas de avaliação do modelo. Se um dos resultados fosse bom e o outro não, poderia indicar alguma erro na implementação.
- Mean Squared Error: 0.020027839168567613
- Mean Absolute Error: 0.10992033226876925
- R2 Score: 0.07532155928514905
Recolha e Limpeza de Dados
Como input deste projeto reutilizamos os datasets previamente empregues no primeiro trabalho. Os Datasets possuíam características iguais, porém tinham nomes diferentes, tendo sido necessário codificar e recorrer à ferramenta Notepad++ para equiparar as variáveis. Relativamente a codificação apenas foi necessário modificar o valor da moeda de Dolar Australiano para Euro e preencher valores nulos, nas características essenciais para o modelo de aprendizagem automática.
Got an idea?
Bring it to life with an interactive window
Create a new layer with all the Genially features.
- Generate experiences with your content.
- It’s got the Wow effect. Very Wow.
- Make sure your audience remembers the message.
- Activate and surprise your audience.
Got an idea?
Bring it to life with an interactive window
Create a new layer with all the Genially features.
- Generate experiences with your content.
- It’s got the Wow effect. Very Wow.
- Make sure your audience remembers the message.
- Activate and surprise your audience.
VS
Grafico com outro dataset
Como Dataset alternativo aproveitamos um ficheiro csv de um utilizador do GitHub "dataprofessor", com um numero consideravelmente pequeno de dados
Grafico de Melbourne e Perth
Para averiguar se o modelo estava mal implementado decidimos experimentar outros dataset, tendo obtido resultados melhores com dataset mais pequenos.
Got an idea?
Bring it to life with an interactive window
Create a new layer with all the Genially features.
- Generate experiences with your content.
- It’s got the Wow effect. Very Wow.
- Make sure your audience remembers the message.
- Activate and surprise your audience.
Construção do Protocolo de Treino e Avaliação
Nesta fase dividimos os dois datasets em treino e teste, isto é, Melbourne ficou para treino e Perth para teste. A função de custo escolhida foi GridSearchCV e as métricas de avaliação utilizadas foram Coeficiente de Determinação(R2), Erro Absoluto Médio(MAE) e Erro Quadrático Médio(MSE). A implementação de ambos foi acessível não manifestando erros. Tendo ainda assim, dentro da função de custo, iplementado mapas de calor para percebermos a correlação entre as variaveis.
Got an idea?
Bring it to life with an interactive window
Create a new layer with all the Genially features.
- Generate experiences with your content.
- It’s got the Wow effect. Very Wow.
- Make sure your audience remembers the message.
- Activate and surprise your audience.
Limpeza e Preprocessamento de Dados
Nesta fase, para além de recorrermos aos procedimentos da fase anterior, foi necessária a remoção de outliers e a normalização dos dados tendo lidado com ambos através do metodo IQR e MinMaxScaler, respetivamente. Conseguindo assim obter os resultados pretendidos. Alguns exemplos da remoção de outliers e normalização: