O objectivo final deste trabalho passa por explorar um conjunto de dados (dataset) de elevadas cardinalidade e dimensionalidade, e construir e analisar o desempenho de vários classificadores que possam predizer qual a classe a que uma nova instância pertence. Paralelamente a escolha das características usadas na identificação e a extração de novo conhecimento sobre os relacionamentos entre elas também será valorizado.
Os grupos podem optar em função do tempo disponível, das suas preferências pessoais e do estado do trabalho já desenvolvido por uma das seguintes possibilidades para a sua conclusão:
- Implementar um algoritmo evolutivo (por exemplo um AG) para seleção ou para extração de características. O conjunto de características resultante pode ser diferente para os classificadores NB e K-NN.
O relatório deve incidir sobre a discussão dos resultados da optimização para os classificadores implementados. Devem também verificar se o novo conjunto de características quando comparado com o conjunto completo resulta, ou não, em melhor desempenho para pelo menos 2 outros classificadores disponíveis na ferramenta Weka e apresentar exemplos.
N.B. - O trabalho final poderá ter uma classificação máxima de 8 valores e poderá haver lugar a bonificação extra (até dois valores) para soluções criativas e/ou relatórios de excelência.
- Implementar um algoritmo evolutivo (por exemplo um AG) para optimizar um classificador baseado em regras difusas. O classificador resultante deve ser pelo menos equiparável ao melhor NB e K-NN. Soluções com regras simples e pouco numerosas serão valorizadas.
O relatório deve incidir sobre as opções de projeto do classificador difuso e do algoritmo evolutivo.
N.B. - O trabalho final poderá ter uma classificação máxima de 8 valores e poderá haver lugar a bonificação extra (até três valores) para soluções criativas e/ou relatórios de excelência.
- Comparar os classificadores desenvolvidos (NB e K-NN) com pelo menos 3 outros disponíveis no Weka. Neste caso para lá da óbvia comparação (gráficos, tabelas,...) entre classificadores, o relatório deve conter uma descrição com suficiente detalhe do funcionamento dos classificadores que escolheram comparar.
N.B. - O trabalho final poderá ter uma classificação máxima de 6 valores e poderá haver lugar a bonificação extra (até dois valores) para relatórios de excelência.
- Implementar um método de fusão dos resultados dos diversos classificadores desenvolvidos. Neste caso para lá da óbvia comparação (gráficos, tabelas,...) entre classificadores e entre resultados obtidos com diferentes parametrizações, o relatório deve conter uma descrição bastante detalhada do método de fusão que escolheram bem como das razões que os levaram a adotar esta estratégia.
N.B. - O trabalho final poderá ter uma classificação máxima de 7 valores e poderá haver lugar a bonificação extra (até dois valores) para relatórios de excelência.
O trabalho escolhido foi o primeiro