Sala P3.10, Pavilhão de Matemática

Daniel Ferreira, 2º ano do MMA, IST
Classificação de Documentos Multilíngue

O problema de atribuir classes automaticamente a documentos de texto é prevalente na área de Processamento de Língua Natural. Devido à diferença em quantidade e qualidade de recursos disponíveis para problemas de classificação, há uma necessidade de aproveitar informação de algumas línguas para aplicar a problemas de classificação noutras línguas. Ao problema de fazer classificação numa língua usando dados de outra, chamamos Classificação de Documentos Multilíngue. Neste seminário exploramos dados de texto paralelos entre pares de línguas, para resolver este problema.