ANALISE COMPARATIVA DE ALGORITMOS DE REDUÇÃO DE RADICAIS E SUA IMPORTÂNCIA PARA A MINERAÇÃO DE TEXTO
Resumo
O processo de radicalização de palavras desempenha um papel fundamental para a mineração de texto. Definir qual algoritmo melhor se adapta a instância de dados utilizada, influencia diretamente na qualidade dos resultados dos processos de mineração. Este trabalho tem por objetivo apresentar uma comparação entre os algoritmos mais utilizados para radicalização da língua portuguesa, além de classificar os algoritmos quanto ao peso na tarefa de eliminar sufixos e apresentar qual o algoritmo melhor se adapta a base de dados confeccionada. Para a avaliação dos radicalizadores foi utilizado o método de Paice (1994), aplicado a grupos conceituais em uma amostra de 731 palavras. Os resultados apresentados demonstram uma boa qualidade dos radicalizadores e são conclusivos para a seleção de um stemmer que melhor se adéque à amostra. O atual estudo contribui para o entendimento do peso dos radicalizadores, e ainda para determinar o algoritmo que melhor se aplica a instância de dados selecionada.
Palavras-Chaves: Mineração de Texto, Radicalização, Paice.
Downloads
Publicado
Como Citar
Edição
Seção
Licença
A submissão de um artigo implica que ela foi aprovada por todos os coautores, se for o caso, bem como pelas autoridades responsáveis da instituição onde o trabalho foi realizado e que o(s) autor(es) estará(ão) implicitamente cedendo seus direitos à SOBRAPO e afirmando que eventuais direitos autorais de terceiros não estão sendo violados. O(s) autor(es), entretanto, permanece(m) responsável(is) pelo conteúdo do artigo publicado na revista. Apesar de se acreditar que a informação divulgada seja verdadeira e acurada na data de sua publicação, os editores e a SOBRAPO não aceitam qualquer responsabilidade legal por erros e omissões que possam ter ocorrido ou que venham a ser identificados.