ANALISE COMPARATIVA DE ALGORITMOS DE REDUÇÃO DE RADICAIS E SUA IMPORTÂNCIA PARA A MINERAÇÃO DE TEXTO

Autores

  • Bruno Missi Xavier Dataci - Companhia de Tecnologia da Informação de Cachoeiro de Itapemirim-ES
  • Alcione Dias da Silva Dataci - Companhia de Tecnologia da Informação de Cachoeiro de Itapemirim-ES
  • Geórgia Regina Rodrigues Gomes UCAM – Universidade Candido Mendes

Resumo

O processo de radicalização de palavras desempenha um papel fundamental para a mineração de texto. Definir qual algoritmo melhor se adapta a instância de dados utilizada, influencia diretamente na qualidade dos resultados dos processos de mineração. Este trabalho tem por objetivo apresentar uma comparação entre os algoritmos mais utilizados para radicalização da língua portuguesa, além de classificar os algoritmos quanto ao peso na tarefa de eliminar sufixos e apresentar qual o algoritmo melhor se adapta a base de dados confeccionada. Para a avaliação dos radicalizadores foi utilizado o método de Paice (1994), aplicado a grupos conceituais em uma amostra de 731 palavras. Os resultados apresentados demonstram uma boa qualidade dos radicalizadores e são conclusivos para a seleção de um stemmer que melhor se adéque à amostra. O atual estudo contribui para o entendimento do peso dos radicalizadores, e ainda para determinar o algoritmo que melhor se aplica a instância de dados selecionada.

Palavras-Chaves: Mineração de Texto, Radicalização, Paice.


Biografia do Autor

Bruno Missi Xavier, Dataci - Companhia de Tecnologia da Informação de Cachoeiro de Itapemirim-ES

Analista de sistemas, Arquiteto de software para a tecnologia Java Web, mestrando em pesquisa operacional e inteligencia computacional pela Universidade Cândido Mendes.

Downloads

Publicado

2013-01-08

Como Citar

Xavier, B. M., Silva, A. D. da, & Gomes, G. R. R. (2013). ANALISE COMPARATIVA DE ALGORITMOS DE REDUÇÃO DE RADICAIS E SUA IMPORTÂNCIA PARA A MINERAÇÃO DE TEXTO. Pesquisa Operacional Para O Desenvolvimento, 5(1), 84–99. Recuperado de https://www.podesenvolvimento.org.br/podesenvolvimento/article/view/189

Edição

Seção

Artigos