Dados do Acervo - Dissertações

Número de Chamada   
 
006.35    M775l    DIS   
Autor Principal Monteiro Junior, Almir
Entradas Secundárias - Autor Favero, Eloi Luiz , orient.
Universidade Federal do Pará. Centro Tecnológico. Departamento de Elétrica. Programa de Pós-Graduação em Engenharia Elétrica.
Título Principal LexWeb : um léxico da língua portuguesa extraído automaticamente da Internet / Almir Monteiro Junior; orientador, Eloi Luiz Favero
Publicação 2004.
Descrição Física iv,78 f. : il. ; 30 cm
Notas Área de concentração : Computação aplicada
Dissertação (mestrado) - Universidade Federal do Pará, Centro Tecnológico, Departamento de Elétrica, Programa de Pós-Graduação em Engenharia Elétrica, 2004
Inclui referências bibliográficas
Resumo: o conhecimento do comportamento de uma língua escrita é extremamente complexo e se constitui em um dos maiores desafios para a área de Processamento de Linguagem Natural (PLN). Um componente necessário em todo sistema de PLN é um léxico 1, como um dicionário eletrônico que coleta todas as palavras de uma língua. O léxico provê um conjunto de funcionalidades, tais como, verificar a existência de uma determinada palavra e, caso exista, indicar os seus traços lingüísticas, entre outros: classe (substantivo, verbo, pronome, etc.), gênero, número e pessoa. Esta dissertação propõe a construção de um léxico para o português a partir dos textos encontrados na Web. Ele é construído com ferramentas que automaticamente visitam as páginas da Web e coletam as palavras. O núcleo deste léxico é uma lista com todas as palavras encontradas nas páginas da Web, na qual cada palavra possui a sua freqüência de ocorrência. Adicionalmente, ferramentas que fazem uso de textos etiquetados de domínio público são utilizadas para classificar e atribuir os traços para cada palavra.
Assuntos Processamento de linguagem natural (Computação)
Servidores da web - Programas de computador
Inteligência artificial