Número de Chamada
|
006.35 M775l DIS
|
Autor Principal
|
Monteiro Junior, Almir
|
Entradas Secundárias - Autor
|
Favero, Eloi Luiz , orient. Universidade Federal do Pará. Centro Tecnológico. Departamento de Elétrica. Programa de Pós-Graduação em Engenharia Elétrica.
|
Título Principal
|
LexWeb : um léxico da língua portuguesa extraído automaticamente da Internet / Almir Monteiro Junior; orientador, Eloi Luiz Favero
|
Publicação
|
2004.
|
Descrição Física
|
iv,78 f. : il. ; 30 cm
|
Notas
|
Área de concentração : Computação aplicada Dissertação (mestrado) - Universidade Federal do Pará, Centro Tecnológico, Departamento de Elétrica, Programa de Pós-Graduação em Engenharia Elétrica, 2004 Inclui referências bibliográficas Resumo: o conhecimento do comportamento de uma língua escrita é extremamente complexo e se constitui em um dos maiores desafios para a área de Processamento de Linguagem Natural (PLN). Um componente necessário em todo sistema de PLN é um léxico 1, como um dicionário eletrônico que coleta todas as palavras de uma língua. O léxico provê um conjunto de funcionalidades, tais como, verificar a existência de uma determinada palavra e, caso exista, indicar os seus traços lingüísticas, entre outros: classe (substantivo, verbo, pronome, etc.), gênero, número e pessoa. Esta dissertação propõe a construção de um léxico para o português a partir dos textos encontrados na Web. Ele é construído com ferramentas que automaticamente visitam as páginas da Web e coletam as palavras. O núcleo deste léxico é uma lista com todas as palavras encontradas nas páginas da Web, na qual
cada palavra possui a sua freqüência de ocorrência. Adicionalmente, ferramentas que fazem uso de textos etiquetados de domínio público são utilizadas para classificar e atribuir os traços para cada palavra.
|
Assuntos
|
Processamento de linguagem natural (Computação) Servidores da web - Programas de computador Inteligência artificial
|
|