14/09/2025  23h58
· Guia 2025     · O Guaruçá     · Cartões-postais     · Webmail     · Ubatuba            · · ·
O Guaruçá - Informação e Cultura
O GUARUÇÁ Índice d'O Guaruçá Colunistas SEÇÕES SERVIÇOS Biorritmo Busca n'O Guaruçá Expediente Home d'O Guaruçá
Acesso ao Sistema
Login
Senha

« Cadastro Gratuito »
SEÇÃO
Informática e Internet
19/02/2005 - 08h29
Software brasileiro para análise de textos
Agência USP de Notícias
 
O DiZer é o primeiro programa brasileiro de analise discursiva de textos para português do Brasil. Software poderá ser utilizado em diversos sistemas de processamento da língua, como sumarizadores e tradutores automáticos.

O Núcleo Interinstitucional de Lingüística Computacional (NILC), do Instituto de Ciências Matemáticas e de Computação (ICMC) da USP de São Carlos, desenvolveu o primeiro software brasileiro de análise discursiva de textos. O DiZer é um analisador automático para o português do Brasil que poderá ser utilizado em diversos sistemas de processamento da língua, como sumarizadores de textos e tradutores automáticos, entre outros.

Thiago Alexandre Salgueiro Pardo, doutorando em Ciência da Computação e autor do projeto, explica que o programa tem a capacidade de detectar relações entre as sentenças/orações de um texto, construindo sua estrutura discursiva, isto é, uma estrutura que indica como as partes do texto se relacionam e contribuem para o entendimento umas das outras. "Se dissermos, por exemplo, ’Choveu pela manhã. O chão está molhado’, nós, humanos, somos capazes de reconhecer a relação de causa que existe entre as duas sentenças. Para um computador, entretanto, esta é uma tarefa difícil."

Para que seja possível reconhecer automaticamente este conhecimento implícito no texto, o analisador discursivo faz uso de várias técnicas, como a detecção de marcadores textuais, uso de conhecimento de mundo e de dados estatísticos. Por exemplo, na sentença "Ele gosta de massas, mas não gosta de macarrão.", é possível detectar automaticamente uma relação de contraste entre as orações dessa sentença devido à presença do marcador "mas". Na ausência de marcadores textuais, como no trecho de texto "Choveu pela manhã. O chão está molhado", pode-se fazer uso, por exemplo, do conhecimento de mundo de que chover implica molhar.

Uso acadêmico

O pesquisador informa que, no momento, o software está sendo utilizado apenas em textos acadêmicos. "Está pronto, porém ainda não o testamos em outros textos, que não os científicos", informa. Em fase de conclusão, o sistema resultante é a base da tese de doutorado do pesquisador, que ainda está em andamento. "Podemos considerar que estamos ainda em fase de aprimoramento do software, pois sempre há inovações a serem testadas e adaptações a serem feitas. Mas trata-se de um produto que tem apresentado desempenho satisfatório. É um passo a mais que damos para o entendimento automático de textos."

Thiago Pardo informa que se sabe de alguns analisadores discursivos para as línguas inglesa e japonesa. "Para o português do Brasil, o DiZer é o primeiro", afirma. O pesquisador teve sua pesquisa financiada pela FAPESP - Fundação de Amparo à Pesquisa do Estado de São Paulo, pela CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior, e pela Comissão Fulbright, sob a orientação da professora Maria das Graças Volpe Nunes, no Programa de Pós-Graduação em Ciências da Computação do ICMC da USP de São Carlos.

PUBLICIDADE
ÚLTIMAS PUBLICAÇÕES SOBRE "INFORMÁTICA E INTERNET"Índice das publicações sobre "INFORMÁTICA E INTERNET"
26/01/2022 - 05h47 Agência Brasil explica o que são cookies
20/04/2021 - 06h28 Cyber segurança e os dados
11/02/2021 - 06h10 Dia da Internet Segura
03/08/2020 - 07h40 Brasil, o país do podcast
02/08/2020 - 06h25 Como evitar ataques cibernéticos em home office
27/06/2020 - 06h53 Como evitar ataques cibernéticos em home office
· FALE CONOSCO · ANUNCIE AQUI · TERMOS DE USO ·
Copyright © 1998-2025, UbaWeb. Direitos Reservados.