|
Quem nunca sonhou com uma casa onde todos os aparelhos obedecem a comandos de voz dos moradores, e respondem educadamente após atenderem aos pedidos? Ou portas que não abrem com chaves, mas obedecem às vozes das pessoas autorizadas - e somente as delas? Ou ainda, computadores que transcrevem textos ditados de forma natural por qualquer pessoa, de qualquer nível educacional ou grau de mobilidade física? Cenários futuristas como esses já estão chegando ao alcance da população brasileira e, o melhor de tudo, possibilitados por tecnologias desenvolvidas por cientistas brasileiros que atuam em centros nacionais de pesquisa e inovação tecnológica. Tais tecnologias atendem coletivamente pelo nome de processamento de fala e incluem reconhecimento, síntese de fala e identificação de locutor. A primeira, reconhecimento de fala, permite a uma máquina compreender a fala humana e tomar as ações correspondentes, desde ligar e desligar aparelhos eletrônicos até transcrever discursos inteiros. Síntese de fala, a segunda tecnologia, é aplicada quando se permite que usuários, falando normalmente e mesmo que com sotaques regionais, possam ser "compreendidos" por máquinas e aparelhos. Finalmente, a tecnologia de identificação de locutor é utilizada quando se deseja autorizar acesso a recintos ou informações através da assinatura de voz do usuário, semelhantemente à sua impressão digital, mas sem os inconvenientes associados ao seu uso. Algumas das aplicações mais nobres das tecnologias de processamento de fala são as relacionadas à melhoria da qualidade de vida de deficientes físicos. Hoje, no Brasil, há mais de 25 milhões de cidadãos com deficiências físicas, auditivas e, principalmente, visuais, entre outras. Para essas pessoas, muitas atividades simples, como lidar com eletrodomésticos e aparelhos eletrônicos, especialmente computadores, podem ser extenuantes ou até mesmo impossíveis. A liberação desta "prisão" tecnológica somente se dará quando novas alternativas de interação homem-máquina estiverem disponíveis comercialmente. As tecnologias de processamento de fala, em particular, são as mais promissoras e apropriadas, já que possibilitam ao portador de alguma deficiência visual ou física, desempenhar funções que normalmente não praticaria, como ir a um caixa eletrônico sacar dinheiro ou trabalhar com um computador, por exemplo, integrando-o à sociedade como um cidadão comum, sem passar pelo constrangimento de suas limitações.
|