|
A transcrição é uma das formas mais importantes de arquivamento, perpetuação e disseminação de informação na sociedade atual. A cada momento, milhares de importantes pronunciamentos são proferidos no mundo todo e somente uma fração de seu conteúdo é registrada para a posteridade. Somente no Brasil, há mais de 5.700 Câmaras Municipais e é mínimo o acesso ao cidadão ao conteúdo das sessões legislativas. Por isso, igualmente importante são as aplicações voltadas à transcrição automática de áudio, seja de discursos ao vivo ou de gravações armazenadas. Discursos de parlamentares nas tribunas do Senado Federal, Câmara dos Deputados, Assembléias Legislativas Estaduais e Câmaras de Vereadores poderão ser transcritos e seu conteúdo poderá ser disponibilizado integral e imediatamente, tornando a busca por trechos específicos muito mais simples. Atualmente, é mínimo o acesso do cidadão ao conteúdo das sessões legislativas das mais de 5.700 câmaras municipais de todo o país já que discursos não transcritos ou transcritos parcialmente são de difícil disseminação e busca. Mesmo para transcritores humanos bem treinados em ouvir e transcrever o áudio, o tempo de execução desta elaborada tarefa pode levar dezenas ou mesmo centenas de horas para cada hora de áudio, a um custo bastante elevado. A Transcrição de Fala é uma aplicação tecnológica barata e de grande impacto para a inclusão social. Uma vez que todas as falas importantes estiverem disponíveis na forma de texto, preferencialmente pela Internet, mais e mais pessoas poderão acompanhar de perto os trabalhos de seus representantes eleitos; de forma rápida, ordenada e transparente, cidadãos, pessoas interessadas no trabalho dos parlamentares e até mesmo órgãos jornalísticos poderão ter acesso aos discursos transcritos. Acompanhar a atividade parlamentar é a maior contribuição para o fortalecimento da democracia em nosso país. As áreas de Segurança Pública ou mesmo Nacional também podem se valer da aplicação da transcrição de fala, já que grande parte dos dados obtidos é formada por arquivos de áudio gravados em conversas telefônicas autorizadas judicialmente, ou sinais de rádio captados por antenas especiais. Para combater as atividades criminosas de maneira efetiva, todos estes dados devem ser analisados o mais rapidamente possível a fim de que as medidas cabíveis possam ser tomadas. Para isso, transcrições do todo ou de parte das gravações mostram-se fundamentais. Analogamente, processos judiciais devem possuir, além de provas armazenadas em fitas de áudio, sua respectiva transcrição, para que a pessoa responsável, usualmente o juiz, possa acelerar a sua análise. Estimativas indicam que o mercado mundial de sistemas de ASR alcançará US$ 40 bilhões em 2008. De olho nesta cifra, gigantes como IBM, Microsoft e Sony investem grandes somas no desenvolvimento de seus próprios produtos. O Brasil não fica atrás: com recursos do Fundo para o Desenvolvimento Tecnológico das Telecomunicações, FUNTTEL, através de um convênio com a Financiadora de Estudos e Projetos, FINEP, o Genius (Genius Instituto de Tecnologia) desenvolve o único sistema comercial completo de ASR no país. Um de seus trunfos é coleta de vozes realizada em mais de 16 regiões metropolitanas, com 1.600 pessoas de diferentes idades, sexo, classes sociais, níveis de escolaridade, raças e sotaques. Com ela, os produtos de ASR do Genius dispensam o treinamento prévio do usuário, exigido por outros existentes no mercado. Dessa forma, o sistema torna-se totalmente independente do locutor, passando a entender comandos emitidos por qualquer pessoa que fale o português brasileiro, não importando seu sotaque regional.
|