Repository logo
 
Loading...
Profile Picture
Person

Gouveia, Paulo D.F.

Search Results

Now showing 1 - 3 of 3
  • A project of speech input and output in an e-commerce application
    Publication . Freitas, Diamantino Silva; Moura, António; Braga, Daniela; Ferreira, Hélder Pires; Teixeira, João Paulo; Barros, Maria João; Gouveia, Paulo D.F.; Latsch, Vagner
    The present paper describes the work done during the last year in the development of European Portuguese (EP) speech recognition and synthesis channels for an Internet e-commerce application. The objective of this work was to develop the appropriate speech input and output, to enable the user to more comfortably use an e-commerce web site issuing commands and options under guidance of a menu system. The speech interface operation guidelines are briefly described in their principles and resulting specifications for the speech channels, namely, menu structure and operation dynamics, and in the following, the system software approach and the speech recognition and synthesis modules are presented. A discussion is done about some project trade-offs and results obtained so far. Future perspectives of the on-going work are also presented.
  • Divisão silábica automática do texto escrito e falado
    Publication . Gouveia, Paulo D.F.; Teixeira, João Paulo; Freitas, Diamantino Silva
    Este artigo apresenta um algoritmo que permite realizar automaticamente a separação silábica do texto como uma etapa do desenvolvimento de um trabalho mais extenso, que é o estudo de modelos prosódicos para o português europeu, enquadrado no desenvolvimento de um sintetizador de fala. O algoritmo de separação silábica está foi concebido para aplicação em duas situações distintas: na primeira é aplicado ao texto escrito e na segunda à sequência de fonemas realmente produzidos na locução desse mesmo texto. Cada uma das aplicações está envolta nas suas peculiaridades e dificuldades, que são descritas, bem como as soluções adoptadas para a sua resolução. No primeiro caso consegue-se uma taxa de erro de 0,06% e no segundo caso uma taxa de erro de 0,89%. O algoritmo baseia-se na consideração de sílabas dos tipos V, VC, VCC, CV, CVC, CCV e CCVC, sendo V uma vogal ou ditongo e C uma consoante, que se admite cobrirem todas as sílabas existentes em Português.
  • Multivox: conversor texto fala para português
    Publication . Teixeira, João Paulo; Freitas, Diamantino Silva; Gouveia, Paulo D.F.; Olaszy, Gabor; Nemeth, G.
    Apresenta-se neste artigo uma visão genérica sobre sistemas de conversão texto-fala. Aborda-se de uma forma mais detalhada o sistema MULTIVOX de conversão texto fala para o português como um modelo de síntese de formantes baseado em regras. Este sistema foi desenvolvido no âmbito da cooperação entre o CEFAT e a Universidade Técnica de Budapeste em duas versões. Uma primeira versão, desenvolvida até 1996, que será descrita por blocos para permitir uma melhor compreensão deste sistema. Uma segunda versão, ainda em desenvolvimento, será apresentada nas suas potencialidades. O sistema corre num processador 386 ou superior com recurso a uma placa de circuito impresso dedicada para realizar a síntese [1], em sistemas de mínimo porte ou num processador 486 ou superior apenas com placa de som, sendo desta forma a síntese realizada inteiramente por software.