Java: Texto a Voz motores descripción general

Ahora estoy en búsqueda de un Java de Texto a Voz (TTS) marco. Durante mis investigaciones he encontrado varios JSAPI1.0-(parcialmente)-compatible con los marcos mencionados en JSAPI Implementaciones de la página, así como un par de Java TTS marcos en los que no parecen seguir JSAPI spec (María, Decir-Ahora). También he observado que en la actualidad ningún implementación de referencia existe para JSAPI.

Breve las pruebas que he hecho para FreeTTS (primero de la lista en JSAPI impls página) mostrar que está lejos de ser de lectura simple y obvio de las palabras (por ejemplo: ABC, blackboard). Otras pruebas se encuentran actualmente en curso.

Y aquí va la pregunta (6, en realidad):

  1. Que las basadas en Java TTS marcos han utilizado?
  2. Que, por su opinión, son capaces de leer la mayor wordbase?
  3. Lo que acerca de su calidad de voz?
  4. Lo que acerca de su desempeño?
  5. Que no frameworks de Java con Java enlaces hay en la escena?
  6. Que de ellos recomendaría usted?

Gracias de antemano por sus comentarios y sugerencias.

InformationsquelleAutor DiaWorD | 2008-09-27

9 Kommentare

  1. 18

    La verdad es que he tenido muy buena suerte con FreeTTS

  2. 7

    He usado María antes y yo estaba muy impresionado con la calidad de las voces. Por desgracia, no he utilizado ninguno de los otros.

    • María no es fácil de usar. No está muy bien documentado y el proceso de instalación es abismal (espacios en los nombres de directorio, que impide a la clase de los archivos que se encuentran en los sistemas basados en Unix).
    • mary.dfki.de
    • He probado diferentes TTS soluciones y, finalmente, pegado con MaryTTS. Funciona bastante bien y que el programa de instalación con Maven no es tan difícil. Lo puedo recomendar.
  3. 7

    En realidad, no es una gran elección:

    • Festival, la mayoría de edad. Escrito en C++, pero tiene enlaces a Java.
    • eSpeak, rápida y simple, utilizado por el traductor de Google
    • mbrola

    Puro De Java:

    • FreeTTS, de código que se transmite de fiesta, y era de código abierto y el desarrollo se detuvo.
    • MaryTTS – más potente y parece listo para producción.

    También hay otros programas privativos como:

    • Acapella
    • Nuance Vocalizer

    Si su software es solo para Windows, puede utilizar la API de Microsoft Speech.

  4. 5

    He usado AT&T Natural Voices que proporciona JSAPI y MS SAPI ganchos. Proporciona una excelente calidad de voces, un buen «general» diccionario del habla, muchos de los controles sobre la pronunciación, y varios idiomas. Es un poco caro, pero funciona muy bien.

    La he usado para leer importante de sensores de telemetría para los conductores en un móvil la aplicación del sensor. Hemos tenido ninguna queja sobre la calidad de la voz. Tenía alrededor de 75% fuera-de-la-caja de precisión con términos científicos y un mucho más alto (tal vez el 90%+) con la normal del diálogo. Llegamos hasta el 99+% de precisión mediante el uso de marcas (la mayoría de los errores fueron en términos científicos inusuales combinaciones de fonemas).

    Fue un poco duro en el procesador (que estaban corriendo en un Pentium-III equivalente de la máquina y fue empujando 50%-75% de pico de la CPU). Este utiliza un discurso nativo engine (Windows, Linux, y Mac compatible) con una interfaz Java.

    Hay una gran variedad de voces e idiomas…

  5. 1

    He utilizado FreeTTS pero había un gran problema para conseguir el MBrola voces para que se ejecute en Mi MacbookPro. Me hizo llegar MBrola voces para que se ejecute en Windows (dolorosamente) y Linux. Yo he tenido la suerte de carga de cualquier otra paquetes de voz en FreeTTS que es una pena porque el suministrado voces son horribles de la OMI. Fuera de que yo tenía un poco de éxito con Cloudgarden así, sino que sólo se ejecuta en Windows AFAIK. Yo estaría interesado en escuchar a los demás éxitos y fracasos con Voz motores de este tipo de trabajo es particularmente difícil. También estoy jugando un poco con Sphinx4. Me acaba de sacar de abajo JVXML (que parece estar basada en Sphinx4) de anoche, pero no pudo conseguir que se ejecute por alguna extraña razón.

  6. 1

    He contribuido a maría. Yo creo que tiene potencial, si alguien más inteligente de lo que me separa de la HMM voces fuera del núcleo (aquellas voces que no necesita de grandes conjuntos de datos y sonido ok (aceptar). También estoy tratando de hacer un sistema de eventos para freetts para enviar eventos cuando se dice una palabra. He tenido éxito, pero se rompe en linux ahora. (probablemente a causa de un temporizador de error).

  7. 1

    Muchas gracias a todos, el truco está en FreeTTS de origen. Brevemente: si se ejecuta como java -jar freetts.jar some-more-args-here, se traduce en menos palabras de las que cuando se ejecuta en un modo de bin/Server.jar y bin/Client.jar.

  8. 0

    He encontrado poco cómodo con MarryTTS tiene multilenguaje de voz clara y entender.

    T convertir voz a texto, la mejor optiion es sphinx4-5prealpha.
    Doy un pulgar, porque ha ajustable, flexibilidad y modificables en el reconocimiento y la gramática.

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein

Pruebas en línea