CIEMPIESS-UNAM

Noticias del Proyecto CIEMPIESS-UNAM

En esta sección compartimos las últimas noticias relacionadas con el Proyecto CIEMPIESS-UNAM.
Métete aquí para enterarte de nuestras últimas versiones de software, tutoriales, recursos lingüísticos, documentación,publicaciones, etc, etc.

Actualización de Transcripciones del CIEMPIESS-TEST

Carlos Mena
2023-03-03
Hemos liberado una actualización de las transcripciones del CIEMPIESS-TEST. Agradecimiento especial a Mónica Alejandra Ruíz López quien es la responsable de esta actualización....

Articulo completo

NUEVO Corpus Publicado: Wikipedia Spanish Corpus

Carlos Mena
2021-08-18
Hace unos días (16 de Agosto de 2021) el Linguistic Data Consortium (LDC) nos ha publicado el Wikipedia Spanish Corpus desarrollado por el Proyecto CIEMPIESS-UNAM a través de sus alumnos de ...

Articulo completo

El primer corpus en maltés para ASR

Carlos Mena
2020-01-22
El equipo MASRI de la Universidad de Malta publicó hoy su primer corpus en idioma maltés para uso en reconocimiento automático de voz o ASR por sus siglas en inglés.

El corpus puede soli...

Articulo completo

Corpus LibriVox Spanish Publicado por LDC

Carlos Mena
2020-01-16
El día de hoy fue publicado el Corpus LibriVox Spanish por el Linguistic Data Consortium. Se trata de un corpus compuesto por unas 73 horas de audio limpio tomado de los audio-libros del pro...

Articulo completo

Publicación del CIEMPIESS-PNPD en el OpenCor 2019

Carlos Mena
2019-10-14
El CIEMPIESS Proper-Names Pronouncing Dictionary (CIEMPIESS-PNPD) es un diccionario de pronunciación con más de 200 mil entradas. Fue publicado el 8 de octubre en la conferencia OpenCor 20...

Articulo completo

Publicación de nuestros modelos de PocketSphinx por parte del CMU Sphinx Group

Carlos Mena
2019-08-24
El CMU Sphinx Group nos ha publicado unos modelos para PocketSphinx en español creados a partir de 581 horas de audio. El link de descarga es el siguiente:

https://sourceforge.ne...

Articulo completo

Publicación del CIEMPIESS Experimentation Package

Carlos Mena
2019-05-15
El CIEMPIESS Experimentation Package es un paquete de 3 diferentes corpus; específicamente el CIEMPIESS Complementary, el CIEMPIESS Fem y el CIEMPIESS Test. Fue publicado hoy en el Linguis...

Articulo completo

Se libera el TEDx Spanish Corpus

Carlos Mena
2019-05-10
El TEDx Spanish Corpus es un dataset de 24 horas de duración destinado a crear modelos acústicos para uso en reconocimiento automático de voz. Fue publicado en el OPEN SLR Website ( http://w...

Articulo completo

23a Reunión Internacional de la IEEE

Carlos Mena
2019-05-10
Presentamos un paper que habla sobre el Corpus HM150 en el congreso ROC&C Organizado por la IEEE. La nota sobre este evento salió en la Gaceta Digital de la Facultad de Ingeniería ( época 2,...

Articulo completo

desarrollo del portal

Frederick Álvarez
2014-04-15
Con el portal se facilitará la difusión del trabajo que se hace en el laboratorio de procesamiento de voz para que las demás institución de educación y de este modo la comunidad del software...

Articulo completo