Noticias del Proyecto CIEMPIESS-UNAM
En esta sección compartimos las últimas noticias relacionadas con el Proyecto CIEMPIESS-UNAM.
Métete aquí para enterarte de nuestras últimas versiones de software, tutoriales, recursos lingüísticos, documentación,publicaciones, etc, etc.
Actualización de Transcripciones del CIEMPIESS-TEST
Carlos Mena
2023-03-03
Hemos liberado una actualización de las transcripciones del CIEMPIESS-TEST.
Agradecimiento especial a Mónica Alejandra Ruíz López quien es la responsable de esta actualización....
NUEVO Corpus Publicado: Wikipedia Spanish Corpus
Carlos Mena
2021-08-18
Hace unos días (16 de Agosto de 2021) el Linguistic Data Consortium (LDC) nos ha publicado el Wikipedia Spanish Corpus desarrollado por el Proyecto CIEMPIESS-UNAM a través de sus alumnos de ...
El primer corpus en maltés para ASR
Carlos Mena
2020-01-22
El equipo MASRI de la Universidad de Malta publicó hoy su primer corpus en idioma maltés para uso en reconocimiento automático de voz o ASR por sus siglas en inglés.
El corpus puede soli...
Corpus LibriVox Spanish Publicado por LDC
Carlos Mena
2020-01-16
El día de hoy fue publicado el Corpus LibriVox Spanish por el Linguistic Data Consortium. Se trata de un corpus compuesto por unas 73 horas de audio limpio tomado de los audio-libros del pro...
Publicación del CIEMPIESS-PNPD en el OpenCor 2019
Carlos Mena
2019-10-14
El CIEMPIESS Proper-Names Pronouncing Dictionary (CIEMPIESS-PNPD) es un diccionario de pronunciación con más de 200 mil entradas.
Fue publicado el 8 de octubre en la conferencia OpenCor 20...
Publicación de nuestros modelos de PocketSphinx por parte del CMU Sphinx Group
Carlos Mena
2019-08-24
El CMU Sphinx Group nos ha publicado unos modelos para PocketSphinx en español creados a partir de 581 horas de audio. El link de descarga es el siguiente:
https://sourceforge.ne...
Publicación del CIEMPIESS Experimentation Package
Carlos Mena
2019-05-15
El CIEMPIESS Experimentation Package es un paquete de 3 diferentes corpus; específicamente el CIEMPIESS Complementary, el CIEMPIESS Fem y el CIEMPIESS Test.
Fue publicado hoy en el Linguis...
Se libera el TEDx Spanish Corpus
Carlos Mena
2019-05-10
El TEDx Spanish Corpus es un dataset de 24 horas de duración destinado a crear modelos acústicos para uso en reconocimiento automático de voz. Fue publicado en el OPEN SLR Website ( http://w...
23a Reunión Internacional de la IEEE
Carlos Mena
2019-05-10
Presentamos un paper que habla sobre el Corpus HM150 en el congreso ROC&C Organizado por la IEEE. La nota sobre este evento salió en la Gaceta Digital de la Facultad de Ingeniería ( época 2,...
desarrollo del portal
Frederick Álvarez
2014-04-15
Con el portal se facilitará la difusión del trabajo que se hace en el laboratorio de procesamiento de voz para que las demás institución de educación y de este modo la comunidad del software...