03/06/2025
🧐Interesante propuesta... CecilIA dará de qué hablar... Cuéntanos en los comentarios si utilizas herramientas con IA📲, para qué o cuáles prefieres. Te leemos👀
| 📲🪇 Cecilia es una familia de modelos lingüísticos preentrenados continuamente con texto escrito cubano, que capturan las particularidades lingüísticas, culturales y sociales del español cubano.
🤝 Este modelo cubano es desarrollado por el Grupo de Investigación en Inteligencia Artificial (GIA-UH) de la Universidad de La Habana, con la colaboración del Grupo de Procesamiento del Lenguaje y Sistemas de Información (GPLSI) de la Universidad de Alicante y el apoyo de Syalia SRL y Epistemial.
📳 Cecilia Tiny se preentrenó continuamente durante dos épocas completas con un corpus privado de aproximadamente 1000 millones de tokens de texto escrito cubano, que incluye:
- 10 años de los periódicos cubanos más relevantes.
- La Enciclopedia Cubana (ecured.cu).
- La colección completa de leyes cubanas.
- Más de 400 obras literarias cubanas importantes.
- Varias enciclopedias locales que documentan cubanismos y elementos culturales.
- Cientos de letras de canciones de cantantes cubanos populares.
✅ Por ende, este diverso conjunto de datos garantiza que Cecilia capture un amplio espectro de la lengua, la cultura y la historia cubanas.
😎 Puede utilizarse para diversas tareas relacionadas con el español cubano, como:
- Generación y completamiento de textos.
- Análisis de sentimientos en redes sociales o literatura cubana.
- Reconocimiento de entidades específicas de Cuba.
- Traducción automática y comprensión lingüística adaptadas al español de Cuba.
- Investigación sobre fenómenos lingüísticos y estudios culturales cubanos.
Próximamente daremos más detalles 😉
Facultad de Matemática y Computación - Universidad de La Habana Unión de Informáticos de Cuba Ministerio de Ciencia, Tecnología y Medio Ambiente de Cuba Ministerio de Comunicaciones República de Cuba Ministerio de Cultura de Cuba Universidad de las Ciencias Informáticas