Spanish-BFF-2 (Spanish Built Factual Freectianary 2.0): el primer diccionario de uso del español producido con modelos generativos de inteligencia artificial (IA)

Spanish-BFF-2
huggingface.co/datasets/MMG/spanishBFF2
El diccionario Spanish-BFF-2 (Spanish Built Factual Freectianary 2.0) es el primer diccionario de uso del español producido con modelos generativos de inteligencia artificial (IA), concretamente, con GPT-4. La creación de Spanish-BFF-2 se ha llevado a cabo en el marco de un programa de investigación, centrado en la aplicación de modelos de inteligencia artifical a la generación de diccionarios (Ortega-Martín et al. 2024 y 2023).

Las entradas del Spanish-BFF-2 están integradas por los siguientes componentes:
(1) un lema,
(2) su categoría o clase de palabras, p. ej., nombre, verbo, etc., y el género de los nombres y adjetivos,
(3) la definición de cada acepción vinculada al lema, y
(4) un ejemplo de uso, que ilustra el uso de la acepción correspondiente.

Observemos, p. ej., la entrada retransmisión en el Spanish-BFF-2:
Lema: retransmisión
Categoría: Nombre femenino
Definición: Acción y efecto de retransmitir un evento, generalmente por televisión o radio.
Ejemplo de uso: La retransmisión del partido de fútbol fue vista por millones de personas.

El Spanish-BFF-2 se desarrolló con el objetivo de mejorar las características del Spanish-BFF-1, el primer diccionario generado automáticamente con modelos de IA (cf. la información sobre el Spanish-BFF-1 en Infoling 3.7 (2023)). El Spanish-BFF-2 tiene más de 10.000 entradas más que el Spanish-BFF-1, incluye ejemplos de uso asociados a las acepciones de cada lema, por lo que constituye, como hemos señalado anteriormente, el primer diccionario de uso del español generado por modelos de IA.

Building another Spanish dictionary, this time with GPT-4
doi.org/10.48550/arXiv.2406.11218

MMG/spanishBFF2 · Datasets at Hugging Face
huggingface.co/datasets/MMG/spanishBFF2