EXIST-2023-ES

El corpus español EXIST 2023 es una colección de tuits etiquetados con información relacionada con el sexismo: si el tweet es sexista, el tipo de intención que muestra el autor del tuit y el tipo de sexismo que se está ejerciendo.

Idioma(s)
Español
Inglés
Año
2023
Dominio
Social
Tipo Textos
Tuits
Anotaciones
binary label indicating whether a tweet expresses sexism, multiclass lables about the type of sexism and the intention of the author
Formato
json
Acceso a datos
Registro

Publicación
Plaza, L. et al. (2023). Overview of EXIST 2023 – Learning with Disagreement for Sexism Identification and Characterization. In: Arampatzis, A., et al. Experimental IR Meets Multilinguality, Multimodality, and Interaction. CLEF 2023. Lecture Notes in Computer Science, vol 14163. Springer, Cham. https://doi.org/10.1007/978-3-031-42448-9_23
NLP Topic
Número de unidades
4653
Tipo de unidades
Tuits
Tamaño set entrenamiento
3194
Tamaño set evaluación
969
Tamaño set desarrollo
490