La CoNLL 2017 Shared Task se centró en el aprendizaje de analizadores sintácticos de dependencias que puedan funcionar en un entorno real, a partir de texto sin procesar, y que puedan funcionar en muchos idiomas tipológicamente diferentes, incluso idiomas sorpresa para los que hay pocos o ningún dato de entrenamiento, mediante la explotación de un estándar de anotación sintáctica común. Esta tarea ha sido posible gracias a la iniciativa Universal Dependencies (Dependencias Universales), que ha desarrollado corpus sintácticos para más de 50 lenguas con una anotación multilingüe coherente y la posibilidad de recuperar los textos originales en bruto. Los sistemas participantes tenían que encontrar dependencias sintácticas etiquetadas entre palabras, es decir, un núcleo sintáctico para cada palabra y una etiqueta que clasificara el tipo de relación de dependencia. No se disponía de ninguna anotación de referencia (tokenización, segmentación de frases, lemas, morfología) en el texto de entrada.
CoNLL 2017 Shared Task: Multilingual Parsing from Raw Text to Universal Dependencies
Forum
Año
2017
Enlace a publicación