CoNLL 2017 Shared Task: Multilingual Parsing from Raw Text to Universal Dependencies

La CoNLL 2017 Shared Task se centró en el aprendizaje de analizadores sintácticos de dependencias que puedan funcionar en un entorno real, a partir de texto sin procesar, y que puedan funcionar en muchos idiomas tipológicamente diferentes, incluso idiomas sorpresa para los que hay pocos o ningún dato de entrenamiento, mediante la explotación de un estándar de anotación sintáctica común. Esta tarea ha sido posible gracias a la iniciativa Universal Dependencies (Dependencias Universales), que ha desarrollado corpus sintácticos para más de 50 lenguas con una anotación multilingüe coherente y la posibilidad de recuperar los textos originales en bruto. Los sistemas participantes tenían que encontrar dependencias sintácticas etiquetadas entre palabras, es decir, un núcleo sintáctico para cada palabra y una etiqueta que clasificara el tipo de relación de dependencia. No se disponía de ninguna anotación de referencia (tokenización, segmentación de frases, lemas, morfología) en el texto de entrada.