Аннотация:
Описаны основные проблемы, возникающие в ходе автоматизации разметки имплицитных логико-семантических отношений (ЛСО), проанализированы причины этих проблем, а также предложены подходы к их решению. Последовательно рассмотрены основные этапы этого процесса: (1) поиск примеров с имплицитными ЛСО; (2) выявление границ аргументов отношения; (3) выбор признаков размечаемых фрагментов. Проанализированы результаты применения метода поиска с исключением в параллельных текстах и отмечены ограничения этого метода. Рассмотрены два фактора, затрудняющих автоматизацию разметки аргументов ЛСО: длина аргументов может сильно варьироваться и аргумент не обязательно включает последовательность соседних токенов, а может прерываться. Детально проанализированы пути автоматизации выбора признаков размечаемых фрагментов. Продемонстрировано, что даже обработка формальных признаков может требовать привлечения экспертов. Что же касается семантических признаков, то среди них есть как признаки, обработка которых может быть частично автоматизирована, так и те, которые на данном этапе могут размечаться только вручную. Выводы иллюстрируются примерами из корпуса.