В данной работе рассматривается такая область автоматической обработки текстов, как извлечение ключевых слов (КС). На основе анализа 123 публикаций приведена описательная статистика ряда показателей перспективных из существующих алгоритмов извлечения КС. Обсуждается проблематика практического оценивания качества решений по извлечению КС с учетом специфики данной задачи.
Обсуждаются вопросы информационной значимости аннотации и списка ключевых слов, которые рассматриваются как синонимические тексты в рамках моделированного текста научной статьи. На основе корпусного анализа научных публикаций делаются выводы о характерных недостатках в выборе списка ключевых слов и написании аннотации авторами публикаций, предлагаются пути увеличения роли этих текстовых форм в поисковых / информационных целях.