Архив журнала
КОМПЛЕКСНЫЙ ЛИНГВИСТИЧЕСКИЙ ПОДХОД К АВТОМАТИЧЕСКОЙ РУБРИКАЦИИ НОВОСТНЫХ СООБЩЕНИЙ
- 310
- Файл статьи: PDF
Аннотация: Непрерывный рост объемов информации в средствах массовой коммуникации приводит
к повышению трудоемкости ручной классификации
текстов. Для автоматизации этой деятельности
создан ряд компьютерных средств, но уровень их эффективности недостаточно высок для того, чтобы
упростить деятельность экспертов. Предлагается
подход к созданию систем автоматической рубрикации новостных сообщений, основанный на компьютерных методах комплексного лингвистического анализа текстов, анализируются способы оценки эффективности таких систем
Ключевые слова: новостные сообщения; медиадискурс; автоматическая рубрикация текстов; тематическая структура дискурса; автоматический семантический анализ
Abstract: The continuous growth of the amount of information in mass media leads to the increase of labourintensity of manual text classification. A set of computer
tools is developed to automate this process, but the level
of effectiveness of these tools is not high enough to simplify the work of the experts. This article introduces an approach to development of automatic classification systems
of news reports, based on machine-driven complex linguistic analysis. Some techniques of evaluation of effectiveness of those systems are discussed
Key words: news reports; media discourse; automatic
text classification; topical structure of discourse; automatic semantic analysis