Файл статьи: PDF
Аннотация: Непрерывный рост объемов информации в средствах массовой коммуникации приводит к повышению трудоемкости ручной классификации текстов. Для автоматизации этой деятельности создан ряд компьютерных средств, но уровень их эффективности недостаточно высок для того, чтобы упростить деятельность экспертов. Предлагается подход к созданию систем автоматической рубрикации новостных сообщений, основанный на компьютерных методах комплексного лингвистического анализа текстов, анализируются способы оценки эффективности таких систем
Ключевые слова: новостные сообщения; медиадискурс; автоматическая рубрикация текстов; тематическая структура дискурса; автоматический семантический анализ
Abstract: The continuous growth of the amount of information in mass media leads to the increase of labourintensity of manual text classification. A set of computer tools is developed to automate this process, but the level of effectiveness of these tools is not high enough to simplify the work of the experts. This article introduces an approach to development of automatic classification systems of news reports, based on machine-driven complex linguistic analysis. Some techniques of evaluation of effectiveness of those systems are discussed
Key words: news reports; media discourse; automatic text classification; topical structure of discourse; automatic semantic analysis

Контент доступен под лицензией Creative Commons Attribution 4.0 License.