Архив журнала
РАЗРАБОТКА КОМПЬЮТЕРНОЙ ПРОГРАММЫ АВТОМАТИЧЕСКОГО АНАЛИЗА И КЛАССИФИКАЦИИ ПОЛЯРИЗОВАННЫХ ПОЛИТИЧЕСКИХ ТЕКСТОВ НА АНГЛИЙСКОМ ЯЗЫКЕ ПО УРОВНЮ ИХ МАНИПУЛЯТИВНОГО ВОЗДЕЙСТВИЯ: ПРАКТИЧЕСКИЕ РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ
- 316
- Файл статьи: PDF
Аннотация: Статья посвящена обсуждению практических результатов, полученных в рамках проекта по разработке
компьютерной программы — классификатора англоязычных политических текстов о России по уровню их манипулятивного воздействия. Актуальность проекта обусловлена тем, что в условиях информационной войны и проницаемости национальных массмедийных пространств англоязычные манипулятивные тексты могут служить не только подогреванию русофобии среди западных читателей, но и, в случае репоста или перепечатки, стать инструментом манипулирования сознанием владеющих английским
языком представителей российского гражданского общества. Методология создания программы-классификатора основана на
лингвистических методах дискурс-анализа и социолингвистического эксперимента, а также на алгоритме прецедентного машинного обучения «Деревья решений». В качестве параметров оценки используется относительное количество в тексте следующих
маркеров манипуляции: военной лексики, нацистского лексикона, лексем с префиксами «pro-» и «anti-», морфемы «soviet», маркеров манипулятивности, полученных в социолингвистическом эксперименте, и имен политических лидеров, в частности Владимира
Путина. Результатом проверки является атрибуция текста как принадлежащего к одному из 4 классов, сопровождаемая соответствующим сообщением: класс 1 — тексты, не содержащие манипуляции (сообщение: «This text doesn’t seem to have any bias»),
класс 2 — тексты с низким уровнем манипулятивности (сообщение: «Bias degree is low»), класс 3 — тексты со средним уровнем
манипулятивности (сообщение: «Bias degree is medium»), класс 4 — тексты с высоким уровнем манипулятивности (сообщение:
«Bias degree is high»). В настоящее время прототип программы успешно апробирован в Междисциплинарном центре исследований
цифровой экономики СФУ
Ключевые слова: манипулятивное воздействие; политический дискурс; поляризованный дискурс; компьютерные программы; медиадискурс; СМИ; средства массовой информации; политические тексты; английский язык
Abstract: The article discusses the results in terms of the project devoted to designing a computer classifier of English polarized
political texts about Russia by their manipulative impact. The project relevance is due to the fact that English texts largely using manipulative technics and strategies could serve as an instrument of information war against the Russian civil society. In the situation of national
mass media areas penetrance, such texts, after reposting and reprinting by Russian Internet users or Internet media, could have a serious
impact on the worldview of young Russian people speaking English. The computer classifier is built on the linguistic methodology of discourse analysis and sociolinguistic experiment, while its technological basis is grounded on the supervised machine learning approach using
decision trees algorithm. Our feature list includes the Soviet lexicon items, the Nazi lexicon items, military terms, discursive markers of manipulation selected by the respondents, the prefixes “pro-”, “anti”, the morpheme “Soviet” and precedent names or political personalities.
After checking the text fragment, the classifier attributes it to one of the four classes and displays on the screen the appropriate message:
texts without any manipulation (This text doesn't seem to have any bias), texts with low degree of manipulation (Bias degree is low), texts
with medium degree of manipulation (Bias degree is medium), highly manipulative texts (Bias degree is high). The computer program’s
prototype has been successfully tested in the Centre of Digital Economics of Siberian Federal University
Key words: manipulation; political discourse; polarized discourse; computer program; media discourse; mass media; media; political text; the English language