Автоматизированный фоносемантический и контент-анализ
1) Vaal mini
Анализируемые текста включали в себя информацию об эмоциональной составляющей собак.
В первом тексте говорилось о привязанности между собакой и человеком. Анализ Vaal показал, что текст производит впечатление светлого, нежного, женственного, с чем я могу согласиться.
Во втором тексте уже присутствует больше неоднозначности, однако программа все так же определяет его как женственный, маленький и веселый.
Смотря на анализ Vaal, отличия заключаются в том, что первый текст более однозначен. По шкалам он уходит в более дружелюбные синонимы, что связано с тем как в тексте преподносится тема и проблема эмоциональной связи между человеком и собакой. Второй же текст в некоторых моментах уходит больше в категорию "злой", "шероховатый", что связано с тем, как описывается проблема тревожности и к каким проблемам она приводит.
2) Orange: Для анализа были взяты текста про фототехнику и её разновидности.
1 текст:
2 текст:
Это связано с тем, что тема связана с цифровыми и плёночными фотоаппаратами — сравниваются их преимущества и недостатки.
На облаке слов видно часто встречающиеся слова: «съёмки», «для», «цифровые», «камеры», «плёнки», «фотоаппараты». Это показывает, что текст сосредоточен на описании техники и сравнениях.
В тематическом моделировании (Topic Modelling) выделена одна основная тема, включающая слова вроде «съёмки», «плёнка», «пыль», что подтверждает технический и сравнительный характер текста.
Во втором тексте в основном позитивные слова. Он посвящён устройству фотоаппарата и объективов, где речь идёт о фокусном расстоянии, зрении, объективе, изображении.
На облаке слов выделяются слова «фотоаппарат», «объектив», «фокусное», «расстояние», «зрение». Это указывает, что текст описывает устройство и принципы работы техники, без эмоциональной окраски.
В Topic Modelling также выделилась одна основная тема с ключевыми словами «фотоаппарат», «объектив», «зрение», что подтверждает техническую направленность текста.
Сравнение методов Word Cloud показывает чаще встречающиеся слова и позволяет легко понять, о чём идёт текст.
Topic Modelling выделяет общие темы, но при малом объёме текста работает не очень точно.
Вывод Оба метода отражают содержание текстов, но Word Cloud делает это нагляднее. С его помощью проще увидеть, какие слова доминируют и какова основная тематика. Topic Modelling полезен для анализа больших наборов текстов, но в коротких текстах даёт обобщённые результаты.
Комментарии
Отправить комментарий