Автоматизированный фоносемантический и контент-анализ

1) Vaal mini




    Анализируемые текста включали в себя информацию об эмоциональной составляющей собак. 

    В первом тексте говорилось о привязанности между собакой и человеком. Анализ Vaal показал, что текст производит впечатление светлого, нежного, женственного, с чем я могу согласиться.
    Во втором тексте уже  присутствует больше неоднозначности, однако программа все так же определяет его как женственный, маленький и веселый.
    Смотря на анализ Vaal, отличия заключаются в том, что первый текст более однозначен. По шкалам он уходит в более дружелюбные синонимы, что связано с тем как в тексте преподносится тема и проблема эмоциональной связи между человеком и собакой. Второй же текст в некоторых моментах уходит больше в категорию "злой", "шероховатый", что связано с тем, как описывается проблема тревожности и к каким проблемам она приводит.


2) Orange: Для анализа были взяты текста про фототехнику и её разновидности.

 1 текст:



2 текст: 






Сравнение:

    В первом тексте встречаются и позитивные, и негативные характеристики.
    Это связано с тем, что тема связана с цифровыми и плёночными фотоаппаратами — сравниваются их преимущества и недостатки. 
    На облаке слов видно часто встречающиеся слова: «съёмки», «для», «цифровые», «камеры», «плёнки», «фотоаппараты». Это показывает, что текст сосредоточен на описании техники и сравнениях.
    В тематическом моделировании (Topic Modelling) выделена одна основная тема, включающая слова вроде «съёмки», «плёнка», «пыль», что подтверждает технический и сравнительный характер текста. 

    Во втором тексте в основном позитивные слова. Он посвящён устройству фотоаппарата и объективов, где речь идёт о фокусном расстоянии, зрении, объективе, изображении. 
    На облаке слов выделяются слова «фотоаппарат», «объектив», «фокусное», «расстояние», «зрение». Это указывает, что текст описывает устройство и принципы работы техники, без эмоциональной окраски. 
    В Topic Modelling также выделилась одна основная тема с ключевыми словами «фотоаппарат», «объектив», «зрение», что подтверждает техническую направленность текста. 

    Сравнение методов  Word Cloud показывает чаще встречающиеся слова и позволяет легко понять, о чём идёт текст. 
    Topic Modelling выделяет общие темы, но при малом объёме текста работает не очень точно.
    
    Вывод Оба метода отражают содержание текстов, но Word Cloud делает это нагляднее. С его помощью проще увидеть, какие слова доминируют и какова основная тематика. Topic Modelling полезен для анализа больших наборов текстов, но в коротких текстах даёт обобщённые результаты.

Комментарии