Практическое задание №4. Автоматизированный кластерный анализ
1. Я использовала 10 текстов с одной тематикой "Особенности русской культуры". Каждый текст раскрывал различные аспекты русской культуры, включая кухню, литературу, архитектуру и т.д.
2. Мои тексты разделились на четыре группы.
В первую группу вошли два текста, наиболее приближенные друг к другу по своей теме (современная русская культура и влияние русской культуры на мировую).
Во второй группе оказался только один текст про язык и фольклор, в котором было наименьшее количество необходимых ключевых слов.
Третья - самая большая группа, в которую вошли 5 текстов (архитектура, искусство и живоспись, народные традиции, музыка и танцы, религия и духовность). Их объединяет то, что они являются отдельными элементами одной темы.
В последнюю - четвёртую - группу вошли два текста - русская кухня и русская литература. Их, скорее всего, объединило наличие ключевых слов как в заголовках, так и внутри текстов.
Такое разделение обусловено похожими заголовками и наличием ключевых слов, повторяющихся в нескольких текстах.
3. При изменении уровня кластеризации, число групп менялось. При перемещении разделителя в левую сторону, групп становилось меньше (минимальное количество - 2 группы), а при перемещении в правую сторону - больше (максимальное - 10 групп).
Комментарии
Отправить комментарий