пост
В днешния си блог д-р Елена Зайцева, научен сътрудник за научноизследователска и развойна дейност в Академията за преподаване и обучение към Университета „Джон Мурс“ в Ливърпул, описва своето търсене на удобен за потребителя инструмент, който позволява на изследователите да получат общ преглед на целия пейзаж от данни. Тя използва инструмента за текстов анализ Leximancer за извършване на автоматизиран семантичен анализ на отговорите на отворени въпроси в анкети; данни, които често остават непроверени.

Изследователските интереси на Елена са в областта на студентския опит във висшето образование, идентичността на обучаемия и пътуванията на обучаемите. Тя използва софтуера за семантичен анализ Leximancer за анализ на големи качествени масиви от 2011 г. Резултатите от това изследване са публикувани в Journal of Quality in Higher Education Journal, няколко глави от книги и в два доклада, поръчани от Академията за висше образование (сега Advance HE ).

Навигиране в пейзажа на качествени данни в проучвания с автоматизиран семантичен анализ

Размишлявайки върху количествено-качественото разделение в мащабни данни от проучвания преди почти двадесет години, Болден и Москарола (2000) стигат до заключението, че коментарите в свободен текст (напр. Отговори на отворени въпроси във въпросници) са „слабо използвани, или са напълно игнорирани, анализирани не- систематично или третирани като отстранени “(Bolden and Moscarola, 2000, стр. 450). Две десетилетия по-късно и не се е променило много. Проучването на хиляди фрагментирани отворени отговори на въпроси, вариращи от кратка фраза или изречение до мини-разкази или дълги размишляващи разкази, остава сложно, отнемащо време и ресурси упражнение за изследователите. Навременният анализ на коментарите в свободен текст може да помогне не само да подобри разбирането на количествените резултати, но и да разкрие нови дискурси, които не е задължително да се очакват от създателите на проучването.

Като част от финансиран от Съвета за финансиране на висшето образование за Англия (HEFCE) проект за „Sophomore Slump“, който разследва разцепването и недостатъчната ефективност на студенти от втора година, предприехме сравнителен анализ на коментари, предоставени в проучване на студенти, разположено на всяко ниво на обучение (сравняване на теми от отзивите на студентите от първа, втора и последна година) (Zaitseva et al, 2013). Всеки набор от данни включваше средно 250 страници текст с един интервал Times New Roman шрифт с 12 точки.

Търсенето ми на лесен за употреба инструмент, който ще ни позволи незабавно да видим целия институционален пейзаж на обратната връзка на студентите за всяко ниво на обучение и да можем да открием различия и да разберем подробно в конкретните области или теми, ме доведе до Leximancer - инструмент за визуализиране на концептуалната и тематичната структура на текст, разработен в университета в Куинсланд (Smith and Humphreys, 2006).

Софтуерът автоматично идентифицира концепции, теми (клъстери от концепции) и връзки между тях чрез извличане на данни на текст и визуално представяне на констатациите под формата на концептуална карта - процес, наречен ненаблюдавано семантично картографиране на естествения език. Въз основа на предположението, че понятието се характеризира с думи, които са склонни да се появяват заедно с него, софтуерът измерва доколко една дума е подходяща за набор от други думи. Само думи, които преминават определен праг на тежест на релевантност, установен от софтуера, формират концепции, въпреки че този параметър може да се регулира ръчно (Фиг. 1).

Фигура 1. Пример за концептуална карта, генерирана от Leximancer

Инструментът не само определя ключовите понятия, теми и свързаните с тях настроения, но също така предоставя полезна информация за близостта на понятията и тяхното местоположение. Това е особено полезно за надлъжен и сравнителен анализ, където основните разлики могат да бъдат идентифицирани от позиционирането на концепциите на картата.

Въпреки че процесът на „картографиране“ се завършва автоматично, осмислянето на картата и установяването на значението зад всяка концепция е задача на изследователя. Изследователят трябва да „дисектира“ концепциите и свързаните с тях теми, като изследва всички случаи (преки цитати), допринесли за създаването на концепцията, и да предприеме по-традиционен интерпретационен/тематичен анализ.

Използването на Leximancer в изследването „Sophomore Slump“ помогна за разкриване на промяна в нагласите и приоритетите на учениците, докато те напредваха в обучението си, показвайки как те преминаха от афективно ориентирани цели през първата година към етап на обучение и потвърждаване на целите през втората година, както и постижения и резултат -ориентирано обучение през последната година.

Друг изследователски проект, при който се тестваха възможностите на Leximancer, беше анализ на коментари в свободен текст на студенти, обучавани в следдипломна квалификация на секторно ниво, за да се идентифицират доминиращите теми в техните обратни връзки (Zaitseva and Milsom, 2015). Наборът от анкети за следдипломно обучение (PTES) включва отговори на 67 580 студенти от 100 висши учебни заведения. Проучването даде възможност за коментар след всеки раздел (общо седем) и покани отговори за най-приятните аспекти, както и за това как опитът в курса може да бъде подобрен. Общият набор от данни се състои от около 2 670 000 думи, което е еквивалентно на 5933 страници (Times New Roman, шрифт с 12 точки). Опитът за генериране на концептуална карта от комбиниран набор от данни доведе до гъсто населена карта и хиляди кавички, прикачени към всяка концепция, така че тя беше счетена за неподходяща за анализ. Данните трябваше да се дезагрегират чрез анализ на отговорите от всеки раздел поотделно и да се увеличат чрез прозрения от разбивката на демографските данни (напр. Разглеждане на тенденциите в отговорите на млади и зрели, задочни и редовни студенти), за да може поне малко наситеност при тематично изследване.

Анализът идентифицира редица нови теми, включително голямото натоварване на студенти на непълно работно време, което често беше недостатъчно представено в свързаната с курса маркетингова информация, и въздействието му върху психичното здраве и способността на студентите да постигнат (Фигура 2.); въпроси около „равнището“ на магистърската програма, която в някои случаи е била насочена към докторска степен, а в други случаи - към бакалавърска степен на последната година и някои други.

Фигура 2. Фрагмент от концептуална карта за студентски стаж на непълно работно време

Инструменти като Leximancer позволяват на изследователите да извършват анализ на големи качествени масиви от данни по ефективен във времето и последователен начин, тъй като предварителната обработка на данните се извършва от компютър. Концептуалната карта, която се появява от този анализ, улавя „мъдростта на тълпите“ (Dodgson et al. 2008) и е текстово, а не изследователско представяне. Но изследователят е в състояние да разпита концептуалната карта и да извърши по-фокусиран/съобразен анализ, като извлече текста за „по-дълбоки контекстуални асоциации“ (Stewart and Chakraborty, 2010). Колкото по-голям е източникът на данни, толкова по-нюансирана ще бъде концептуалната карта.

Използването на компютърно подпомогнат анализ повишава надеждността (тъй като най-високото ниво на анализ е независимо от ефекта на изследователя) и улеснява възпроизводимостта на констатациите, тъй като е възможно да се проследи вашето мислене, което може да е допринесло за появата на нови идеи и резултати от изследванията.

Има ограничения за този тип анализ. Някои понятия се появяват силно там, където са представени с тесен речник. В контекста на проучванията на учениците, думи като лекция, библиотека, обратна връзка или изпити ще имат силно присъствие в концептуалните карти. За разлика от това, други елементи на студентския опит, като личностно развитие или извънкласни дейности, ще бъдат идентифицирани от по-широк набор от термини и ще имат по-голяма вероятност да бъдат размити като концепция в картата. Това може да бъде смекчено чрез извършване на съобразен анализ, например чрез засяване на концепции, чрез добавяне на концепции, които не са преминали прага за публикуване, но представляват интерес за изследователя.

Някои понятия са относително фиксирани по своето значение, докато други са много широки. Например най-вероятно концептуалният урок ще представлява едно значение в отзивите на учениците. В същото време концепцията работи, като съществително, както и глагол, може да има множество значения. За фина настройка на анализа трябва да се изпълняват по-специфични заявки, за да се разберат по-добре всички конотации, свързани с концепцията (напр. Група + работа, непълно работно време + работа).

Анализът на настроението трябва да се проверява от време на време чрез проверка на контекстуалното разбиране, но Leximancer също смекчава това, като предоставя и два показателя (благоприятна и неблагоприятна вероятност).

Без съмнение има ограничения за това, което може да постигне софтуерният анализ. Сложността на езика предполага, че автоматизираните методи за семантичен анализ никога няма да заместят внимателното и внимателно четене на текста, но „компютърно подпомогнатите методи се смятат за най-добре като усилващи и увеличаващи внимателното четене и внимателния анализ“ (Grimmer and Stewart, 2013, стр. 2) . Тези методи са жизненоважни за боравене с големи обеми качествени данни, които иначе биха могли да не бъдат анализирани.

Препратки

Болден, Р. и Москарола, Дж. (2000) Преодоляване на количествено-качественото разделение: Лексикалният подход към анализа на текстови данни, Преглед на социалните науки, 18 (4): 450-460.

Гример, Дж. И Стюарт, Б. (2013) Текст като данни: Обещанието и подводните камъни на автоматичните методи за анализ на съдържанието за политически текстове, Политически анализ Advance Access, 1-31, достъпен онлайн: https://web.stanford.edu /

Smith, A. and Humpreys, M. (2006) Оценка на семантично картографиране без надзор на естествен език с картографиране на концепции на Leximancer, Методи за поведенчески изследвания, (38): 262–79

Stewart, G. and Chakraborty, A. (2010) Анализ на съдържанието на стратегията за идентифициране на услуги: Казус на държавни агенции. 5-та конференция за качествени изследвания в ИТ, Бризбейн, достъпна онлайн: https://researchonline.jcu.edu.au/25633/1/QUALIT10.pdf

Зайцева, Е., Милсъм, С. и Стюарт, М. (2013) Свързване на точките: Използване на концептуални карти за тълкуване на удовлетворението на учениците. Качество във висшето образование, 19 (2): 225–47.