Что большие данные знают о вежливости?




Кронгауз Максим Анисимович
доктор филологических наук, профессор, зав. научно-учебной лаборатории лингвистической конфликтологии и современных коммуникативных практик НИУ ВШЭ, руководитель исследовательской группы в Центре междисциплинарных исследований МФТИ, Москва, Россия
mkronhaus@yandex.ru

Шульгинов Валерий Александрович
кандидат филологических наук, ведущий научный сотрудник научно-учебной лаборатории лингвистической конфликтологии и современных коммуникативных практик НИУ ВШЭ, ведущий научный сотрудник Центра междисциплинарных исследований МФТИ, Москва, Россия
shulginov.val@yandex.ru

Клокова Ксения Сергеевна
младший научный сотрудник Центра междисциплинарных исследований МФТИ Москва, Россия
kseniaklokova@gmail.com

Юдина Татьяна Александровна
младший научный сотрудник Центра междисциплинарных исследований МФТИ, Москва, Россия
yudina.tatiana22@gmail.com

СКАЧАТЬ ПРЕЗЕНТАЦИЮ


Аннотация
Вежливость играет важную роль в социальных взаимодействиях, будучи одним из ключевых факторов, определяющих эффективность коммуникации. На текущий момент существует потребность комплексного изучения стратегий и маркеров вежливости для решения целого диапазона теоретических и прикладных задач в рамках лингвистики, психологии и социологии. Актуальным подходом к решению этих задач является их компьютерное представление, то есть моделирование вежливого поведения или автоматическая коррекция человеческой коммуникации.
Такого рода исследования предполагают создание лингвистического корпуса, в котором учитывается не столько лексико-грамматическая характеристика материала, сколько взаимодействие маркеров лингвистической вежливости с социокультурными параметрами, формирующими контекст межличностного взаимодействия. Существует целый ряд прикладных задач, которые необходимо решить на пути создания корпуса подобного типа: выработка подхода к сбору данных, отражающих специфику устного общения; описание четких критериев разделения кооперативного и конфронтационного общения, создание принципов формализации и разметки этикетных ситуаций.
Создаваемый мультимедийный корпус речевого этикета включает в себя типичные этикетные фреймы из современных русскоязычных фильмов и разговорных ток-шоу, которые отражают повседневное общение в разные исторические периоды. Для каждого фрагмента планируется подготовка расшифровки с отражением лингвистических и экстралингвистических особенностей коммуникации, а также подробная разметка с учетом ситуации общения и этикетных маркеров. Аннотированные данные могут использоваться для задач машинного обучения, например, улучшения языковых моделей, программ автокоррекции и оптимизации бизнес-коммуникации.
Этикет меняется под влиянием социальных процессов и одновременно отражает их. Таким образом, корпус речевого этикета может использоваться не только в лингвистике, но и социологии. Одной из важных задач становится установление корреляции между понятием “вежливость” и такими категориями, как “власть”, “гендер”, “социальная иерархия” и “статус”.

Ключевые слова: речевой этикет, семантика, прагматика, вежливость, коммуникативные стратегии, машинное обучение, компьютерная лингвистика