«Нет цели сказать, как правильно. Мы стремимся исследовать вариативность»
В НИУ ВШЭ работает Международная лаборатория языковой конвергенции, в центре внимания которой взаимодействие языков разных народов, живущих в регионах со смешанным полиэтничным населением. Исследования ученых Вышки помогают лучше понять историю развития языков и изучить особенности восприятия и использования языков в многоязычной среде. Подробнее об этом в интервью «Вышке.Главное» рассказал заведующий лабораторией Георгий Мороз.
— Как началась работа лаборатории?
— Она была открыта в 2017 году, заведующей стала Нина Добрушина, а научным руководителем — профессор Университета Беркли Джоханна Николс, работающая сейчас дистанционно. Большинство научных сотрудников изучали языки народов Кавказа и их взаимодействие: например, Нина Добрушина, Михаил Даниэль, Тимур Майсак интересовались в основном Дагестаном, Юрий Ландер и Анастасия Панова исследовали абхазо-адыгские языки.
Одно из центральных направлений работы — типологическое. Типологические исследования в лингвистике предполагают классификацию языков по разным признакам (например, по количеству гласных и согласных звуков). Для этого создаются выборки, которые могут включать десятки языков. Наша лаборатория — один из немногих в России научных центров, где проводятся такие исследования, и, пожалуй, единственный, в котором внимание сосредоточено именно на процессах взаимодействия языков. В лаборатории также продолжается работа по исследованию языков Кавказа и созданию лингвистических ресурсов для них.

На Кавказе русский язык контактирует с языками разных групп: кроме нахско-дагестанских языков, это тюркские (к которым относятся многие языки народов Дагестана, например кумыкский и азербайджанский), а также абхазо-адыгские (абхазский, абазинский, адыгейский и кабардинский), картвельские (грузинский, мегрельский, сванский и лазский языки) и индоевропейские (армянский, осетинский, татский).
Основная цель создания лаборатории — изучить взаимное влияние языков друг на друга. Яркий пример такого влияния — осетинский язык, который является индоевропейским, однако в нем, в отличие от других индоевропейских, есть абруптивные согласные звуки. Это звуки, при произнесении которых голосовые связки смыкаются и поднимаются, образуя разность давления, например кI, пI, тI, цI, чI. Кроме того, во время экспедиции в Азербайджан сотрудники лаборатории изучали диалекты территорий, граничащих с Дагестаном, и Михаил Даниэль обнаружил диалект азербайджанского языка, в котором были абруптивные звуки (правда, сообщения о нем были и в предыдущих работах). Видимо, это можно объяснить тем, что предки жителей селения Илису говорили на некоем нахско-дагестанском языке, предположительно цахурском, а потом перешли на азербайджанский язык, сохранив вот такой абруптивный след. Вероятнее всего, это произошло из-за языковых контактов.
Аналогичную гипотезу выдвигала и наша руководительница Джоханна Николс про жителей некоторых селений в Дагестане. Дело в том, что на севере Дагестана распространен аварский язык, и распространен он в основном в низменности. Однако можно обнаружить носителей аварского языка в высокогорных селениях в окружении неаварских селений. И тут появляется предположение, не говорили ли они раньше на языках, отличных от аварского, а потом перешли на аварский под влиянием его престижа.
Процесс, при котором происходят такие заимствования и даже переходы с одного языка на другой и, как следствие, сближение языков или диалектов, называется языковой конвергенцией. Важно, что этот процесс легче увидеть на примере генетически неродственных языков, однако аналогичное явление может происходить и с родственными языками или диалектами.
— Конвергенция соседних языков обязательна?
— Она происходит в большинстве случаев, но отмечаются и противоположные случаи, когда языки и их носители «пытаются» быть непохожими друг на друга. Этот процесс называется дивергенцией. Например, в прошлом году мы пригласили выступить у нас на семинаре Джона Мэнсфилда, который совместно с коллегами опубликовал типологическое исследование дивергентных процессов на материале 42 языков со всего мира.
— Вы упомянули Дагестан, где говорят на многих языках. Не могли бы вы подробнее рассказать про этот регион и про ваши исследования, связанные с ним?
— Дагестан прекрасен многоязычием и взаимным влиянием местных языков друг на друга; кроме того, в какой-то момент они стали меняться и под воздействием активного проникновения русского языка в местную среду.
Недавно мы с нашим стажером-исследователем Викторией Зубковой и научным сотрудником Кьярой Наккарато отправили в один из ведущих международных лингвистических журналов статью об адаптации русских заимствований в андийских языках. Более ранние заимствования шли преимущественно через аварский язык, через его своеобразное посредничество. А сейчас слова заимствуются уже напрямую, и мы пытаемся смоделировать, в каких языках влияние русского больше и от каких факторов зависит степень его влияния.
В процессе исследования выяснилось, что в аварском и ботлихском языках в последнее время отмечается меньше фонетических изменений в заимствованиях из русского, чем в других андийских языках (см. например, ахвахское кIебекIи — «копейка»). Основная причина: эти языки уже успели подпасть под сильное влияние русского. Аварский язык раньше играл важную роль на севере Дагестана, это был и остается своего рода региональный lingua franca. Результаты нашего исследования показывают, что процесс адаптации русских заимствований в других андийских языках происходил медленнее, чем в аварском, но очевидно, что этот процесс сокращался со временем. Сейчас уже, конечно, любое заимствование, скорее всего, войдет во все эти языки без какой-либо фонетической адаптации.
— Как вы получаете материалы для исследований?
— Для сбора данных мы регулярно ездим в экспедиции, для нас это важнейший источник материала. Недавно наши коллеги вернулись из Армении, другая группа — из Адыгеи. В последнее время мы начали активнее использовать данные, собранные учеными, не работающими в лаборатории.
Так, в лаборатории собрано 10 корпусов речи билингвов, то есть людей, для которых русский язык не является родным, но они его выучили и регулярно используют в повседневном обиходе. Их речь — и произношение, и грамматика — отличается от речи монолингвов.
Также создаются корпуса отдельных диалектов русского языка. Основная сложность сбора такого материала состоит в том, что русские диалектологи раньше неохотно делились своими данными. Благодаря Нине Добрушиной это изменилось, и теперь уже разместить у нас какой-то диалектный корпус считается делом обычным. Всего в лаборатории создано 26 диалектных корпусов.
Мы собираем также корпуса малых языков России, сейчас их уже 14.
— Можно уточнить, что такое «корпус» для лингвистов? Как и зачем вы создаете новые корпуса?
— Корпуса появились как письменные записи речи разного вида или просто размеченные собрания текстов. Корпус отличается от коллекций текстов морфологической или иной разметкой. В частности, можно задавать поиск по категориям: например, какие существительные стоят перед инфинитивами. Например, Национальный корпус русского языка — это собрание большого количества текстов, по которым возможен морфологический поиск. Когда мы подготавливаем устные корпуса — билингвальные и диалектные, — мы используем текстовые расшифровки на литературном русском языке, что делает возможным автоматический морфологический поиск. В корпусах также есть аудиозаписи, благодаря которым мы можем понять и особенности диалектов. Иногда нужно переслушать записи, чтобы точнее понять, используются ли определенные звуки.
Корпус — один из центральных инструментов современной лингвистики. Именно анализируя частотность употребления разных конструкций в нем, мы делаем некоторые обобщения, на основании которых публикуем статьи.
Один из вариантов использования корпусов — сравнить диалекты или малые языки друг с другом: с помощью векторных моделей можно получить пересечения корпусов соответствующих языков и тем самым понять, какие диалекты и языки ближе и какие дальше друг от друга.
Так, согласно нашим наблюдениям над билингвальными корпусами, карелы, в отличие от дагестанцев, говорят на русском языке, который ближе к литературному. В Дагестане на местные языки влияет и нормативный литературный русский, и возникший в республике и самобытно развивающийся региональный дагестанский русский. Для детей важно количество использования языка. И если, например, лезгины говорят по-лезгински, а адыги — по-адыгейски или по-кабардински и затем переходят на русский, то можно задаться вопросом, на какой именно русский — литературный или на специфическую местную версию, имеющую местные особенности, вызванные родными языками. Такие сравнения особенностей возможны как раз благодаря нашим корпусам.
— Какие еще ресурсы вы создаете?
— Как говорилось выше, одним из важных ресурсов лаборатории являются лингвистические атласы малых языков России.
Мы также составляем словари таких языков. Например, мы недавно опубликовали словарь кининского диалекта рутульского языка, носители которого проживают в Дагестане и в Азербайджане; объем словаря — около 1200 слов. Я анализировал зиловский диалект, один из диалектов андийского языка, который длительное время не имел письменности, и тоже разместил на странице лаборатории словарь где-то на 1500 слов. Однако это значительно меньший объем по сравнению со словарями, которые издают лингвисты из регионов, где говорят на соответствующем языке. Они лучше владеют языками и обычно могут больше времени посвятить этой задаче.
Словари, изданные в Дагестане, включают минимум 5000–6000 единиц, а недавно наш коллега Маджид Шарипович Халилов издал словарь цезского (дидойского) языка объемом 11 000 слов. Для бесписьменного языка это что-то феноменальное.
— Каковы ключевые направления нынешней работы лаборатории?
— Основное наше направление — лингвистическая типология, в рамках которой производятся исследования на материале выборки неродственных языков со всего мира.
Другой длительный проект — Типологический атлас языков Дагестана, в нем уже 58 глав, каждая из которых посвящена отдельному лингвистическому явлению, например наличию или отсутствию некоторых абруптивных звуков. Научные сотрудники нашей лаборатории Самира Ферхеес и Кьяра Наккарато изучили, как люди, говорящие на разных языках, здороваются утром, и написали соответствующую главу. Выяснилось, что на 17 языках приветствуют «Доброе утро!», также распространен как приветствие риторический вопрос «Ты проснулся?», «Встал?», а, например, в лакском языке можно встретить оба этих варианта.

Важную роль сейчас играет проект электронных дагестанских словарей. Мы пытаемся сделать некую унифицированную базу данных, которая содержала бы лексический материал нахско-дагестанских языков. База данных возникла благодаря серии курсовых работ студентов образовательной программы «Фундаментальная и компьютерная лингвистика», которые дигитализировали, вычищали данные, создавали транслитератор. В этих работах есть фонетическая и морфологическая разметка и разметка заимствований из русского, арабского, персидского и тюркских языков. Теперь мы располагаем унифицированными материалами по андийским и аварскому языкам.
Это значительно упрощает ряд исследований, в рамках которых нужно было посмотреть разные словари. Уже упомянутая статья Виктории Зубковой и Кьяры Наккарато стала возможной благодаря этой базе данных, которая также открывает поле для новых исследований. Это проект с большим потенциалом, который, надеюсь, будет продолжаться.
Другое важное направление — исследование нестандартного русского, в рамках которого мы занимаемся как диалектами русского языка, так и особенностями русского языка тех, для кого он неродной. Мы называем свою группу DiaL2: dia — диалекты и L2 — стандартное обозначение для второго языка. Нам интересны любые варианты, непохожие на литературные. У нас нет цели сказать, как правильно. Мы стремимся исследовать вариативность, которую наблюдаем. Наша группа включает исследователей лаборатории и студентов. Например, у нашего стажера-исследователя Анны Гришановой недавно приняли к публикации статью про выпадение предлогов в речи билингвов, у которых первый родной язык — чувашский.
Есть отдельный рутульский проект. В рамках гранта «Открываем Россию заново» мы посетили 12 рутульских селений и выпустили атлас, похожий на Типологический атлас языков Дагестана, о котором я говорил раньше. В рутульском атласе собрано 425 отдельных глав, посвященных разным темам рутульской диалектологии: фонетическим, грамматическим и лексическим. Например, одна из глав посвящена лексеме ёж, которая обозначается разными вариантами — как заимствованием из русского, так и собственными гъылленцI, кирпик, жьужьа или кIынгъыр.

Есть и еще два небольших проекта: один по арамейским языкам, использующимся в том числе и в России, на который получен грант РНФ (24-28-01009), — «Ареально-типологическое описание новоарамейских идиомов Армении» под руководством Юрия Корякова — и второй по абхазо-адыгским языкам.
В целом документация языков очень важна для культуры народов, с которыми мы работаем, поскольку некоторые бесписьменные языки могут исчезнуть, а если мы успеем хоть как-то их зафиксировать, то люди смогут посмотреть, как говорили их дедушки и бабушки, даже если они не понимают родного языка.
— Как организована работа лаборатории?
— Одним из столпов лаборатории мне кажется наш еженедельный семинар. Он проходит каждый вторник в 16:00. За время работы лаборатории прошло больше 230 семинаров, на них были представлены почти 300 докладов. Почти все семинары проходят на английском, что позволяет активнее включать иностранных коллег в нашу работу и поддерживать научные контакты. К нам приходят разные известные лингвисты, например Мартин Хаспельмат, один из ведущих специалистов по лингвистической типологии. Во время поездки в Москву в декабре прошлого года он выступил в Вышке с лекцией, вызвавшей большой интерес. Семинары также показывают нашим стажерам, как в принципе делать доклад, задавать вопросы и держать себя во время доклада на английском. Кроме того, когда я стал заведующим, мы стали активнее использовать семинары в качестве площадки для обсуждения новых научных статей. Это связано с моим глубоким убеждением, что легко перестать читать или ограничить чтение только своей узкой специализацией и перейти на штамповку статей. Именно чтение и обсуждение статей, даже далеких от твоей темы исследования, позволяет держать в фокусе общее состояние современной лингвистики, а не тонуть в конкретике, как в притче о слоне и слепых мудрецах.

— Насколько активно вы сотрудничаете с другими университетами и кампусами Вышки?
— В рамках проекта «Зеркальные лаборатории» мы сотрудничали в 2022–2024 годах с Южным федеральным университетом. В него были включены три подпроекта: проект по изучению русского как иностранного, диалектологический проект, благодаря которому мы располагаем корпусом донских говоров, который поддерживаем и при необходимости можем продолжить исследование говоров, а также проект цифровых гуманитарных исследований, или Digital Humanities (DH).
Ныне действующий межкампусный проект с НИУ ВШЭ в Петербурге сфокусирован на DH: мы с коллегами занимаемся прикладной компьютерной лингвистикой. В частности, в Петербурге создали корпус русского рассказа 1930–2000 годов, корпус советских песен и даже разработали чат-бота для Эрмитажа.
— Каков принцип работы этого чат-бота?
— Например, посетитель просит показать картину, где изображена женщина с головой на тарелке, подразумевая Юдифь с головой Олоферна; по задумке бот должен выдавать искомую картину. Но вряд ли кто-то удивится, если это будет Иродиада с головой Иоанна Крестителя.
— Какие еще прикладные работы вы можете представить?
— У нас есть разные прикладные исследования. Например, мы начали разрабатывать транслитераторы для нахско-дагестанских языков. Мы мечтаем создать некий хаб, где были бы представлены транслитераторы текстов на разных языках, что будет очень полезно лингвистам.
Кроме того, у нас разрабатываются морфологические анализаторы для малых языков, собираются корпуса и словари. Все это в конце концов является богатым материалом для верификации моделей машинного обучения самой разной модальности: и аудио, и тексты. Такие модели часто страдают из-за нехватки экспертной разметки данных.
Даниэль Михаил Александрович
Добрушина Нина Роландовна
Панова Анастасия Борисовна
Вам также может быть интересно:
«Огромное счастье — возможность обсудить свои научные идеи с заинтересованными людьми»
Созданная в нижегородском кампусе Вышки Международная лаборатория динамических систем и приложений ведет глубокие теоретические изыскания и прикладные исследования, среди которых изучение океанических волн, пересоединений солнечной короны, вулканических явлений и устойчивости судов. Ее ученые, за последние 5 лет выигравшие более 20 значимых научных грантов, активно сотрудничают с российскими и зарубежными коллегами из Китая, Испании, США, Великобритании, Бразилии и других стран. О работе лаборатории новостная служба «Вышка.Главное» побеседовала с ее заведующей, профессором Ольгой Починкой.
«Основная отрасль медицины, на которую направлены наши разработки, — кардиология»
Применение математических моделей в диагностике и лечении болезней сердечно-сосудистой системы повышает эффективность выявления у пациентов предрасположенности к заболеваниям, облегчает выбор стратегии излечения. Используя математические модели, можно создать новые диагностические приборы, обучить нейросети для помощи врачам. Такая работа ведется исследователями Вышки в рамках проекта «Зеркальные лаборатории». Подробнее — в интервью Наталии Станкевич, старшего научного сотрудника Международной лаборатории динамических систем и приложений НИУ ВШЭ — Нижний Новгород.
Страна переселенцев: роль миграции в развитии регионов
Крупные общественно-политические события — такие как коллективизация — вызывали в СССР массовую внутреннюю миграцию. Десятки тысяч людей переезжали на новые места, чтобы наладить быт и найти работу. Эти процессы существенно меняли социальный, национальный и религиозный состав населения регионов, влияли на экономическое развитие и формирование инфраструктуры здравоохранения и образования. Общие черты и особенности миграций в Пермском крае и Туве обсудили на круглом столе «Зеркальных лабораторий» Ясинской научной конференции.
ИИ позволит точно моделировать производительность систем хранения данных
Исследователи факультета компьютерных наук НИУ ВШЭ разработали новый подход к моделированию систем хранения данных на основе генеративных моделей машинного обучения. Он позволяет с высокой точностью предсказывать ключевые характеристики работы таких систем при различных условиях. Результаты опубликованы в журнале IEEE Access.
Математики из нижегородской Вышки доказали существование устойчивого хаоса в сложных системах
Исследователи из Международной лаборатории динамических систем и приложений НИУ ВШЭ — Нижний Новгород разработали теорию, которая позволяет с математической точностью доказать существование устойчивого хаотического поведения в сетях взаимодействующих элементов. Работа открывает новые возможности для изучения сложных динамических процессов в нейронауке, биологии, медицине, химии, оптике и других областях. Результаты исследования приняты к публикации в ведущем международном научном журнале Physical Review Letters. С результатами исследования можно ознакомиться в архиве Arxiv.org.
Российские ученые воссоздали динамику модели нейрона мозга с помощью нейросети
Исследователи из НИУ ВШЭ в Нижнем Новгороде показали, как с помощью нейросети воссоздавать динамику нейрона мозга, имея всего один ряд измерений, например запись его электрической активности. Разработанная нейросеть научилась восстанавливать полную динамику системы и предсказывать ее поведение при изменении условий. Такой метод может помочь изучать сложные биологические процессы, даже если нет возможности провести все необходимые измерения. Исследование опубликовано в журнале Chaos, Solitons & Fractals.
НИУ ВШЭ, Университет Дели и «Геоскан» запускают проект по космическим исследованиям
Высшая школа экономики и Университет Дели (Индия) в партнерстве с «Геосканом» (портфельная компания негосударственного института развития «Иннопрактика») договорились о создании международной научной зеркальной лаборатории в области хранения, обработки и передачи данных в космических системах. Соглашение об этом было подписано 15 января 2025 года в рамках визита в Индию делегации НИУ ВШЭ во главе с ректором Никитой Анисимовым.
Подведены итоги конкурса проектов «Зеркальные лаборатории» — 2024
«Зеркальные лаборатории» — одна из флагманских программ НИУ ВШЭ, которая направлена на развитие внутрироссийских научных партнерств, сосредоточенных на выявлении точек роста с помощью объединения усилий двух высококлассных научно-исследовательских коллективов. Проекты реализуются в различных областях науки и охватывают всю страну. В пятом, юбилейном конкурсе приняли участие 18 научных подразделений НИУ ВШЭ с партнерами из 17 регионов России.
Проект «Зеркальные лаборатории» НИУ ВШЭ отмечает пятилетие
«Зеркальные лаборатории» — одна из флагманских программ Высшей школы экономики, направленная на развитие внутрироссийских научных партнерств. За время реализации проекта было инициировано 41 научное исследование в партнерстве с 30 региональными вузами и научными организациями. К пятилетию «Зеркальных лабораторий» приурочена серия круглых столов, которые пройдут в ВШЭ 24–25 апреля.
В НИУ ВШЭ стартует пятый открытый конкурс проектов «Зеркальные лаборатории»
В конкурсе могут принять участие научные (научно-исследовательские) структурные подразделения Вышки, планирующие проведение совместных научных исследований с научными структурными подразделениями российских образовательных организаций высшего образования, научных организаций и государственных научных центров Российской Федерации. Заявки принимаются до 12 апреля.