Dolgan: An endangered Turkic language

Fieldwork with Dolgan consultants. Photo of Nina Semyonovna Kudryakova, Polina Prokop’evna Uodaj and Chris Lasse Däbritz by Eugénie Stapert 2017. Click on image to access collection.
| Language | Dolgan |
| Depositor | Beáta Wagner-Nagy, Maria Brykina |
| Affiliation | Academy of Sciences and Humanities in Hamburg |
| Location | Russia |
| Collection ID | 0845 |
| Grant ID | INEL |
| Collection Status | Collection online |
| Landing Page Handle | http://hdl.handle.net/2196/5706cab3-9e1c-4087-93b8-cc70d6a65312 |
Summary of the collection
English: Dolgan is an endangered Turkic language. The collection comprises texts from four different sources: (1) published folklore texts from the edited volume “Fol’klor Dolgan” (P.E. Efremov, 2000); (2) transcripts of recordings obtained from the Taymyr House of Folk Art in Dudinka (1970s–2000s); (3) transcripts from the collection of Dr. Eugénie Stapert, recorded during several fieldwork trips in 2007–2010; and (4) transcripts of recordings made during a fieldwork trip in 2017 by Eugénie Stapert and Chris Lasse Däbritz. Each text in the corpus is provided with morphological glossing, translations into English, Russian, and German, as well as annotation of Russian borrowings. Some texts also include annotations for syntactic functions, semantic roles, and information structure/information status. This collection is an adapted version of the INEL Dolgan Corpus 2.0.
Краткое описание коллекции
Русский: Долганский язык — находящий под угрозой исчезновения язык тюркской семьи. Данная коллекция включает тексты из четырех различных источников: (1) опубликованные фольклорные тексты из сборника «Фольклор долган» (П. Е. Ефремов, 2000); (2) расшифровки аудиозаписей, предоставленных Таймырским Домом народного творчества в Дудинке (1970–2000-е гг.); (3) расшифровки из коллекции д-ра Евгении Стаперт, записанные во время нескольких экспедиций в 2007–2010 годах; (4) расшифровки аудиозаписей, сделанных в ходе экспедиции в 2017-м году Евгенией Стаперт и Крисом Лассе Дэбритцем. Каждый текст коллекции снабжен морфологическим глоссированием, переводами на английский, русский и немецкий языки, аннотацией русских заимствований. Некоторые тексты также снабжены разметкой синтаксической структуры, семантических ролей и информационной структуры/информационного статуса. Коллекция представляет собой адаптированную версию Долганского корпуса INEL 2.0.
Group represented
English: Dolgan speakers live primarily in the Taymyr Dolgano-Nenets District, which belongs administratively to Krasnoyarsk Krai of the Russian Federation. Settlements southwest of Khatanga (Ust’-Avam, Volochanka, Katyryk, Kheta, Novaya, Kresty) are usually classified as representing Upper Dolgan, whereas settlements northeast of Khatanga represent Lower Dolgan (Zhdanikha, Novorybnoe, Syndassko, Popigai). A small group of Dolgan speakers is found in the Anabar District of the Sakha Republic (Yakutia). A relatively large group of Dolgans also lives in Dudinka, the administrative centre of the Taymyr Dolgano-Nenets District; this group consists of speakers from across the region.
The texts in the corpus originate exclusively from the “core” area of Dolgan, so Anabar Dolgan is not represented. The corpus contains texts from a total of 91 speakers (50 women and 41 men).
Представленная группа
Русский: Носители долганского языка проживают преимущественно в Таймырском Долгано-Ненецком муниципальном районе Красноярского края Российской Федерации. Населенные пункты к юго-западу от Хатанги (Усть-Авам, Волочанка, Катырык, Хета, Новая, Кресты) обычно относят к ареалу верхнего диалекта долганского языка, тогда как населенные пункты к северо-востоку от Хатанги (Жданиха, Новорыбное, Сындасско, Попигай) — к ареалу нижнего диалекта. Небольшая группа носителей долганского языка проживает в Анабарском улусе Республики Саха (Якутия). Довольно многочисленная группа долган также проживает в Дудинке — административном центре Таймырского Долгано-Ненецкого муниципального района; в эту группу входят носители со всего региона.
В корпусе представлены тексты только из «основного» ареала долганского языка, материалов анабарского долганского в корпусе нет. Всего в корпусе содержатся тексты от 91 носителя (50 женщин и 41 мужчины).
Language information
English: Dolgan is a Turkic language spoken by approximately 1,000 people, living mainly on the Taymyr Peninsula (Russian Federation). There are two main dialects of Dolgan: Upper (or Southern/Southwestern) Dolgan and Lower (or Northern/Northeastern) Dolgan. The differences between these dialects are relatively small and rarely compromise mutual intelligibility. Due to the predominance of Russian in all official domains of life, Dolgan must be regarded as a highly endangered language.
Информация об языке
Русский: Долганский язык — язык тюркской семьи, на котором говорит около 1 000 человек, проживающих преимущественно на полуострове Таймыр (Российская Федерация). Существует два основных диалекта долганского языка: верхний, или южный/юго-западный, и нижний, или северный/северо-восточный. Различия между диалектами относительно невелики и редко препятствуют взаимопониманию. В связи с преобладанием русского языка во всех официальных сферах жизни долганский язык находится под угрозой исчезновения.
Collection contents
English: The corpus contains both written and audio data. The material in the corpus stems from four different sources: (1) previously published texts from Fol’klor Dolgan (P.E. Efremov, 2000), for which no audio material is available; (2) audio recordings made available by the Taymyr House of National Arts (TDNT) and transcribed by local consultants (1970s–2000s); (3) audio recordings and transcriptions from various fieldwork sessions conducted by Eugénie Stapert in 2008, 2009, and 2010; and (4) audio recordings from an experiment on social cognition conducted in 2017 by Eugénie Stapert and Chris Lasse Däbritz.
The corpus contains texts of various genres, broadly classified as conversation, folklore, narrative, song, translation, and miscellaneous. The entire material from Fol’klor Dolgan (P.E. Efremov, 2000), as well as some transcriptions provided by the TDNT, consists of folklore texts. Narratives stem from transcriptions of the TDNT and from Eugénie Stapert’s fieldwork collection. Conversations originate mainly from the transcripts of the TDNT representing radio interviews; however, some transcripts from Eugénie Stapert’s collection, as well as recordings from the social cognition experiment, are also classified as conversations. Finally, four texts from the material provided by the TDNT are parts of a Bible translation.
The glossed corpus currently contains 136 transcripts (17 conversations, 51 folklore texts, 1 miscellaneous, 61 narratives, 2 songs, and 4 translations) from 74 speakers, comprising 14,193 utterances and 97,757 tokens. 100 transcripts are linked to the respective audio recordings, which makes up a total of 14:15:28 hours of audio material.
Содержание коллекции
Русский: Корпус содержит как письменные материалы, так и аудиозаписи из четырех различных источников: (1) ранее опубликованные тексты из сборника «Фольклор долган» (П. Е. Ефремов, 2000), для которых отсутствуют аудиоматериалы; (2) аудиозаписи (1970–2000-е гг.), предоставленные Таймырским Домом народного творчества (ТДНТ) и расшифрованные консультантами- носителями; (3) аудиозаписи и расшифровки, сделанные Евгенией Стаперт в ходе экспедиций, проходивших в 2007–2010 годах; (4) аудиозаписи эксперимента по социальному познанию, проведенного в 2017-м году Евгенией Стаперт и Крисом Лассе Дэбритцем.
В корпусе представлены тексты различных жанров, такие как диалоги, фольклор, бытовые рассказы, песни, переводы и «прочее». Весь материал из сборника «Фольклор долган» (П. Е. Ефремов, 2000), а также часть расшифровок, предоставленных ТДНТ, являются фольклорными текстами. Бытовые рассказы встречаются как среди расшифровок материалов ТДНТ, так и в полевых материалах Евгении Стаперт. Диалоги представлены главным образом расшифровками материалов ТДНТ, являющимися радиоинтервью; некоторые тексты из коллекции Евгении Стаперт, а также записи эксперимента по социальному познанию также относятся к жанру диалога. Наконец, четыре текста из материалов ТДНТ являются частями перевода Библии.
Размеченный корпус в настоящее время включает в себя 136 текстов (17 бытовых рассказов, 51 фольклорный текст, 1 текст категории «прочее», 61 бытовой рассказ, 2 песни и 4 перевода), записанных от 74-х носителей языка и содержащих 14 193 предложения и 97 757 токенов. 100 текстов снабжены синхронизированными с ними аудиозаписями, что в сумме составляет 14:15:28 часов аудиоматериалов.
Collection history
English: The starting point of the collection was the texts from Fol’klor Dolgan (P.E. Efremov, 2000). A large part of the audio material in the corpus was made available by the Taymyr House of National Arts (TDNT) between 2016 and 2019. Furthermore, Eugénie Stapert allowed her fieldwork materials to be included in the corpus. The primary criterion for selecting transcriptions to be included in the corpus was their authenticity: wherever possible, natural Dolgan speech (e.g. conversations) was chosen, whereas folklore texts, written stories, songs, or poems were rather left out. The non-selected material is nevertheless archived and made accessible.
The TDNT materials were transcribed and translated by native speakers of Dolgan between 2017 and 2019: Nina Semyonovna Kudryakova, who also worked as an editor for transcriptions and translations by other consultants; Svetlana Semyonovna Kudryakova; Egor Kudryakov; Adeya Evdokimovna Eske; Aleksandra Tuprina; Illarion Tuprin.
During the 2017 fieldwork trip by Eugénie Stapert and Chris Lasse Däbritz, the following language consultants helped transcribe, translate, and analyse all kinds of texts from the corpus: Nina Semyonovna Kudryakova, Anna Alekseevna Barbolina, Vera Polikarpovna Bettu, Galina Sidorovna Chuprina, Adeya Evdokimovna Eske, Yuliya Kupchik, Stepanida Il’inichna Kudryakova, and Polina Prokop’evna Uodaj.
История коллекции
Русский: Отправной точкой коллекции послужили тексты из сборника «Фольклор долган» (П. Е. Ефремов, 2000). Значительная часть аудиозаписей, вошедших в корпус, была предоставлена Таймырским Домом народного творчества (ТДНТ) в период с 2016 по 2019 год. Кроме того, Евгения Стаперт дала разрешение на включение в корпус материалов своих полевых исследований. Основным критерием отбора материалов для включения в корпус была их аутентичность: по возможности отбиралась естественная долганская речь (например, диалоги), в то время как фольклор, бытовые рассказы, песни и стихотворения, как правило, не включались в корпус. Материалы, не вошедшие в глоссированный корпус, тем не менее сохранены в архиве.
В период с 2017-го по 2019-й год материалы ТДНТ были расшифрованы и переведены носителями долганского языка. Это: Нина Семеновна Кудрякова, которая также выступила редактором расшифровок и переводов, выполненных другими консультантами; Светлана Семеновна Кудрякова; Егор Кудряков; Адея Евдокимовна Еске; Александра Туприна; Илларион Туприн.
Во время экспедиции Евгении Стаперт и Криса Лассе Дэбритца в 2017-м году многие консультанты-носители помогали в расшифровке, переводе и анализе самых разных текстов корпуса: Нина Семеновна Кудрякова, Анна Алексеевна Барболина, Вера Поликарповна Бетту, Галина Сидоровна Чуприна, Адея Евдокимовна Еске, Юлия Купчик, Степанида Ильинична Кудрякова и Полина Прокопьевна Уодай.
References
English: Aksënova, Evdokija E. & Belʹtjukova, Natalja P. & Koševerova, Tamara M. (eds.). 1992. Slovarʹ dolgansko-russkij i russko-dolganskij. [Dolgan-Russian and Russian-Dolgan dictionary]. Saint Petersburg: Prosveščenie.
Artem’ev, Nikolaj M. & Petrov, Aleksandr A. 2023. Dolgany: jazyk, istorija, folʹklor, kulʹtura: Spravočno-bibliografičeskoe posobie. [The Dolgans: Language, history, folklore, culture: A reference and bibliographic guide]. Saint Petersburg: Izdatel’stvo RGPU im. A. I. Gercena.
Däbritz, Chris Lasse. 2022. A Grammar of Dolgan: A Northern Siberian Turkic Language of the Taimyr Peninsula. Leiden: Brill.
Däbritz, Chris Lasse & Kudryakova, Nina & Stapert, Eugénie. 2022. INEL Dolgan Corpus. Version 2.0. Publication date 2022-11-30. Archived at Universität Hamburg. https://hdl.handle.net/11022/0000-0007-F9A7-4. In: The INEL corpora of indigenous Northern Eurasian languages.
Efremov, Prokopij E. et al. (eds.). 2000. Folʹklor Dolgan. [Dolgan Folklore]. Pamyatniki folʹklora narodov Sibiri i Dalʹnego Vostoka, vol. 19. Novosibirsk: Izdatelʹstvo Instituta Arxeologii i Etnografii Sibirskogo Otdeleniya Rossijskoj Akademii Nauk.
Stachowski, Marek. 1993. Dolganischer Wortschatz. [Dolgan lexicon]. Prace je̜zykoznawcze 114. Kraków: Wydawnictwo Uniwersytetu Jagiellońskiego.
Stachowski, Marek. 1997. Dolganische Wortbildung. [Dolgan word formation]. Cracow: Księgarnia Akademicka.
Stapert, Eugénie. 2013. Contact-induced change in Dolgan: an investigation into the role of linguistic data for the reconstruction of a people’s (pre-)history. (LOT Publications). Utrecht: Landelijke Onderzoekschool Taalwetenschap (LOT).
Ubryatova, Elizaveta I. 1985. Yazyk norilʹskix dolgan. [The Language of the Norilsk Dolgans]. Novosibirsk: Nauka.
Список литературы
Русский: Аксенова, Евдокия Е., Бельтюкова, Наталья П., Кошеверова, Тамара М. (сост.). 1992. Долганско-русский, русско-долганский словарь СПб.: Просвещение.
Артемьев, Николай М., Петров, Александр А. 2003. Долганы: язык, история, фольклор, культура: Справочно-библиографическое пособие. СПб.: Изд-во РГПУ им. А. И. Герцена
Däbritz, Chris Lasse. 2022. A Grammar of Dolgan: A Northern Siberian Turkic Language of the Taimyr Peninsula. Leiden: Brill.
Däbritz, Chris Lasse & Kudryakova, Nina & Stapert, Eugénie. 2022. INEL Dolgan Corpus. Version 2.0. Publication date 2022-11-30. Archived at Universität Hamburg. https://hdl.handle.net/11022/0000-0007-F9A7-4. In: The INEL corpora of indigenous Northern Eurasian languages.
Ефремов, Прокопий Е. (сост.). 2000. Фольклор долган. Новосибирск: Изд-во Института археологии и этнографии СО РАН (Памятники фольклора народов Сибири и Дальнего Востока; Т. 19)
Stachowski, Marek. 1993. Dolganischer Wortschatz. [Dolgan lexicon]. Prace je̜zykoznawcze 114. Kraków: Wydawnictwo Uniwersytetu Jagiellońskiego.
Stachowski, Marek. 1997. Dolganische Wortbildung. [Dolgan word formation]. Cracow: Księgarnia Akademicka.
Stapert, Eugénie. 2013. Contact-induced change in Dolgan: an investigation into the role of linguistic data for the reconstruction of a people’s (pre-)history. (LOT Publications). Utrecht: Landelijke Onderzoekschool Taalwetenschap (LOT).
Убрятова, Елизавета И. 1985. Язык норильских долган. Новосибирск: Наука
Acknowledgement and citation
English: This collection has been produced in the context of the joint research funding of the German Federal Government and Federal States in the Academies’ Programme, with funding from the Federal Ministry of Education and Research and the Free and Hanseatic City of Hamburg. The Academies’ Programme is coordinated by the Union of the German Academies of Sciences and Humanities.
This collection is a version of the INEL Dolgan Corpus 2.0 adapted for ELAR. The INEL Dolgan Corpus can be accessed at:
https://hdl.handle.net/11022/0000-0007-F9A7-4, with the original documentation at https://www.fdr.uni-hamburg.de/record/11165/files/dolgan-2.0-documentation.pdf.
An online search interface is available here: https://inel.corpora.uni-hamburg.de/DolganCorpus/
To refer to any data from the collection, please cite as follows:
Däbritz, Chris Lasse, Kudryakova, Nina and Eugénie Stapert. 2026. Dolgan: An endangered Turkic language. Endangered Languages Archive. Handle: http://hdl.handle.net/2196/0d0e0198-94dc-4ff1-bbdd-0f911e6df420. Accessed on [insert date here].
Благодарности и цитирование
Русский: Коллекция подготовлена в рамках исследовательской Программы Академий, совместно финансируемой Федеральным правительством Германии и Федеральными землями, при участии Федерального министерства образования и научных исследований и Вольного и ганзейского города Гамбурга. Программа Академий координируется Союзом Академий наук Германии.
Данная коллекция представляет собой адаптированную для ELAR версию корпуса INEL Dolgan Corpus 2.0, который доступен по ссылке: https://hdl.handle.net/11022/0000-0007-F9A7-4, включая документацию https://www.fdr.uni-hamburg.de/record/11165/files/dolgan-2.0-documentation.pdf.
Онлайн-интерфейс поиска доступен по ссылке: https://inel.corpora.uni-hamburg.de/DolganCorpus/.
При использовании любых материалов этой из данной коллекции просьба цитировать их следующим образом:
Däbritz, Chris Lasse, Kudryakova, Nina and Eugénie Stapert. 2026. Dolgan: An endangered Turkic language. Endangered Languages Archive. Handle: http://hdl.handle.net/2196/0d0e0198-94dc-4ff1-bbdd-0f911e6df420. Дата обращения [укажите дату].

