Documentation of South-Iranian Arabic: Gulf-Arabic varieties in Bushehr and Hormozgan

Coastal view in Bushehr, Iran; photographer: Babak Nikzat in March 2016. Click on image to access the collection.
| Language | Gulf Arabic |
| Depositor | Dina El Zarka |
| Affiliation | University of Graz, Austria |
| Location | Iran |
| Collection ID | 0810 |
| Grant ID | P33421 |
| Collection Status | Collection online |
| Landing Page Handle | http://hdl.handle.net/2196/d7a2f5be-b731-49b0-9c2a-874c0a0f1dde |
Showreel
Summary of the collection
English: South-Iranian Arabic is a largely underdocumented cluster of Gulf Arabic varieties spoken in the Iranian provinces of Bushehr and Hormozgan. Most speakers are bilingual with Persian.
The collection comprises audio recordings from 11 villages, some with predominantly Arab populations, others more ethnically mixed. All recordings are transcribed in both Arabic script and IPA and translated into Persian and English. Some video recordings complement the audio material.
This corpus provides valuable data for comparative linguistics, language typology, and Arabic dialectology. It also serves as a cultural record for community members, helping to preserve and document their linguistic and cultural heritage.
This collection is the result of a project funded by the Austrian Science Fund between 2020 and 2025. The project was a collaboration between General Linguistics (University of Graz), Arabic Language Studies (University of Vienna) and local collaborators from the Persian Gulf University in Iran (https://south-iranian-arabic.uni-graz.at/de/).
Persian:
خلاصۀ مجموعه
عربیِ جنوب ایران مجموعهای از گونههای عربیِ عمدتا ثبتنشده منطقه خلیج فارس است که در استانهای بوشهر و هرمزگان ایران رواج دارد. بیشتر گویشوران این گونهها دوزبانهاند و به زبان فارسی نیز تسلط دارند.
این مجموعه شامل ضبطهای صوتی از یازده روستا است؛ برخی از این روستاها دارای جمعیت عمدتاً عربتبار و برخی دیگر دارای ترکیب قومی متنوعتریاند. تمامی دادههای صوتی با خط عربی و آوانگاری بینالمللی (IPA) نوشته و به فارسی و انگلیسی ترجمه شدهاند. افزون بر آن، تعدادی ضبط تصویری نیز در کنار فایلهای صوتی ارائه شده است.
این پیکره، منبعی ارزشمند برای پژوهش در حوزههای زبانشناسی تطبیقی، گونهشناسی زبانی و گویششناسی عربی به شمار میآید. همچنین، این مجموعه سندی فرهنگی را در اختیار جامعه محلی مورد پژوهش قرار می دهد و از این راه، به حفظ و مستندسازی میراث زبانی و فرهنگی آنان کمک می کند.
این مجموعه حاصل پروژهای است که با حمایت مالی «صندوق علوم اتریش» در بازۀ زمانی ۲۰۲۰ تا ۲۰۲۵ اجرا شده است. اجرای پروژه نتیجۀ همکاری میان گروه زبانشناسی عمومی دانشگاه گراتس، گروه مطالعات زبان عربی دانشگاه وین و همکاران محلی از دانشگاه خلیج فارس در ایران است.
(https://south-iranian-arabic.uni-graz.at/de/)
Group represented
English: The Arabic speakers in this region are mostly Sunni Muslims who ethnically identify themselves as Arabs, but there are some Shia speakers of Arabic who do not call themselves Arabs.
Today, around 4% of Iran’s population belong to the Arab ethnic group. While most of them live in the south-western province of Khuzestan, smaller Arabic-speaking communities can also be found among the Khamseh nomads in Fars, Khorasan, Kerman, Lorestan, Qom, the highlands of Tehran, and in some villages in the north of Ilam province. In the two southern Iranian provinces of Bushehr and Hormozgan, the proportion of the Arabic-speaking population is somewhat larger.
Persian:
گروه مورد مطالعه
گویشوران عربیِ این منطقه عمدتا از مسلمانان سنّیمذهب اند که خود را به لحاظ قومی عرب می دانند، اما شماری از گویشورانِ عربزبانِ شیعهمذهب نیز وجود دارند که خود را عرب نمینامند.
در حال حاضر حدود چهار درصد از جمعیت ایران را افراد متعلق به قوم عرب تشکیل میدهند. بیشتر آنان در استان خوزستان در جنوبِ غربِ ایران زندگی میکنند، اما جوامع کوچکتری از عربزبانان در میان عشایر خمسه در فارس، و همچنین در استانهای خراسان، کرمان، لرستان، قم، ارتفاعات تهران و برخی روستاهای شمال استان ایلام نیز یافت میشوند. در دو استان جنوبی بوشهر و هرمزگان، نسبت جمعیت عربزبان اندکی بیشتر است.
Language information
English: The Arabic dialects investigated in this project are spoken in the Iranian provinces of Bushehr and Hormozgan. Although they have different origins within the Arab homeland, they are all varieties of Gulf Arabic, which is spoken along the Arab Gulf coast. Gulf Arabic is the majority language in Bahrain, Qatar, UAE, and in parts of Saudi Arabia, and is also spoken in Oman, Kuwait, Iraq, and Iran.
Persian:
اطلاعات زبانی
گویشهای عربیِ مورد بررسی در این پروژه در استانهای بوشهر و هرمزگان رایجاند. با وجود تفاوت در ریشههای تاریخی این گویشها در سرزمینهای عربی، همگی از شاخۀ عربی خلیجی به شمار میروند؛ زبانی که در سراسر سواحل عربی خلیج فارس متداول است. عربیِ خلیجی زبان اصلی در کشورهای بحرین، قطر، امارات متحدۀ عربی و بخشهایی از عربستان سعودی است و در عمان، کویت، عراق و ایران نیز سخن گفته میشود.
Collection contents
English: The collection contains 20 hours of audio recordings and some videos. For cultural reasons, we could only make a few video recordings. The recorded texts stem from 44 different speakers. They vary in length from roughly 4 to 90 minutes and cover predominantly socio-linguistic interviews, which mostly contain personal narratives and cultural information about the villages and the region as well as oral history narratives. Some recordings contain procedural texts, conversations, questionnaires, narratives elicited by a picture book (frog story), and a stimulus text in Persian.
All recordings except the questionnaire data are provided together with an ELAN file (.eaf), which is segmented into inter-pausal units and at least contains the orthographic transcription of the text in Arabic/Persian script and/or a broad phonetic IPA transcription, a Persian translation in Arabic/Persian script and an English translation. While the Persian translation is supposed to serve the speech community itself, the English translation was added for the research community. The translations are free and usually do not give the literal meanings of the words. The collection also contains an article about the history of settlement and the possible dialectal origins of the varieties and a description of the sociolinguistic situation. Finally, some photos documenting the landscape and some cultural objects and a list of transcription symbols are added.
Persian:
محتوای مجموعه
این مجموعه شامل ۲۰ ساعت فایل صوتی و تعدادی ویدئو است. به دلایل فرهنگی، توانستیم تنها تعداد کمی ضبط ویدئویی انجام دهیم. متنهای ضبطشده از ۴۴ گویشور مختلف گردآوری شدهاند. طول فایلها از حدود ۴ تا ۹۰ دقیقه متغیر است و عمدتاً شامل مصاحبههای زبانشناختی اجتماعی هستند که بیشتر شامل روایتهای شخصی و اطلاعات فرهنگی دربارۀ روستاها و منطقه و روایتهای تاریخ شفاهی میشوند. برخی از ضبطها شامل توضیح فرآیندها، مکالمهها، پرسشنامهها، روایتهایی بر اساس یک کتاب تصویری (داستان قورباغه) و متنی فارسی برای پاسخ گرفتن از گویشوران هستند.
بهجز دادههای پرسشنامه، تمام ضبطها همراه با یک فایل ELAN با پسوند (.eaf) ارائه شدهاند که شامل واحدهای کلامی تقطیع شده هستند. این فایلها دستکم شامل نسخۀ مکتوب متن با خط عربی/فارسی و/یا آوانگاری کلی مبتنی بر IPA، ترجمۀ فارسی با خط عربی/فارسی و ترجمۀ انگلیسی است. ترجمۀ فارسی برای خود جامعۀ گویشی در نظر گرفته شده، اما ترجمۀ انگلیسی برای جامعۀ پژوهشی افزوده شده است. ترجمهها آزاد هستند و معمولاً معنی تحتاللفظی واژهها را ارائه نمیکنند. این مجموعه همچنین شامل مقالهای دربارۀ تاریخ اسکان گویشوران و خاستگاههای احتمالی گویشهای مجموعه و نیز توصیفی از وضعیت زبانشناختی اجتماعی آنهاست. در پایان، تعدادی عکس از مناظر، برخی اشیای فرهنگی و فهرستی از علایم استفاده شده در آوانگاری متون نیز افزوده شده است.
Collection history
English: This collection was recorded during an FWF-funded project between 2020 and 2025. Due to the pandemic and the insecure situation in Iran afterwards, we could not make the intended field trips to Iran and had to do virtual fieldwork sessions. In addition, we conducted one proper field work trip to Istanbul in summer 2024 (1 month) where we worked with our collaborators in person. Most recordings were carried out by field assistants in Iran and a smaller part was recorded by the research team in Istanbul. Transcriptions and translations were created in collaboration with our local field assistants.
Persian:
تاریخچۀ مجموعه
این مجموعه در سالهای 2025 تا 2025 در قالب پروژهای با حمایت مالی صندوق علوم اتریش (FWF) ضبط شده است. بهدلیل همهگیری کرونا و وضعیت نامطمئن ایران پس از آن، نتوانستیم سفرهای میدانی برنامهریزیشده به ایران را انجام دهیم و ناچار شدیم جلسات را به صورت مجازی برگزار کنیم. علاوه بر این، یک سفر میدانی در تابستان ۲۰۲۴ (به مدت یک ماه) به استانبول داشتیم که در آن بهصورت حضوری با گویشورانِ پروژه مصاحبه کردیم. بیشتر ضبطها توسط دستیاران میدانی ما در ایران انجام شد و بخش کوچکی نیز توسط تیم پژوهشی در استانبول ضبط گردید. پیاده سازی متنها و ترجمه آنها با همکاری دستیاران میدانی محلی انجام گردید.
References
El Zarka, Dina (2025). News from South Iranian Arabic: Some notes on the history and the sociolinguistic situation of the Arab minority in South Iran with two text samples from Shif and Zobar and preliminary observations on grammatical features (https://phaidra.univie.ac.at/o:2143850).
Acknowledgement and citation
Principal investigators: Dina El Zarka, Stephan Procházka
Team members:
Mahbouba Ameri, Abdollah Ghiathi, Amina Harambašić, Philipp Hessabi, Bettina Leitner, Abdolmohammad Movahhed, Fatemeh Nemati, Babak Nikzat, Sandra Ziagos
To refer to any data from the collection, please cite as follows:
El Zarka, Dina. 2025. Documentation of South-Iranian Arabic: Gulf-Arabic varieties in Bushehr and Hormozgan. Endangered Languages Archive. Handle: http://hdl.handle.net/2196/eaf97b96-798e-41e8-8d69-9ad21e4dc4eb. Accessed on [insert date here].]

