search catalogue
catalogue

Documentation of South-Iranian Arabic: Gulf-Arabic varieties in Bushehr and Hormozgan

 

Coastal view in Bushehr, Iran; photographer: Babak Nikzat in March 2016

Coastal view in Bushehr, Iran; photographer: Babak Nikzat in March 2016. Click on image to access the collection.

Language Gulf Arabic
Depositor Dina El Zarka
Affiliation University of Graz, Austria
Location Iran
Collection ID 0810
Grant ID P33421
Collection Status Collection online
Landing Page Handle http://hdl.handle.net/2196/d7a2f5be-b731-49b0-9c2a-874c0a0f1dde

 

Showreel

Summary of the collection

English: South-Iranian Arabic is a largely underdocumented cluster of Gulf Arabic varieties spoken in the Iranian provinces of Bushehr and Hormozgan. Most speakers are bilingual with Persian.

The collection comprises audio recordings from 11 villages, some with predominantly Arab populations, others more ethnically mixed. All recordings are transcribed in both Arabic script and IPA and translated into Persian and English. Some video recordings complement the audio material.

This corpus provides valuable data for comparative linguistics, language typology, and Arabic dialectology. It also serves as a cultural record for community members, helping to preserve and document their linguistic and cultural heritage.
This collection is the result of a project funded by the Austrian Science Fund between 2020 and 2025. The project was a collaboration between General Linguistics (University of Graz), Arabic Language Studies (University of Vienna) and local collaborators from the Persian Gulf University in Iran (https://south-iranian-arabic.uni-graz.at/de/).

Persian:

خلاصۀ مجموعه
عربیِ جنوب ایران مجموعه‌ای از گونه‌های عربیِ عمدتا ثبت‌نشده منطقه خلیج فارس است که در استان‌های بوشهر و هرمزگان ایران رواج دارد. بیشتر گویش‌وران این گونه‌ها دوزبانه‌اند و به زبان فارسی نیز تسلط دارند.
این مجموعه شامل ضبط‌های صوتی از یازده روستا است؛ برخی از این روستاها دارای جمعیت عمدتاً عرب‌تبار و برخی دیگر دارای ترکیب قومی متنوع‌تری‌اند. تمامی داده‌های صوتی با خط عربی و آوانگاری بین‌المللی (IPA) نوشته و به فارسی و انگلیسی ترجمه شده‌اند. افزون بر آن، تعدادی ضبط تصویری نیز در کنار فایل‌های صوتی ارائه شده است.
این پیکره، منبعی ارزشمند برای پژوهش در حوزه‌های زبان‌شناسی تطبیقی، گونه‌شناسی زبانی و گویش‌شناسی عربی به شمار می‌آید. همچنین، این مجموعه سندی فرهنگی را در اختیار جامعه محلی مورد پژوهش قرار می دهد و از این راه، به حفظ و مستندسازی میراث زبانی و فرهنگی آنان کمک می کند.
این مجموعه حاصل پروژه‌ای است که با حمایت مالی «صندوق علوم اتریش» در بازۀ زمانی ۲۰۲۰ تا ۲۰۲۵ اجرا شده است. اجرای پروژه نتیجۀ همکاری میان گروه زبان‌شناسی عمومی دانشگاه گراتس، گروه مطالعات زبان عربی دانشگاه وین و همکاران محلی از دانشگاه خلیج فارس در ایران است.
(https://south-iranian-arabic.uni-graz.at/de/)

 

Group represented

English: The Arabic speakers in this region are mostly Sunni Muslims who ethnically identify themselves as Arabs, but there are some Shia speakers of Arabic who do not call themselves Arabs.
Today, around 4% of Iran’s population belong to the Arab ethnic group. While most of them live in the south-western province of Khuzestan, smaller Arabic-speaking communities can also be found among the Khamseh nomads in Fars, Khorasan, Kerman, Lorestan, Qom, the highlands of Tehran, and in some villages in the north of Ilam province. In the two southern Iranian provinces of Bushehr and Hormozgan, the proportion of the Arabic-speaking population is somewhat larger.

Persian:

گروه مورد مطالعه
گویش‌وران عربیِ این منطقه عمدتا از مسلمانان سنّی‌مذهب اند که خود را به لحاظ قومی عرب می دانند، اما شماری از گویش‌ورانِ عرب‌زبانِ شیعه‌مذهب نیز وجود دارند که خود را عرب نمی‌نامند.
در حال حاضر حدود چهار درصد از جمعیت ایران را افراد متعلق به قوم عرب تشکیل می‌دهند. بیشتر آنان در استان خوزستان در جنوبِ ‌غربِ ایران زندگی می‌کنند، اما جوامع کوچک‌تری از عرب‌زبانان در میان عشایر خمسه در فارس، و همچنین در استان‌های خراسان، کرمان، لرستان، قم، ارتفاعات تهران و برخی روستاهای شمال استان ایلام نیز یافت می‌شوند. در دو استان جنوبی بوشهر و هرمزگان، نسبت جمعیت عرب‌زبان اندکی بیشتر است.

 

Language information

English: The Arabic dialects investigated in this project are spoken in the Iranian provinces of Bushehr and Hormozgan. Although they have different origins within the Arab homeland, they are all varieties of Gulf Arabic, which is spoken along the Arab Gulf coast. Gulf Arabic is the majority language in Bahrain, Qatar, UAE, and in parts of Saudi Arabia, and is also spoken in Oman, Kuwait, Iraq, and Iran.

Persian:

اطلاعات زبانی
گویش‌های عربیِ مورد بررسی در این پروژه در استان‌های بوشهر و هرمزگان رایج‌اند. با وجود تفاوت در ریشه‌های تاریخی این گویش‌ها در سرزمین‌های عربی، همگی از شاخۀ عربی خلیجی به شمار می‌روند؛ زبانی که در سراسر سواحل عربی خلیج فارس متداول است. عربیِ خلیجی زبان اصلی در کشورهای بحرین، قطر، امارات متحدۀ عربی و بخش‌هایی از عربستان سعودی است و در عمان، کویت، عراق و ایران نیز سخن گفته می‌شود.

 

Collection contents

English: The collection contains 20 hours of audio recordings and some videos. For cultural reasons, we could only make a few video recordings. The recorded texts stem from 44 different speakers. They vary in length from roughly 4 to 90 minutes and cover predominantly socio-linguistic interviews, which mostly contain personal narratives and cultural information about the villages and the region as well as oral history narratives. Some recordings contain procedural texts, conversations, questionnaires, narratives elicited by a picture book (frog story), and a stimulus text in Persian.
All recordings except the questionnaire data are provided together with an ELAN file (.eaf), which is segmented into inter-pausal units and at least contains the orthographic transcription of the text in Arabic/Persian script and/or a broad phonetic IPA transcription, a Persian translation in Arabic/Persian script and an English translation. While the Persian translation is supposed to serve the speech community itself, the English translation was added for the research community. The translations are free and usually do not give the literal meanings of the words. The collection also contains an article about the history of settlement and the possible dialectal origins of the varieties and a description of the sociolinguistic situation. Finally, some photos documenting the landscape and some cultural objects and a list of transcription symbols are added.

Persian:

محتوای مجموعه
این مجموعه شامل ۲۰ ساعت فایل صوتی و تعدادی ویدئو است. به دلایل فرهنگی، توانستیم تنها تعداد کمی ضبط ویدئویی انجام دهیم. متن‌های ضبط‌شده از ۴۴ گویش‌ور مختلف گردآوری شده‌اند. طول فایل‌ها از حدود ۴ تا ۹۰ دقیقه متغیر است و عمدتاً شامل مصاحبه‌های زبان‌شناختی اجتماعی هستند که بیشتر شامل روایت‌های شخصی و اطلاعات فرهنگی دربارۀ روستاها و منطقه و روایت‌های تاریخ شفاهی می‌شوند. برخی از ضبط‌ها شامل توضیح فرآیندها، مکالمه‌ها، پرسش‌نامه‌ها، روایت‌هایی بر اساس یک کتاب تصویری (داستان قورباغه) و متنی فارسی برای پاسخ گرفتن از گویش‌وران هستند.
به‌جز داده‌های پرسش‌نامه، تمام ضبط‌ها همراه با یک فایل ELAN با پسوند (.eaf) ارائه شده‌اند که شامل واحدهای کلامی تقطیع شده هستند. این فایل‌ها دست‌کم شامل نسخۀ مکتوب متن با خط عربی/فارسی و/یا آوانگاری کلی مبتنی بر IPA، ترجمۀ فارسی با خط عربی/فارسی و ترجمۀ انگلیسی است. ترجمۀ فارسی برای خود جامعۀ گویشی در نظر گرفته شده، اما ترجمۀ انگلیسی برای جامعۀ پژوهشی افزوده شده است. ترجمه‌ها آزاد هستند و معمولاً معنی تحت‌اللفظی واژه‌ها را ارائه نمی‌کنند. این مجموعه همچنین شامل مقاله‌ای دربارۀ تاریخ اسکان گویش‌وران و خاستگاه‌های احتمالی گویش‌های مجموعه و نیز توصیفی از وضعیت ‌زبان‌شناختی اجتماعی آنهاست. در پایان، تعدادی عکس از مناظر، برخی اشیای فرهنگی و فهرستی از علایم استفاده شده در آوانگاری متون نیز افزوده شده است.

 

Collection history

English: This collection was recorded during an FWF-funded project between 2020 and 2025. Due to the pandemic and the insecure situation in Iran afterwards, we could not make the intended field trips to Iran and had to do virtual fieldwork sessions. In addition, we conducted one proper field work trip to Istanbul in summer 2024 (1 month) where we worked with our collaborators in person. Most recordings were carried out by field assistants in Iran and a smaller part was recorded by the research team in Istanbul. Transcriptions and translations were created in collaboration with our local field assistants.

 

Persian:

تاریخچۀ مجموعه
این مجموعه در سال‌های 2025 تا 2025 در قالب پروژه‌ای با حمایت ‌مالی صندوق علوم اتریش (FWF) ضبط شده است. به‌دلیل همه‌گیری کرونا و وضعیت نامطمئن ایران پس از آن، نتوانستیم سفرهای میدانی برنامه‌ریزی‌شده به ایران را انجام دهیم و ناچار شدیم جلسات را به صورت مجازی برگزار کنیم. علاوه بر این، یک سفر میدانی در تابستان ۲۰۲۴ (به مدت یک ماه) به استانبول داشتیم که در آن به‌صورت حضوری با گویشورانِ پروژه مصاحبه کردیم. بیشتر ضبط‌ها توسط دستیاران میدانی ما در ایران انجام شد و بخش کوچکی نیز توسط تیم پژوهشی در استانبول ضبط گردید. پیاده سازی متن‌ها و ترجمه آن‌ها با همکاری دستیاران میدانی محلی انجام گردید.

References

El Zarka, Dina (2025). News from South Iranian Arabic: Some notes on the history and the sociolinguistic situation of the Arab minority in South Iran with two text samples from Shif and Zobar and preliminary observations on grammatical features (https://phaidra.univie.ac.at/o:2143850).

 

Acknowledgement and citation

Principal investigators: Dina El Zarka, Stephan Procházka

Team members:
Mahbouba Ameri, Abdollah Ghiathi, Amina Harambašić, Philipp Hessabi, Bettina Leitner, Abdolmohammad Movahhed, Fatemeh Nemati, Babak Nikzat, Sandra Ziagos

To refer to any data from the collection, please cite as follows:
El Zarka, Dina. 2025. Documentation of South-Iranian Arabic: Gulf-Arabic varieties in Bushehr and Hormozgan. Endangered Languages Archive. Handle: http://hdl.handle.net/2196/eaf97b96-798e-41e8-8d69-9ad21e4dc4eb. Accessed on [insert date here].]

Click to access collection

Powered by Preservica
© Copyright 2025