search catalogue
catalogue

Documentation of Yateé Zapotec

View of the village of San Francisco Yateé. Photo by Yuan Chai, 2025. Click on image to access collection.

Language Yateé Zapotec
Depositor Yuan Chai
Affiliation University of Washington
Location Mexico; United States of America
Collection ID 0817
Grant ID GLB0038
Funding Body Glottobank
Collection Status Collection online
Landing Page Handle http://hdl.handle.net/2196/81fad990-32eb-48ef-8121-f148face5e62

 

Summary of the collection

English: This collection contains lexical items documented for the Glottobank Lexibank-Numeralbank, together with morphological variants of verbs included in the word list. The data were collected between 2024 and 2026 through three field trips to San Francisco Yateé, Oaxaca, Mexico, as well as through recordings made with speakers in Los Angeles, United States. The word list includes terms covering basic concepts, kinship, and numerals.

Español: Esta colección contiene ítems léxicos documentados para Glottobank Lexibank–Numeralbank, junto con variantes morfológicas de los verbos incluidos en la lista léxica. Los datos se recopilaron entre 2024 y 2026 mediante tres visitas de trabajo de campo a San Francisco Yateé, Oaxaca, México, así como a través de grabaciones realizadas con hablantes en Los Ángeles, Estados Unidos. La lista léxica incluye términos correspondientes a conceptos básicos, parentesco y numerales.

 

Group represented

English: The materials in this deposit represent speakers of Yateé Zapotec, an Indigenous Zapotec language of Oaxaca, Mexico. The language is primarily spoken in the village of San Francisco Yatee, located in the Sierra Norte region, Municipality of San Ildefonso Villa Alta, Oaxaca, Mexico. Yateé Zapotec is also spoken by members of the Yateé Zapotec diaspora, particularly in the Los Angeles area of the United States. The fieldwork for this project was conducted mainly in the village of San Francisco Yateé. I am deeply grateful to the community for allowing me to stay in the village during fieldwork. I also sincerely thank all language consultants.

Español: Los materiales de este depósito representan a hablantes de zapoteco de Yateé, una lengua indígena zapoteca de Oaxaca, México. La lengua se habla principalmente en la comunidad de San Francisco Yatee, ubicada en la región de la Sierra Norte, municipio de San Ildefonso Villa Alta, Oaxaca, México. El zapoteco de Yateé también se habla entre integrantes de la diáspora zapoteca de Yateé, particularmente en el área de Los Ángeles, Estados Unidos. El trabajo de campo de este proyecto se llevó a cabo principalmente en la comunidad de San Francisco Yateé. Agradezco profundamente a la comunidad por permitirme permanecer en la comunidad durante el trabajo de campo. Asimismo, agradezco sinceramente a todas las personas consultoras de lengua.

 

Language information

English: Yateé Zapotec belongs to the Northern Core Zapotec branch (Glottocode: yate1242; ISO 639-3: zty). In Zapotec, the language is referred to as dichha xichha [díʒà ʂíʒá], dichha wlax [díʒà wlâʂ] “language of the village”, and dichha sa [díʒà sà].

According to a census conducted by the local clinic in San Francisco Yateé in 2017, there were approximately 480 residents in the village of San Francisco Yateé. The language is also spoken by members of the Yateé Zapotec diaspora in the Los Angeles area of the United States. Most speakers are bilingual in Zapotec and Spanish. Elderly speakers are typically Zapotec-dominant, while Spanish has become the dominant language for many children in the village, as it is the primary language of instruction in school.

At the same time, local elementary school teachers have developed activities to introduce Zapotec in the classroom, including lessons and activities on the Zapotec names of body parts, basic vocabulary, greetings, and plant names. In addition, Zapotec-Spanish bilingual dictionaries and written narratives about the history of the village, written by community members, are kept in local homes and at the village elementary school.

Español: El zapoteco de Yateé pertenece al zapoteco del norte (Glottolog; Glottocode: yate1242; ISO 639-3: zty). En zapoteco, la lengua se denomina dichha xichha [díʒà ʂíʒá], dichha wlax [díʒà wlâʂ] ‘lengua del pueblo’, y dichha sa [díʒà sà].

De acuerdo con un censo realizado por la clínica local de San Francisco Yateé en 2017, había aproximadamente 480 habitantes en la comunidad de San Francisco Yateé. La lengua también se habla entre integrantes de la diáspora zapoteca de Yateé en el área de Los Ángeles, Estados Unidos. La mayoría de las personas hablantes son bilingües en zapoteco y español. Las personas mayores suelen ser dominantes en zapoteco, mientras que el español se ha convertido en la lengua dominante para muchos niños y niñas del pueblo, ya que es la principal lengua de instrucción en la escuela.

Al mismo tiempo, el personal docente de la escuela primaria ha desarrollado actividades para introducir el zapoteco en el aula, incluyendo lecciones y actividades sobre los nombres zapotecos de partes del cuerpo, vocabulario básico, saludos y nombres de plantas. Además, existen diccionarios bilingües zapoteco-español y narraciones escritas sobre la historia del pueblo, elaboradas por personas de la comunidad, que se conservan en hogares locales y en la escuela primaria del pueblo.

 

Special characteristics

English: Part of the recordings in this collection were collected through a close collaboration between the collection steward, Yuan Chai, and the second deputy collection steward, Maria Velasco Vasquez. Maria Velasco Vasquez is a member of the Yateé Zapotec community and is acquiring the language both through intergenerational transmission from her parents and through weekly Zapotec classes offered by the local teacher, Florentino Ambrosio Alcantara.

This collection benefits from close collaboration between academic linguists and scholars from the community. Such collaboration supports community involvement in language documentation and helps ensure that the recorded materials reflect local linguistic knowledge, practices, and perspectives.

Español: Parte de las grabaciones de esta colección se obtuvieron mediante una estrecha colaboración entre la responsable de la colección, Yuan Chai, y la segunda responsable adjunta de la colección, Maria Velasco Vasquez. Maria Velasco Vasquez es integrante de la comunidad zapoteca de Yateé y está adquiriendo la lengua tanto a través de la transmisión intergeneracional por parte de sus padres como mediante clases semanales de zapoteco impartidas por el maestro local, Florentino Ambrosio Alcantara.

Esta colección se beneficia de una colaboración cercana entre lingüistas académicos y personas investigadoras de la comunidad. Este trabajo conjunto fomenta la participación comunitaria en la documentación lingüística y contribuye a que los materiales registrados reflejen conocimientos, prácticas y perspectivas lingüísticas locales.

 

Collection contents

English: This collection contains audio recordings of lexical items listed in the Glottobank Lexibank-Numeralbank datasheets. The collection also includes a Lexibank-Numeralbank data spreadsheet that documents the transcription, word key, and corresponding recordings in the collections.

The collection consists of fifty audio recordings. File names follow a standardized naming convention indicating the word category (basic_concepts/kinship/numerals), the Glottocode (zty), the reference number of the word in the Lexibank–Numeralbank spreadsheet, and the speaker’s initials with the date of recording (e.g. basic_concepts_zty_1-58_LFM06112024).

Each recording is accompanied by an ELAN (.eaf) file containing multiple annotation tiers, including phonetic transcription in IPA (A-Phonetic-ipa), Zapotec orthographic transcription (A-Transcription-txt-zty), English gloss (A-Translation-gls-eng), Spanish gloss (A-Translation-gls-spa), speaker notes (A-Participant-note), and the corresponding item number in the Lexibank–Numeralbank spreadsheet (Metadata-Lexibank-Number).

Each lexical item was elicited with two or three repetitions. Some words were elicited within sentence contexts in order to provide speakers with a natural linguistic context for production.

Español: Esta colección contiene grabaciones de audio de ítems léxicos incluidos en las hojas de datos de Glottobank Lexibank–Numeralbank. La colección también incluye una hoja de cálculo de Lexibank–Numeralbank que documenta la transcripción, la clave léxica y las grabaciones correspondientes de la colección.

La colección consta de cincuenta grabaciones de audio. Los nombres de archivo siguen una convención estandarizada que indica la categoría léxica (basic_concepts/kinship/numerals), el Glottocode (zty), el número de referencia del ítem en la hoja de cálculo de Lexibank–Numeralbank, y las iniciales de la persona hablante junto con la fecha de grabación (por ejemplo, basic_concepts_zty_1-58_LFM06112024).

Cada grabación está acompañada por un archivo ELAN (.eaf) que contiene múltiples niveles de anotación, incluyendo transcripción fonética en IPA (A-Phonetic-ipa), transcripción en la ortografía zapoteca (A-Transcription-txt-zty), glosa en inglés (A-Translation-gls-eng), glosa en español (A-Translation-gls-spa), notas de la persona hablante (A-Participant-note), y el número correspondiente del ítem en la hoja de cálculo de Lexibank–Numeralbank (Metadata-Lexibank-Number).

Cada ítem léxico fue elicitado con dos o tres repeticiones. Algunas palabras se elicitaron dentro de contextos oracionales con el fin de proporcionar a las personas hablantes un contexto lingüístico natural para la producción.

 

Collection history

English: Data collection for this collection took place in both San Francisco Yateé, Oaxaca, Mexico, and in Los Angeles, United States.

All recordings in the collection have been fully annotated. The data are transcribed in the IPA and glossed using Zapotec orthography, as well as translated into English and Spanish. While this collection was created primarily for inclusion in Lexibank and Numeralbank, it also documents morphological variation, including tense, aspect, and mode distinctions for a number of verbs in the dataset.

Español: La recolección de datos de esta colección se llevó a cabo tanto en San Francisco Yateé, Oaxaca, México, como en Los Ángeles, Estados Unidos.

Todas las grabaciones de la colección han sido completamente anotadas. Los datos cuentan con transcripción en el IPA y glosas en la ortografía zapoteca, así como traducciones al inglés y al español. Aunque esta colección fue creada principalmente para su inclusión en Lexibank y Numeralbank, también documenta variación morfológica, incluyendo distinciones de tiempo, aspecto y modo en varios verbos del conjunto de datos.

 

Other Information

English: The Zapotec orthography is collectively developed by speakers of the language and is phonologically based. The language exhibits a lenis-fortis contrast in consonants. For obstruents (stops and fricatives), this contrast is represented through voicing (e.g. [p]/[b], [t]/[d], [k]/[g], [s]/[z]). For sonorants, the contrast is expressed through differences in length and rhoticity (e.g. [n] vs. [ɳ], [l] vs. [ɭ]). In the orthography, lenis sonorants are marked by the addition of h (e.g. vs. ; vs. ). The contrast between and follows a different pattern: is pronounced [tʂ], whereas is pronounced [ʒ]. Both the digraphs and represent the sound [ʒ].

Español: La ortografía zapoteca ha sido desarrollada de manera colectiva por las personas hablantes de la lengua y está basada en principios fonológicos. La lengua presenta un contraste suave-fuerte en las consonantes. En el caso de los obstruyentes (oclusivas y fricativas), este contraste se representa mediante la sonoridad (por ejemplo, [p]/[b], [t]/[d], [k]/[g], [s]/[z]). En las sonorantes, el contraste se expresa a través de diferencias de longitud y róticidad (por ejemplo, [n]/[ɳ], [l]/[ɭ]). En la ortografía, las sonorantes suaves se marcan mediante la adición de h (por ejemplo, frente a ; frente a ). El contraste entre y sigue un patrón distinto: se pronuncia [tʂ], mientras que se pronuncia [ʒ]. Ambos dígrafos, y , representan el sonido [ʒ].

 

Acknowledgement and citation

English: I am deeply indebted to all participants who generously contributed their recordings, time, and effort to the creation of this collection: Roberto Benitez Pascual, Lilia Fernández Márquez, Lucrecia Fernández Márquez, Antonio Francisco Jerónimo, Epifania Márquez Anastasio, Celerina Vasquez, and one anonymous contributor.

I am especially grateful to my host family in San Francisco Yateé, Lilia Fernández Márquez and Fidel Bernal Francisco, for their generosity and hospitality during my fieldwork. I also sincerely thank Briseida Mendez and Adrián Fernández for introducing me to the community and to their family. I am deeply grateful to Florentino Ambrosio Alcantara for providing a letter of introduction to local authorities and for offering Zapotec language classes, which enabled me to communicate with community members and strengthened my linguistic knowledge, which has greatly benefited this documentation project.

To refer to any data from this collection, please cite as follows:

Chai, Yuan. 2026. Documentation of Yateé Zapotec. Handle: http://hdl.handle.net/2196/209f475f-ec04-4653-96a8-8ff7c62fc749. Endangered Languages Archive. Accessed on [insert date here].

Español: Expreso mi profundo agradecimiento a todas las personas participantes que contribuyeron generosamente con sus grabaciones, tiempo y esfuerzo para la creación de esta colección: Roberto Benitez Pascual, Lilia Fernández Márquez, Lucrecia Fernández Márquez, Antonio Francisco Jerónimo, Epifania Márquez Anastasio, Celerina Vasquez y una persona colaboradora anónima.

Agradezco especialmente a mi familia anfitriona en San Francisco Yateé, Lilia Fernández Márquez y Fidel Bernal Francisco, por su generosidad y hospitalidad durante mi trabajo de campo. Asimismo, agradezco sinceramente a Briseida Mendez y Adrián Fernández por presentarme a la comunidad y a su familia. Expreso también mi profundo agradecimiento a Florentino Ambrosio Alcantara por proporcionarme una carta de presentación para las autoridades locales y por impartirme clases de zapoteco, lo que me permitió comunicarme con las personas de la comunidad y fortalecer mis conocimientos lingüísticos, lo cual ha beneficiado enormemente a este proyecto de documentación.

Para referirse a cualquier dato de esta colección, cítese de la siguiente manera:

Chai, Yuan. 2026. Documentation of Yateé Zapotec. Handle: http://hdl.handle.net/2196/209f475f-ec04-4653-96a8-8ff7c62fc749. Endangered Languages Archive. Ingresado el [insertar fecha aquí].

Click to access collection

Powered by Preservica
© Copyright 2025