A collaborative documentation of the Yamalero language spoken by the Yaruro people from Colombia / Documentación colaborativa de la lengua yamalera hablada por el pueblo yaruro de Colombia

Children of the Únuma community taking a bath at the Aguas Claras river (David Ginebra, February 2022). Click on image to access collection.
| Language | Yamalero |
| Depositor | David Ginebra |
| Affiliation | Universitat Autònoma de Barcelona, Université Lumière Lyon 2 |
| Location | Colombia |
| Collection ID | 0721 |
| Grant ID | L214147345 |
| Funding Body | Firebird Foundation of Anthropological Research, Jacobs Research Funds, Leiden International Students Fund (LISF) |
| Collection Status | Collection online |
| Landing Page Handle | http://hdl.handle.net/2196/596cd853-ff35-4887-8af8-2547d9676f58 |
Summary of the collection
English: This deposit is the result of the documentation of the language and knowledge of the Yaruro people from Colombia, who speak the Yamalero language (Guahiban). It is the result of three years (2022-2025) of joined efforts between the PI and a research team of three native speakers, with funding from the Firebird Foundation, the Jacob’s Research Funds, the Spanish Ministry of Science and the Leiden International Students Fund. The collection features 11 hours of audiovisual recordings properly transcribed and translated to Spanish, as well as another 7 hours of non-annotated audiovisual recordings, including a wide range of topics and genres.
This is the first Guahiban language for which publicly accessible audiovisual recordings exist. The language is spoken by some 300 people, but it is threatened by Spanish. Most of the recordings were made, transcribed, and translated to Spanish by a team of native speakers, who also selected the topics of the recordings. These include different topics, such as subsistence patterns, traditional knowledge, cultural activities, or personal accounts, and different genres, such as narratives, descriptions, conversations, or songs. There are also 42 hours of audio recordings of grammatical and lexical elicitation, as well as metadata, informed consents, pictures, and fieldnotes.
Resumen de la colección
Español: Este depósito es el resultado de la documentación de la lengua y los conocimientos del pueblo yaruro de Colombia, hablantes de la lengua yamalero (familia guahiba). Es fruto de tres años (2022–2025) de trabajo conjunto entre el investigador principal y un equipo de tres hablantes nativos, con financiación de la Firebird Foundation, la Jacob’s Research Funds, el Ministerio de Ciencia de España y el Leiden International Students Fund. La colección contiene 11 horas de grabaciones audiovisuales transcritas y traducidas al español, y otras 7 horas de grabaciones sin anotar, que incluyen una amplia gama de temas y géneros.
El yamalero es la primera lengua guahiba para la que hay grabaciones audiovisuales de acceso público. Es hablada por unas 300 personas, aunque se encuentra amenazada por el español. La mayoría de las grabaciones fueron realizadas, transcritas y traducidas al español por un equipo de hablantes nativos, que también eligió los temas de las grabaciones. Entre ellos se encuentran patrones de subsistencia, conocimientos tradicionales, actividades culturales, relatos personales, y géneros como narraciones, descripciones, conversaciones o canciones. Además, la colección contiene 42 horas de grabaciones de elicitación gramatical y léxica, así como metadatos, consentimientos informados, fotografías y notas de campo.
Group represented
English: The group represented in this deposit are the Yaruro from Colombia. They descend from the Yaruro from Venezuela (aka Pumé), but they don’t speak the Pumé language anymore (Ginebra 2022). Instead, they speak Yamalero, a Guahiban language spoken by the Yamalero people, the group they mixed with when they migrated to Colombia. However, their ethnic identity is Yaruro, and they keep a close relationship with their Yaruro ancestors through the realm of dreams.
Traditionally, they were a nomadic group, moving around the Meta river in the mid-Orinoco region. Since the early 80s, they settled down in the Caño Mochuelo reserve, in the easternmost part of the Casanare department. Consequently, their acculturation process has accelerated, due to more persistent contact with the national society, and most people have become bilingual with Spanish.
Recently, they separated from the Yamalero people and founded a community of their own, Únuma (that can be translated to ‘collective work’ in their language). Now there are some 130 Yamalero-speaking Yaruro living in Únuma, who mainly rely on hunting and fishing as their main food suppliers. The community also has a primary school with two local teachers, who are starting to teach how to write in their language.
Grupo representado
Español: El grupo representado en este depósito son los yaruros de Colombia. Esta comunidad desciende de los yaruros de Venezuela (también conocidos como pumé), aunque ellos ya no hablan su lengua tradicional, el yaruro o pumé (Ginebra 2022). En su lugar, hablan yamalero, una lengua guahiba hablada por el pueblo yamalero, con el que se mezclaron cuando migraron a Colombia. Sin embargo, ellos se siguen considerando étnicamente yaruros, y mantienen una estrecha relación con sus antepasados yaruros, por ejemplo, a través del mundo de los sueños.
Tradicionalmente, tanto los yaruros como los yamaleros eran grupos nómadas que se desplazaban por el río Meta, en la región del medio Orinoco. Desde principios de los años ochenta este grupo mixto de yaruros-yamaleros se estableció en el resguardo indígena del Caño Mochuelo, en la parte más oriental del departamento de Casanare. Como consecuencia, su proceso de aculturación se ha acelerado debido al contacto más persistente con la sociedad nacional, y la mayoría de la población se ha vuelto bilingüe en español.
Recientemente, las familias que eran descendientes de yaruros se separaron del resto del grupo y fundaron su propia comunidad, Únuma (que en su lengua puede traducirse como “trabajo colectivo”). Actualmente, hay unos 130 yaruros (hablantes de yamalero) que viven en Únuma, quienes siguen teniendo la caza y la pesca como sus principales fuentes de alimento. La comunidad también cuenta con una escuela primaria con dos maestros locales, quienes recientemente han comenzado a enseñar a escribir en su lengua.
Language information
English: The Yamalero language is spoken by some 300 people in three communities in the Caño Mochuelo reserve (DANE 2019). Two of these communities also define themselves as Yamalero, while the other one, featured in this collection, defines itself as Yaruro. This language is part of the Guahiban language family, although its internal classification is still uncertain. It has been classified within the Sikuani-Cuiba dialect continuum (Queixalós 1993), and also as an independent variety close to these two languages.
The sociolinguistic situation of the language is vulnerable. Yamalero is the language of intraethnic communication, and it is still being transmitted to younger generations. However, its vitality is threatened by incipient shift toward Spanish, since the younger generation code switches more often than the older one. It also faces risk of demographic extinction, since the language community is very small in numbers (Ferrerós Pagès et al. accepted).
Información de la lengua
Español: La lengua yamalera es hablada por unas 300 personas en tres comunidades de la reserva de Caño Mochuelo (DANE 2019). Dos de estas comunidades se identifican como yamaleras, mientras que la otra, el objeto de esta colección, se identifica como yarura. Esta lengua pertenece a la familia lingüística guahiba, aunque su clasificación interna sigue siendo incierta. Ha sido clasificada dentro del continuo dialectal sikuani-cuiba (Queixalós 1993), y también como una variedad independiente cercana a estas dos lenguas.
La situación sociolingüística del idioma es vulnerable. El yamalero es la lengua de comunicación intraétnica y aún se transmite a las generaciones más jóvenes. Sin embargo, su vitalidad está amenazada por un incipiente desplazamiento hacia el español, ya que la generación joven hace alternancia de código con más frecuencia que la mayor. También hay un riesgo de extinción demográfica, ya que la comunidad lingüística es muy pequeña (Ferrerós Pagès et al., aceptado).
Special characteristics
English: This collection is the first audiovisual publicly-accessible collection of a language from the Guahiban family. These materials give insight to a traditionally nomadic group from the mid-Orinoco which has been understudied, both in linguistic and anthropological terms. Therefore, this collection fills a gap in the ethnographic studies of this region, and opens the floor for comparison with other better documented groups of the regions, such as the Arawakan and the Saliban.
This collection is also interesting because it has been created mostly by a team of three native speakers (Jorge Tudupial, Luz Tudupial and Fernando Tudupial), who were trained in language documentation skills. They have not only recorded, transcribed, and translated most recordings, but also decided what topics were more culturally relevant and therefore merited to be included.
Características distintivas
Español: Esta colección es la primera colección audiovisual de acceso público de una lengua de la familia guahiba. Los materiales ofrecen una visión de un grupo tradicionalmente nómada del medio Orinoco que ha sido poco estudiado, tanto lingüística como antropológicamente. Por ello, esta colección llena un vacío en los estudios etnográficos de la región y permite comparaciones con otros grupos mejor documentados, como los arawak y los sáliba.
Otro punto de especial interés es que esta colección ha sido creada principalmente por un equipo de tres hablantes nativos (Jorge Tudupial, Luz Tudupial y Fernando Tudupial), que fueron formados en documentación lingüística al inicio del proyecto. Ellos no solo grabaron, transcribieron y tradujeron la mayoría de los materiales, sino que también decidieron qué temas eran más relevantes culturalmente y merecían ser incluidos.
Collection contents
English: This collection features 18 hours of audiovisual recordings (in .mp4 and .wav), 11 properly transcribed and translated to Spanish through ELAN (.eaf) and 7 still non-annotated. The annotated recordings feature mainly staged sessions, where community leaders or elders discuss culturally relevant topics, such as subsistence patterns, traditional knowledge, cultural activities, or personal accounts. This includes different genres such as narratives, descriptions, instrumental texts, or interviews. The non-annotated recordings feature spontaneous conversations in community activities, such as celebrations, expeditions, or collective work, and a few songs.
There are other kinds of materials: 42 hours of audio recordings of grammatical and lexical elicitation, metadata for all the video and audio sessions, informed consents for all participants, pictures from different activities and settings, and researcher’s fieldnotes.
Contenidos de la colección
Español: Esta colección contiene 18 horas de grabaciones audiovisuales (en .mp4 y .wav), 11 de las cuales están transcritas y traducidas al español mediante ELAN (.eaf). La mayoría de estas grabaciones son sesiones planificadas, donde los líderes o mayores de la comunidad hablan sobre temas culturalmente relevantes como patrones de subsistencia, conocimientos tradicionales, actividades culturales o relatos personales. Varios géneros están representados, como narraciones, descripciones, textos instrumentales o entrevistas. Las grabaciones que todavía no han estado anotadas contienen sobretodo conversaciones espontáneas durante actividades comunitarias (celebraciones, expediciones, trabajo colectivo).
Además de esto, también hay 42 horas de grabaciones de audio de elicitación gramatical y léxica, metadatos de todas las sesiones, consentimientos informados, fotografías de distintas actividades, y notas de campo del investigador.
Collection history
English: This project started in early February 2022, when the PI David Ginebra went to Únuma for the first time thanks to a grant from the Leiden International Study Fund (LISF) within his MA program at Leiden University. He met the community and they did the first recordings.
In September 2022 David started a 4-year PhD grant funded by the Spanish Ministry of Science at the Autonomous University of Barcelona and at the Lumière Lyon 2 University. In 2023, he went back to the field with funding from his doctoral grant (in February, March and June) and continued the data collection, while he also started trained a group of native speakers in language documentation skills.
Since July 2023, the local documentation team started to work autonomously and sending materials to David from the field. In January 2024, David went back to Únuma for a six-month fieldwork with funding from the Firebird Foundation for Anthropological Research and the Jacob’s Research Funds, to work more closely with the team. During the last month, he was joint by Juan Moreno, a BA student in linguistics at the National University of Colombia who also collected data for his BA thesis.
The last materials included in this deposit date from July 2024, when the fieldwork funding was over. In July 2025, these materials are in the process of being archived to ELAR. Besides ELAR, these materials have also been archived at the Firebird Foundation Archive and at the University of Washington Libraries (Jacob’s Research Funds) in order to fulfill the commitments with these funding bodies.
Historial de la colección
Español: El proyecto comenzó a principios de febrero de 2022, cuando el investigador principal (PI), David Ginebra, viajó por primera vez a Únuma gracias a una beca del Leiden International Study Fund (LISF) dentro de su programa de maestría en la Universidad de Leiden. Fue entonces cuando conoció a la comunidad e hicieron las primeras grabaciones.
En septiembre de 2022, David inició una beca doctoral de 4 años financiada por el Ministerio de Ciencia de España, en la Universidad Autónoma de Barcelona y la Universidad Lumière Lyon 2. En 2023 regresó al campo con financiación de su beca doctoral (en febrero, marzo y junio) y continuó con la recopilación de datos, además de formar a un grupo de hablantes nativos en documentación lingüística.
Desde julio de 2023, el equipo local comenzó a trabajar de manera autónoma y a enviar materiales desde el campo. En enero de 2024, David regresó a Únuma para una estancia de seis meses financiada por la Firebird Foundation for Anthropological Research y la Jacob’s Research Funds, lo que le permitió trabajar más estrechamente con el equipo. En el último mes se unió al proyecto Juan Moreno, estudiante de pregrado en lingüística de la Universidad Nacional de Colombia, quien también recopiló datos para su tesis de pregrado.
Los últimos materiales incluidos en este depósito datan de julio de 2024, cuando finalizó la financiación de campo. En julio de 2025, los materiales están en proceso de ser archivados en ELAR. Además, se han depositado también en el archivo de la Firebird Foundation y en las bibliotecas de la Universidad de Washington (Jacob’s Research Funds) para cumplir con los compromisos de financiación.
References/Bibliografía
Departamento Administrativo Nacional de Estadística. 2019. Base de datos REDATAM: Censo Nacional de Población y Vivienda 2018. http://systema59.dane.gov.co/bincol/RpWebEngine.exe/Portal?BASE=CNPVBASE4V2&lang=esp. Accessed on 2025-07-14.
Ferrerós Pagès, Carla, Maria Bardají, Albert Badosa Roldós, Víctor Bargiela, Alexandro Garcia-Laguia, David Ginebra, Albert Ventayol-Boada. Accepted. Una perspectiva tipològica dels símptomes de la substitució lingüística. Llengua, societat i comunicació 23.
Ginebra, David. 2022. A phonological description of Yamalero, the language of ethnic Yaruro in the Colombian Eastern Plains. MA thesis, Rijksuniversiteit te Leiden.
Queixalós, Francisco. 1993. Lenguas y dialectos de la familia lingüística guahibo. In: María Luisa Rodríguez de Montes (ed.), Estado Actual de la Clasificación de las Lenguas Indígenas de Colombia, 189-217. Santafé de Bogotá: ICC: Instituto de Caro y Cuervo.
Acknowledgement and citation
To refer to any data from the collection, please cite as follows:
Ginebra, David, Jorge Tudupial, Luz Tudupial, Fernando Tudupial. 2025. The Yaruro from Colombia: documentation of their language (Yamalero) and knowledge. Endangared Langauges Archive. Handle: http://hdl.handle.net/2196/7f7a999d-102c-414d-9c6c-240f3812f7ac. Accessed on [insert date here].
Agradecimientos y citación
Español: Para referirse a cualquier dato de la colección, por favor cite como sigue:
Ginebra, David, Jorge Tudupial, Luz Tudupial, Fernando Tudupial. 2025. The Yaruro from Colombia: documentation of their language (Yamalero) and knowledge. Endangared Langauges Archive. Handle: http://hdl.handle.net/2196/7f7a999d-102c-414d-9c6c-240f3812f7ac. Consultado el [insertar fecha aquí].

