search catalogue
catalogue

Harakmbut language documentation

 

Language Harakmbut, Harakmbut
Depositor Daniel Valle
Affiliation University of Mississippi
Location Peru
Collection ID 0854
Grant ID MDP1096
Funding Body Endangered Languages Documentation Programme
Collection Status Forthcoming
Landing Page Handle http://hdl.handle.net/2196/9f6aed57-80bb-4518-98dd-f977bc6cef81

 

Summary of the collection

English: This project will produce a comprehensive, high-quality documentation of Harakmbut that serves both community needs and academic research. A total of 120 hours of audio and video recordings will be generated across the main varieties—Amarakaeri and Wachiperi—as well as lesser-spoken varieties, capturing the full range of linguistic diversity. These recordings will document language use in diverse contexts, including daily conversations, traditional narratives, procedural texts, and ritual singing, providing a rich record of both linguistic and socio-cultural practices. Of this corpus, 25 hours will be transcribed and translated into Spanish and English in collaboration with native speakers using ELAN, and 10 hours will receive detailed morpheme-by-morpheme analysis and annotation in FLEX. All recordings and annotations will be accompanied by detailed metadata including speaker and documenter information, date, location, social context, and linguistic content, following best practices for digital archiving and long-term preservation.

Resumen de la colección

Español: Este proyecto producirá una documentación comprehensiva de alta calidad que servirá tanto a las comunidades de hablantes como a la investigación académica. Un total de 120 horas de audio y video se grabarán entre las diferentes variedades, amarakaeri y wachiperi, así como variedades menos habladas, capturando la diversidad linguística de esta lengua. Estas grabaciones documentarán la lengua en diversos contextos de uso, lo cual incluye conversaciones diarias, historias tradicionales, textos procedimentales, canto ritualístico, lo cual proveerá un registro rico de las practicas linguísticas y socio-culturales. De este corpus, 25 horas serán transcritas y traducidas al español e inglés en colaboración con los hablantes nativos usando el programa ELAN y 10 de estas horas serán analizadas al nivel morfológico en el programa FLEX. Todas las grabaciones y anotaciones estarán acompañadas de meta-datos, que incluirán información del hablante y el documentador, fecha, lugar, contexto social y linguístico, siguiendo la prácticas recomendadas para la archivación digital y la preservación a largo plazo.

 

Group represented

English: Harakmbut is a language isolate spoken in the Peruvian Amazon, in the regions of Cuzco and Madre de Dios, with an estimated 800–2,000 speakers across 11 native communities along the Madre de Dios and Colorado rivers. The language comprises several varieties—Amarakaeri, Wachiperi, Arasaeri, Kisamberi, Pukikieri, Sapiteri, and Toyeri—each associated with distinct identities (Minedu 2013). According to the 2007 census of the Peruvian National Institute of Statistics and Informatics (INEI), the three largest groups are Amarakaeri (1,043), Wachiperi (392), and Arasaeri (317). The remaining varieties have very small populations: Pukikieri (168), Toyeri (125), and Kisamberi and Sapiteri (47 combined). These figures illustrate Harakmbut’s internal diversity while also showing the vulnerability of several varieties, some of which are on the verge of disappearing.

Grupo representado

Español: El harakmbut es una lengua aislada hablada en la Amazonía peruana en las regiones de Cuzco y Madre de Dios, con un estimado de 800-2000 hablantes en 11 comunidades nativas a lo largo de los ríos Madre de Dios y Colorado. La lengua comprende diferentes variedades –Amarakaeri, Wachiperi, Arasaeri, Kisamberi, Pukikieri, Sapiteri y Toyeri– cada una asociada con una identidad distinta (Minedu 2013). De acuerdo al censo del 2007 realizado por el Instituto Nacional de Estadística e Informática (INEI), los subgrupos más grandes son Amarakaeri (1,043), Wachiperi (392), Toyeri (125) y Kisamberi and Sampiteri (47 combinados). Estos números ilustran la diversidad interna de este grupo y al mismo tiempo muestra la vulnerabilidad de varias variedades, algunas de las cuales están en serio peligro de desaparecer.

 

Language information

English: As a language isolate, Harakmbut has no demonstrated genetic relationship to any other language, making its documentation particularly important for understanding Amazonian prehistory. Beyond this, Harakmbut shows features of typological and theoretical interest (Helberg 1982; Tripp 1995; Van Linden 2023). Its phonology includes both prenasalized and unreleased stops. In the nominal domain, it contrasts free nouns with obligatorily bound nouns, a distinction with direct consequences for argument structure. The verbal system is complex: argument indexing depends on the animacy hierarchy of the object, and noun incorporation is productive. Harakmbut also encodes a two-way evidential distinction in past predicates, differentiating between direct and indirect sources of knowledge. Current descriptions are based mainly on Amarakaeri, and to a lesser degree on Wachiperi, so it remains unclear whether other varieties share these traits. Some of these features also occur in neighboring Quechuan, Arawakan, and Panoan languages, raising questions about areal diffusion versus internal innovation. Whether they represent unique developments or participation in a larger linguistic area—such as the Guaporé–Mamoré (Crevels & Van der Voort 2008; Muysken et al. 2014)—remains an open research question.

Información sobre el idioma

Español: Como una lengua aislada, el harakmbut no tiene un vínculo genético demostrado con ninguna otra lengua, lo que hace que su documentación sea particularmente importante para entender mejor la prehistoria de la Amazonía. Además de esto, el harakmbut muestra ciertos rasgos tipológicos interesantes (Helberg 1982; Tripp 1995; Van Linden 2023). Su fonología incluye consonantes oclusivas pre-nasalizadas y con cerrazón no abierta. Con respecto a los sustantivos, esta lengua contrasta sustantivos libres con aquellos obligatoriamente poseídos, una distinción relevante para la estructura argumental. El sistema verbal es complejo: la indexación de los argumentos depende de la jerarquía de animicidad del objeto, y la incorporación nominal es productiva. El harakmbut también hace una distinción dual de evidencialidad en predicados en el pasado, con una distinción de fuentes de información directa e indirectas. Las descripciones actuales se centran principalmente en la variedad del amarakaeri, y en menor medida en el wachiperi, así que es una pregunta abierta si otras variedades comparten estos rasgos lingüísticos. Algunos de estos rasgos también ocurren en lenguas vecinas como el quechua, lenguas arawak y pano, lo cual plantea la pregunta sobre si estos rasgos son producto de contacto o innovación interna. Ya sea que representen desarrollos únicos o sean parte de un área lingüística mayor–como el área lingüística Guaporé-Mamoré (Crevels & Van der Voort 2008; Muysken et al. 2014)–sigue siendo una pregunta sin resolver.

 

Acknowledgement and citation

English: I wish to acknowledge the Harakmbut speakers for their effort, patience, and generosity in this work sharing with me a part of their language.

To refer to any data from this collection, please cite as follows:

Valle, Daniel. 2026. Documentation and description of Harakmbut (Isolate). Endangered Languages Archive. Handle: http://hdl.handle.net/2196/17ad7c2f-408f-4fce-ac82-954f3083a221. Accessed on [insert date here].

Agradecimientos y citas

Español: Me gustaría reconocer a los hablantes del harakmbut por sus esfuerzo, paciencia y generosidad en este trabajo por compartir una parte de su lengua conmigo.
Valle, Daniel. 2026. Documentation and description of Harakmbut (Isolate). Endangered Languages Archive. Handle: http://hdl.handle.net/2196/17ad7c2f-408f-4fce-ac82-954f3083a221. Ingresado en [insertar fecha aquí]

Click to access collection

Powered by Preservica
© Copyright 2025