Transcription, tagging and coding of bilingual corpora via LIDES
Data(s) |
1997
|
---|---|
Resumo |
L'objectiu d'aquest informe és presentar l'aplicació d'una sèrie de propostes sobre transcripció, etiquetatge i codificació a dos corpus: el corpus bilingüe LC (La Canonja (Català-Espanyol)) i el corpus trilingüe CSCD (Code-switching as Communicative Design (Català-Espanyol-Anglès)). Aquestes propostes, que constitueixen l'aportació de l'equip IULA-LIPPS (Language Interaction in Plurilingual and Plurilectal Speakers) al manual de codificació del sistema LIDES (Language Interaction Database Exchange System), adoptat pel grup europeu LIPPS, poden ser útils per transcriure, etiquetar i codificar dades provinents de llengües tipològicament properes i distants. |
Identificador | |
Idioma(s) |
eng |
Publicador |
Universitat Pompeu Fabra. Institut Universitari de Lingüística Aplicada |
Direitos |
Aquest document està subjecte a una llicència d'ús de Creative Commons, amb la qual es permet copiar, distribuir i comunicar públicament l'obra sempre que se'n citin l’autor original, la universitat i el departament i no se’n faci cap ús comercial ni obra derivada, tal com queda estipulat en la llicència d'ús (<a href="http://creativecommons.org/licenses/by-nc-nd/2.1/es/">http://creativecommons.org/licenses/by-nc-nd/2.1/es/</a>) |
Palavras-Chave | #LIDES (Llenguatge de programació) |
Tipo |
info:eu-repo/semantics/workingPaper |