882 resultados para automatic music analysis
Resumo:
Pós-graduação em Música - IA
Resumo:
Pós-graduação em Ciência da Computação - IBILCE
Resumo:
With the widespread proliferation of computers, many human activities entail the use of automatic image analysis. The basic features used for image analysis include color, texture, and shape. In this paper, we propose a new shape description method, called Hough Transform Statistics (HTS), which uses statistics from the Hough space to characterize the shape of objects or regions in digital images. A modified version of this method, called Hough Transform Statistics neighborhood (HTSn), is also presented. Experiments carried out on three popular public image databases showed that the HTS and HTSn descriptors are robust, since they presented precision-recall results much better than several other well-known shape description methods. When compared to Beam Angle Statistics (BAS) method, a shape description method that inspired their development, both the HTS and the HTSn methods presented inferior results regarding the precision-recall criterion, but superior results in the processing time and multiscale separability criteria. The linear complexity of the HTS and the HTSn algorithms, in contrast to BAS, make them more appropriate for shape analysis in high-resolution image retrieval tasks when very large databases are used, which are very common nowadays. (C) 2014 Elsevier Inc. All rights reserved.
Resumo:
[EN]Automatic facial analysis abilities are commonly integrated in a system by a previous off-line learning stage. In this paper we argue that a facial analysis system would improve its facial analysis capabilities based on its own experience similarly to the way a biological system, i.e. the human system, does throughout the years. The approach described, focused on gender classification, updates its knowledge according to the classification results. The presented gender experiments suggestthatthisapproachispromising,evenwhenjustashort simulationofwhatforhumanswouldtakeyearsofacquisition experience was performed.
Resumo:
Internetbasierte Jobportale liefern in Form von Stellenanzeigen eine interessante Datengrundlage, um Qualifikationsanforderungen von nachfragenden Unternehmen an potenzielle Hochschulabsolventen transparent zu machen. Hochschulen können durch Analyse dieser Qualifikationsanforderungen das eigene Aus- und Weiterbildungsangebot arbeitsmarktorientiert weiterentwickeln und sich somit in der Hochschullandschaft profilieren. Hierfür ist es indes erforderlich, die Stellenanzeigen aus Jobportalen zu extrahieren und mithilfe adäquater analytischer Informationssysteme weiter zu verarbeiten. In diesem Beitrag zum CampusSource White Paper Award wird ein Konzept für Job Intelligence-Services vorgestellt, die die systematische Analyse von Qualifikationsanforderungen auf Grundlage von Stellenanzeigen aus Jobportalen gestatten.
Resumo:
Cette thèse de doctorat en composition comprend deux projets de nature différente et complémentaire : (1) un projet de recherche théorique sur la communication des caractères musicaux; (2) un projet artistique s'articulant autour de la composition de trois pièces : L'homme à deux têtes - opéra de chambre, Un instant dans l'esprit de Lovecraft - pour clarinette solo, orchestre à cordes et percussions, et Balade ornithologique - pour orchestre à vents. La conception de la musique comme un moyen de communication est à l'origine de cette recherche théorique qui est motivée par un désir de compréhension des stratégies d'expressions des émotions en musique, à partir du point de vue du compositeur. Cette thèse aborde les modèles de communication, le concept de personnage virtuel et la théorie de la contagion des humeurs. Par la suite, nous détaillerons les indices acoustiques menant à la perception des caractères musicaux. Toutes ces notions sont illustrées et explorées par la composition de miniature ayant un caractère bien ciblé. Finalement, nous proposons un système d'analyse musical des caractères et des émotions qui est appliqué à l'analyse de sections des pièces composées au cours de ce projet de doctorat. Ce dernier chapitre met en lumière les stratégies utilisées pour créer un discours dramatique tout en exposant l'évocation de différents caractères musicaux.
Resumo:
Cette thèse de doctorat en composition comprend deux projets de nature différente et complémentaire : (1) un projet de recherche théorique sur la communication des caractères musicaux; (2) un projet artistique s'articulant autour de la composition de trois pièces : L'homme à deux têtes - opéra de chambre, Un instant dans l'esprit de Lovecraft - pour clarinette solo, orchestre à cordes et percussions, et Balade ornithologique - pour orchestre à vents. La conception de la musique comme un moyen de communication est à l'origine de cette recherche théorique qui est motivée par un désir de compréhension des stratégies d'expressions des émotions en musique, à partir du point de vue du compositeur. Cette thèse aborde les modèles de communication, le concept de personnage virtuel et la théorie de la contagion des humeurs. Par la suite, nous détaillerons les indices acoustiques menant à la perception des caractères musicaux. Toutes ces notions sont illustrées et explorées par la composition de miniature ayant un caractère bien ciblé. Finalement, nous proposons un système d'analyse musical des caractères et des émotions qui est appliqué à l'analyse de sections des pièces composées au cours de ce projet de doctorat. Ce dernier chapitre met en lumière les stratégies utilisées pour créer un discours dramatique tout en exposant l'évocation de différents caractères musicaux.
Resumo:
Cette recherche aborde le chant de la cueca chilienne à travers le spectre de la voix dans la construction de représentations sociales, et ce, sur la base d’une méthodologie mixte qui combine la recherche bibliographique, l’observation participante, les entrevues et l’analyse musicale. Comme point de départ, on remarque la pratique d’une cueca surnommée urbana, brava ou chilenera, caractérisée par un timbre vocal singulier associé au milieu « populaire » des chanteurs. Remontant aux premières traces de la cueca, au Chili, le chapitre 2 aborde les descriptions de la voix de la zamacueca au XIXe siècle publié dans des récits de voyage. L’analyse du contexte dans lequel ces récits se publient permet de constater que l’idée du caractère nasal de la cueca s’associe à la constitution d’altérité. Le chapitre 3 aborde la façon dont une théorie spécifique sur l’origine de la cueca chilienne contribue aux conceptions de la voix dans le genre. Le sujet de la nasalité apparaît encore, cette fois-ci imbriqué dans l’imagination de l’origine arabo-andalouse de la cueca. S’intéressant à la représentation du sujet populaire, le chapitre 4 expose deux figures centrales de la culture chilienne : le huaso et le roto, représentants du paysan et du sujet urbain, tous deux entremêlés avec des discours nationalistes. Le « parler populaire » apparaît représenté dans divers styles de cueca, en produisant des vocalités affectées par l’imagination de la classe sociale, et ce dans le contexte de débats sur l’authenticité. Le chapitre 5 aborde finalement l’expérience vécue par de jeunes chanteurs actifs sur une scène de revitalisation. Leurs dynamiques de chant en groupe soulignent l’impact de la compétition sur le déploiement de la voix. La pratique structurée selon le chant en ronde - chant à la rueda – montrera que la production d’un « bon pito », soit d’une voix adéquate à la cueca, révèle la nécessité d’adapter les voix aux besoins du groupe. La conclusion met en lumière que le rapport entre voix et style se présente comme une correlation cruciale pour comprendre non seulement la diversité des variantes de cuecas existantes à un moment donné, mais également leurs transformations au cours du temps par l’entremise d’un processus de stylisation. Au-delà du style, pourtant, la voix paraît exprimer quelque chose du sujet qui la fait résonner. Par ce biais, les diverses étiquettes accompagnant le terme cueca nous informent sur les caractéristiques ethniques, du genre et de classe des chanteurs, y compris les différentes voix d’un même sujet qui chante.
Resumo:
The tonic is a fundamental concept in Indian art music. It is the base pitch, which an artist chooses in order to construct the melodies during a rg(a) rendition, and all accompanying instruments are tuned using the tonic pitch. Consequently, tonic identification is a fundamental task for most computational analyses of Indian art music, such as intonation analysis, melodic motif analysis and rg recognition. In this paper we review existing approaches for tonic identification in Indian art music and evaluate them on six diverse datasets for a thorough comparison and analysis. We study the performance of each method in different contexts such as the presence/absence of additional metadata, the quality of audio data, the duration of audio data, music tradition (Hindustani/Carnatic) and the gender of the singer (male/female). We show that the approaches that combine multi-pitch analysis with machine learning provide the best performance in most cases (90% identification accuracy on average), and are robust across the aforementioned contexts compared to the approaches based on expert knowledge. In addition, we also show that the performance of the latter can be improved when additional metadata is available to further constrain the problem. Finally, we present a detailed error analysis of each method, providing further insights into the advantages and limitations of the methods.
Resumo:
The TraSe (Transform-Select) algorithm has been developed to investigate the morphing of electronic music through automatically applying a series of deterministic compositional transformations to the source, guided towards a target by similarity metrics. This is in contrast to other morphing techniques such as interpolation or parameters or probabilistic variation. TraSe allows control over stylistic elements of the music through user-defined weighting of numerous compositional transformations. The formal evaluation of TraSe was mostly qualitative and occurred through nine participants completing an online questionnaire. The music generated by TraSe was generally felt to be less coherent than a human composed benchmark but in some cases judged as more creative.
Resumo:
An automatic approach to road lane marking extraction from high-resolution aerial images is proposed, which can automatically detect the road surfaces in rural areas based on hierarchical image analysis. The procedure is facilitated by the road centrelines obtained from low-resolution images. The lane markings are further extracted on the generated road surfaces with 2D Gabor filters. The proposed method is applied on the aerial images of the Bruce Highway around Gympie, Queensland. Evaluation of the generated road surfaces and lane markings using four representative test fields has validated the proposed method.
Resumo:
In this study we set out to dissociate the developmental time course of automatic symbolic number processing and cognitive control functions in grade 1-3 British primary school children. Event-related potential (ERP) and behavioral data were collected in a physical size discrimination numerical Stroop task. Task-irrelevant numerical information was processed automatically already in grade 1. Weakening interference and strengthening facilitation indicated the parallel development of general cognitive control and automatic number processing. Relationships among ERP and behavioral effects suggest that control functions play a larger role in younger children and that automaticity of number processing increases from grade 1 to 3.