Our study of a novel technique for adaptive image sequence coding is reported. The number of reference frames and the intervals between them are adjusted to improve the temporal compensability of the input video. The bits are distributed more efficiently on different frame types according to temporal and spatial complexity of the image scene. Experimental results show that this dynamic group-of-picture (GOP) structure coding scheme is not only feasible but also better than the conventional fixed GOP method in terms of perceptual quality and SNR. (C) 1996 Society of Photo-Optical Instrumentation Engineers.


Learning to perceive is faced with a classical paradox: if understanding is required for perception, how can we learn to perceive something new, something we do not yet understand? According to the sensorimotor approach, perception involves mastery of regular sensorimotor co-variations that depend on the agent and the environment, also known as the "laws" of sensorimotor contingencies (SMCs). In this sense, perception involves enacting relevant sensorimotor skills in each situation. It is important for this proposal that such skills can be learned and refined with experience and yet up to this date, the sensorimotor approach has had no explicit theory of perceptual learning. The situation is made more complex if we acknowledge the open-ended nature of human learning. In this paper we propose Piaget's theory of equilibration as a potential candidate to fulfill this role. This theory highlights the importance of intrinsic sensorimotor norms, in terms of the closure of sensorimotor schemes. It also explains how the equilibration of a sensorimotor organization faced with novelty or breakdowns proceeds by re-shaping pre-existing structures in coupling with dynamical regularities of the world. This way learning to perceive is guided by the equilibration of emerging forms of skillful coping with the world. We demonstrate the compatibility between Piaget's theory and the sensorimotor approach by providing a dynamical formalization of equilibration to give an explicit micro-genetic account of sensorimotor learning and, by extension, of how we learn to perceive. This allows us to draw important lessons in the form of general principles for open-ended sensorimotor learning, including the need for an intrinsic normative evaluation by the agent itself. We also explore implications of our micro-genetic account at the personal level.


Brasil e Argentina nutriram ao longo de décadas sentimento de rivalidade. Aos poucos, tal sentimento foi substituído pela cooperação e consequentemente integração entre os mesmos. A aproximação entre os países culminou na formulação do Mercado Comum do Sul, um dos blocos mais importantes da região sul-americana. Porém, ao longo da década de 1990, a organização passou por momentos de crises, bem como as próprias economias nacionais. Isto provocou a possibilidade de haver retrocesso ou até mesmo a dissolução do bloco que, em períodos anteriores, já tinha proporcionado aumento de fluxo de comércio e de confiança entre seus dois membros maiores. No entanto, a partir de 2003, novos governantes que assumiram o cargo de presidente no Brasil e na Argentina propiciaram uma mudança naquele contexto. Luiz Inácio Lula da Silva, presidente do Brasil, e Néstor Kirchner, presidente da Argentina, subiram ao poder com ideias e objetivos muito semelhantes para a integração regional. Também, havia grande preocupação com o outro em termos de política externa, considerado como forte parceiro em termos políticos, estratégicos e econômicos. A partir da aplicação de literaturas que colocavam o Estado como figura central na elaboração de política externa e de mudanças na mesma, assim como daquelas que estudam o período de 2003 a 2010, avalia-se Brasil e Argentina. O segundo mandato de Lula e o mandato de Cristina Fernández de Kirchner também são estudados, porque são considerados governos de continuidade aos anteriores. A partir desta reaproximação de Brasil e Argentina, enquanto Estados, pode-se perceber uma mudança na reconfiguração do Mercosul. Há maior interesse político para que o bloco seguisse por caminhos que não o meramente comercial. Desde então, há maior quantidade de iniciativas dentro do bloco, e maior disponibilidade e confiança por parte dos governos.


O futebol é um esporte que possui diversas dimensões e que pode ter várias utilidades, usos e implicações tanto na vida dos seres humanos quanto nas relações entre os Estados. Ele pode servir à objetivos políticos de um Estado, pode agir como um veículo de propagação de ideias e valores, pode servir como uma ferramenta de propaganda e prestígio internacionais, pode constituir um instrumento para ganhos econômicos, entre muitas outras utilizações possíveis. No caso do Brasil, o futebol também constitui um elemento importante da identidade nacional e também, por vezes, influi na percepção que os brasileiros têm de seus vizinhos argentinos. A imagem que o Brasil tem da Argentina é de um país soberbo, arrogante e não confiável, todos estereótipos que são constantemente veiculados pelas mídias brasileiras desde muitas décadas atrás. Partindo dessas premissas, a presente dissertação tem como objetivo analisar as percepções sobre a Argentina veiculadas na mídia esportiva brasileira, buscando correlacioná-las com as relações exteriores entre Brasil e Argentina. Dessa forma, se buscará averiguar se as mudanças no relacionamento bilateral entre estes, acompanha uma mudança também nas caracterizações e percepções da seleção argentina e de seu país. Para tanto, foram escolhidos quatro períodos que representam momentos-chave da relação bilateral entre esses dois países: as Copas Mundiais de Futebol de 1978, 1982, 1986 e 2002. Cada um desses períodos escolhidos possui um contexto diferente, de maior amizade ou rivalidade entre esses países vizinhos, propiciando uma análise da relação entre as percepções veiculadas na mídia esportiva e a relações exteriores entre Brasil e Argentina em diferentes contextos temporais e políticos.


O objetivo da tese é investigar a constituição da interioridade a partir de uma abordagem externalista. Os processos pelos quais o autoconhecimento é constituído são considerados como estando associados ao desenvolvimento da perspectiva da primeira pessoa. Adotar uma perspectiva de primeira pessoa é tornar-se capaz de fazer referência a si mesmo e conhecer seus próprios estados mentais e corporais. A autoconsciência e o autoconhecimento foram tradicionalmente subsumidos à idéia de Descartes da autoridade da primeira pessoa. Segundo a tese cartesiana, teríamos acesso privilegiado e não-empírico aos nossos estados mentais que se expressaria por meio de um conhecimento. A tese central do externalismo afirma, ao contrário, que o conteúdo dos estados mentais é constituído, em parte, pelas relações com o ambiente. A adoção da tese externalista coloca em dúvida a suposição cartesiana de que temos acesso privilegiado aos conteúdos de nossos pensamentos, restringindo, assim, a autoridade da primeira pessoa. O externalismo perceptivo de Davidson, por exemplo, oferece uma solução ternária eu-intérprete-mundo para as origens do autoconhecimento. A tese de Davidson é apresentada como reconciliando o autoconhecimento e as idéias centrais do externalismo. São apresentados dois modelos da gênese externa do eu:1) os modelos ecológicos que propõem um desenvolvimento do sentido de eu como uma função das interações do eu com o ambiente; 2) o modelo psicológico de Winnicott que propõe a emergência do sentido de eu a partir de uma relação ternária entre o eu, os outros e os objetos transicionais. Defendemos a tese de que o modelo psicológico de Winnicott é o mais adequado para descrever a conceitualização epistemológica de Davidson das origens externalistas do autoconhecimento.


A presente pesquisa aborda a formação da identidade da religião católica no Brasil colonial e seus reflexos nos desregramentos recorrentes na segunda metade do século XVIII, na diocese de São Sebastião do Rio de Janeiro durante o episcopado de D. José Joaquim Justiniano Mascarenhas Castelo Branco (1773 1805) tendo sido este o primeiro bispo a assumir o comando de sua diocese natal. O tema proposto aborda diretamente a complexa relação entre os poderes temporal, representado pelo Estado português personificado na figura da realeza , e o espiritual, pertencente à Igreja sua representatividade máxima no local varia de acordo com a posição ocupada pelos clérigos, respeitando-se, assim, a hierarquia eclesiástica (monges, freiras, padres, bispos etc.). Apesar da obrigatoriedade do catolicismo na colônia, a coroa metropolitana não foi capaz de dar o suporte necessário para o estabelecimento de uma religiosidade fiel às determinações do Concilio de Trento, conforme determinava o direito de Padroado. Isso levou à formação de um catolicismo colonial por vezes aparente. A miscigenação étnico-cultural deu brecha para o surgimento de praticas sincréticas e diferentes comportamentos sociais reprovados pela Igreja. O desvio de conduta era um problema que afetava, não só os fiéis, mas também o clero, sendo este composto na época por sacerdotes mal formados e alguns estrangeiros de índoles duvidosas. Assim, os bispos do Brasil do século XVIII tiveram que lidar com problemas que eram, na verdade, reflexo da realidade da estrutura colonizadora local onde, apesar de ter sido a Igreja uma importante aliada do Estado lusitano, e vice-versa, havia também grande rivalidade entre ambos. Dessa forma, ocorriam na época constantes embates entre as autoridades civil e religiosa, as quaisuniam-se e desuniam-se de acordo com seus interesses.


Estimulação transcraniana por corrente contínua (ETCC) sobre áreas corticais pré-selecionadas, tem aumentado o desempenho físico de diferentes populações. Porém, lacunas persistem no tocante aos mecanismos subjacentes à estes efeitos. Assim, a presente tese objetivou: a) investigar os efeitos da ETCC anódica (aETCC) e placebo (Sham) no córtex motor (CM) de indivíduos saudáveis sobre o desempenho de força máxima; b) comparar os efeitos da ETCC sobre a produção de força máxima e estabilidadade da força durante exercícios máximo e submáximo em sujeitos hemiparéticos e saudáveis; c) investigar o efeito da ETCC sobre a conectividade funcional inter-hemisférica (coerência eletroencefalográfica cEEG) do córtex pré-frontal (CPF), desempenho aeróbio e dispêndio energético (EE) durante e após exercício máximo e submáximo. No 1 estudo, 14 adultos saudáveis executaram 2 sessões de exercício máximo de força (EMF) dos músculos flexores e extensores do joelho dominante (3 séries de 10 rep máximas), precedidos por aETCC ou Sham (2mA; 20 mim). aETCC não foi capaz de aumentar o trabalho total e pico de torque (PT), resistência à fadiga ou atividade eletromiográfica durante o EMF. No 2 estudo, 10 hemiparéticos e 9 sujeitos saudáveis receberam aETCC e Sham no CM. O PT e a estabilidade da força (coeficiente de variação - CV) foram avaliados durante protocolo máximo e submáximo de extensão e flexão unilateral do joelho (1 série de 3 reps a 100% do PT e 2 séries de 10 reps a 50% do PT). Nenhuma diferença no PT foi observada nos dois grupos. Diminuições no CV foram obervadas durante a extensão (~25-35%, P<0.001) e flexão de joelho (~22-33%, P<0.001) após a aETCC comparada com Sham nos hemiparéticos, entretanto, somente o CV na extensão de joelhos diminuiu (~13-27%, P<0.001) nos saudáveis, o que sugere que aETCC pode melhorar o CV, mas não o PT em sujeitos hemiparéticos. No 3 estudo, 9 adultos saudáveis realizaram 2 testes incrementais máximos precedidos por aETCC ou Sham sobre o CPF com as respostas cardiorrespiratórias, percepção de esforço (PSE) e cEEG do CPF sendo monitoradas. O VO2 de pico (42.64.2 vs. 38.23.3 mL.kg.min-1; P=0,02), potência total (252.776.5 vs. 23773.3 W; P=0,05) e tempo de exaustão (531.1140 vs. 486.7115.3 seg; P=0,04) foram maiores após aETCC do que a Sham. Nenhuma diferença foi encontrada para FC e PSE em função da carga de trabalho (P>0,05). A cEEG do CPF aumentou após aETCC vs. repouso (0.700.40 vs. 0.380.05; P=0,001), mas não após Sham vs. repouso (0.360.49 vs. 0.330.50; P=0,06), sugerindo que a aETCC pode retardar a fadiga aumentando a conectividade funcional entre os hemisférios do CPF e desempenho aeróbio durante exercício exaustivo. No 4 estudo, o VO2 e EE foram avaliados em 11 adultos saudáveis antes, durante a aETCC ou Sham no CPF e 30 min após exercício aeróbio submáximo isocalórico (~200kcal). Diferenças não foram observadas no VO2 vs. repouso durante aETCC e Sham (P=0.95 e P=0.85). Porém, a associação entre exercício e aETCC aumentou em ~19% o EE após ao menos, 30 min de recuperação após exercício quando comparada a Sham (P<0,05).


Most behavioral tasks have time constraints for successful completion, such as catching a ball in flight. Many of these tasks require trading off the time allocated to perception and action, especially when only one of the two is possible at any time. In general, the longer we perceive, the smaller the uncertainty in perceptual estimates. However, a longer perception phase leaves less time for action, which results in less precise movements. Here we examine subjects catching a virtual ball. Critically, as soon as subjects began to move, the ball became invisible. We study how subjects trade-off sensory and movement uncertainty by deciding when to initiate their actions. We formulate this task in a probabilistic framework and show that subjects' decisions when to start moving are statistically near optimal given their individual sensory and motor uncertainties. Moreover, we accurately predict individual subject's task performance. Thus we show that subjects in a natural task are quantitatively aware of how sensory and motor variability depend on time and act so as to minimize overall task variability.


This paper proposes an HMM-based approach to generating emotional intonation patterns. A set of models were built to represent syllable-length intonation units. In a classification framework, the models were able to detect a sequence of intonation units from raw fundamental frequency values. Using the models in a generative framework, we were able to synthesize smooth and natural sounding pitch contours. As a case study for emotional intonation generation, Maximum Likelihood Linear Regression (MLLR) adaptation was used to transform the neutral model parameters with a small amount of happy and sad speech data. Perceptual tests showed that listeners could identify the speech with the sad intonation 80% of the time. On the other hand, listeners formed a bimodal distribution in their ability to detect the system generated happy intontation and on average listeners were able to detect happy intonation only 46% of the time. © Springer-Verlag Berlin Heidelberg 2005.


In sensorimotor integration, sensory input and motor output signals are combined to provide an internal estimate of the state of both the world and one's own body. Although a single perceptual and motor snapshot can provide information about the current state, computational models show that the state can be optimally estimated by a recursive process in which an internal estimate is maintained and updated by the current sensory and motor signals. These models predict that an internal state estimate is maintained or stored in the brain. Here we report a patient with a lesion of the superior parietal lobe who shows both sensory and motor deficits consistent with an inability to maintain such an internal representation between updates. Our findings suggest that the superior parietal lobe is critical for sensorimotor integration, by maintaining an internal representation of the body's state.


Human locomotion is known to be influenced by observation of another person's gait. For example, athletes often synchronize their step in long distance races. However, how interaction with a virtual runner affects the gait of a real runner has not been studied. We investigated this by creating an illusion of running behind a virtual model (VM) using a treadmill and large screen virtual environment showing a video of a VM. We looked at step synchronization between the real and virtual runner and at the role of the step frequency (SF) in the real runner's perception of VM speed. We found that subjects match VM SF when asked to match VM speed with their own (Figure 1). This indicates step synchronization may be a strategy of speed matching or speed perception. Subjects chose higher speeds when VMSF was higher (though VM was 12km/h in all videos). This effect was more pronounced when the speed estimate was rated verbally while standing still. (Figure 2). This may due to correlated physical activity affecting the perception of VM speed [Jacobs et al. 2005]; or step synchronization altering the subjects' perception of self speed [Durgin et al. 2007]. Our findings indicate that third person activity in a collaborative virtual locomotive environment can have a pronounced effect on an observer's gait activity and their perceptual judgments of the activity of others: the SF of others (virtual or real) can potentially influence one's perception of self speed and lead to changes in speed and SF. A better understanding of the underlying mechanisms would support the design of more compelling virtual trainers and may be instructive for competitive athletics in the real world. © 2009 ACM.


Most HMM-based TTS systems use a hard voiced/unvoiced classification to produce a discontinuous F0 signal which is used for the generation of the source-excitation. When a mixed source excitation is used, this decision can be based on two different sources of information: the state-specific MSD-prior of the F0 models, and/or the frame-specific features generated by the aperiodicity model. This paper examines the meaning of these variables in the synthesis process, their interaction, and how they affect the perceived quality of the generated speech The results of several perceptual experiments show that when using mixed excitation, subjects consistently prefer samples with very few or no false unvoiced errors, whereas a reduction in the rate of false voiced errors does not produce any perceptual improvement. This suggests that rather than using any form of hard voiced/unvoiced classification, e.g., the MSD-prior, it is better for synthesis to use a continuous F0 signal and rely on the frame-level soft voiced/unvoiced decision of the aperiodicity model. © 2011 IEEE.


As humanoid robots become more commonplace in our society, it is important to understand the relation between humans and humanoid robots. In human face-to-face interaction, the observation of another individual performing an action facilitates the execution of a similar action, and interferes with the execution of different action. This phenomenon has been explained by the existence of shared internal representations for the execution and perception of actions, which would be automatically activated by the perception of another individual's action. In one interference experiment, null interference was reported when subjects observed a robotic arm perform the incongruent task, suggesting that this effect may be specific to interacting with other humans. This experimental paradigm, designed to investigate motor interference in human interactions, was adapted to investigate how similar the implicit perception of a humanoid robot is to a human agent. Subjects performed rhythmic arm movements while observing either a human agent or humanoid robot performing either congruent or incongruent movements. The variance of the executed movements was used as a measure of the amount of interference in the movements. Both the human and humanoid agents produced significant interference effect. These results suggest that observing the action of humanoid robot and human agent may rely on similar perceptual processes. Furthermore, the ratio of the variance in incongruent to congruent conditions varied between the human agent and humanoid robot. We speculate this ratio describes how the implicit perception of a robot is similar to that of a human, so that this paradigm could provide an objective measure of the reaction to different types of robots and be used to guide the design of humanoid robots interacting with humans. © 2004 IEEE.


Global information is considered the primitive of visual perception in Gestalt psychology. Further, L. Chen ( 2005) proposed a new theory of topological visual perception. According to this theory, the perception of topological difference is faster than o


Stereoscopic displays present different images to the two eyes and thereby create a compelling three-dimensional (3D) sensation. They are being developed for numerous applications including cinema, television, virtual prototyping, and medical imaging. However, stereoscopic displays cause perceptual distortions, performance decrements, and visual fatigue. These problems occur because some of the presented depth cues (i.e., perspective and binocular disparity) specify the intended 3D scene while focus cues (blur and accommodation) specify the fixed distance of the display itself. We have developed a stereoscopic display that circumvents these problems. It consists of a fast switchable lens synchronized to the display such that focus cues are nearly correct. The system has great potential for both basic vision research and display applications. © 2009 Optical Society of America.