39 resultados para Zipf


Relevância:

10.00% 10.00%

Publicador:

Resumo:

Este trabalho propõe um método para corrigir a distorção observada na distribuição de população dos municípios brasileiros presente nos dados de Censo Demográfico. Essa distorção se caracteriza por uma concentração elevada de municípios com valores de população próximos das mudanças de faixa do Fundo de Participação de Municípios (FPM). O método identifica os municípios candidatos a ajuste, ou seja, com maiores distorções obtidas através de um método Jackknife, e sugere uma correção para sua população de acordo com um modelo linear que segue a Lei de Zipf de distribuição de população de cidades (ZIPF, 1949). Após o ajuste o proposto, o teste de McCrary (2008) captura significativa redução nas descontinuidades na distribuição da população dos municípios para os anos de 2000, 2007 e 2010.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq)

Relevância:

10.00% 10.00%

Publicador:

Resumo:

The number of citations of a scientific publication or of an individual scientist has become an important factor of quality assessment in science. We report a study of the statistical distribution of the citation index of both scientific publications and scientists. We give numerical evidence that Tsallis (power law) statistics explains the entire distribution over eight orders of magnitude (10-4 to 10(4)). Also, we draw Zipf plots in order to analyze the statistical distribution of the citation index of Brazilian and international physicists and chemists. The relatively small group of Brazilian scientists seems more adequate to explain the dynamics of the citation index. In this case, we find that the distribution of the citation index can also be explained by a gradually truncated power law with similar parameters. We finally discuss possible mechanisms behind the citation index of scientists and scientific publications.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

We study the statistical distribution of firm size for USA and Brazilian publicly traded firms through the Zipf plot technique. Sale size is used to measure firm size. The Brazilian firm size distribution is given by a log-normal distribution without any adjustable parameter. However, we also need to consider different parameters of log-normal distribution for the largest firms in the distribution, which are mostly foreign firms. The log-normal distribution has to be gradually truncated after a certain critical value for USA firms. Therefore, the original hypothesis of proportional effect proposed by Gibrat is valid with some modification for very large firms. We also consider the possible mechanisms behind this distribution. (c) 2006 Published by Elsevier B.V.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Starting from Jefferson's 'law of the primate city' and Zipf's 'rank-size rule', examines the question of the heading of national urban systems, seeking to stretch the analysis as far as possible in space and time. Thus, 131 countries were included in the study, most of them also viewed from the evolutive side. It was found that there is a main tendency for urban systems to evolve to the primate leadership, maintained by Jefferson as the normal pattern. Among the various factors that act in this direction, the attraction exercised by political power located in the capital cities is dominant.-English summary

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Pós-graduação em Física - IGCE

Relevância:

10.00% 10.00%

Publicador:

Resumo:

In this paper we have quantified the consistency of word usage in written texts represented by complex networks, where words were taken as nodes, by measuring the degree of preservation of the node neighborhood. Words were considered highly consistent if the authors used them with the same neighborhood. When ranked according to the consistency of use, the words obeyed a log-normal distribution, in contrast to Zipf's law that applies to the frequency of use. Consistency correlated positively with the familiarity and frequency of use, and negatively with ambiguity and age of acquisition. An inspection of some highly consistent words confirmed that they are used in very limited semantic contexts. A comparison of consistency indices for eight authors indicated that these indices may be employed for author recognition. Indeed, as expected, authors of novels could be distinguished from those who wrote scientific texts. Our analysis demonstrated the suitability of the consistency indices, which can now be applied in other tasks, such as emotion recognition.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

La tesi presenta una serie di risultati dell'analisi quantitativa sulla linguistica. Inizialmente sono studiate due fra le leggi empiriche più famose di questo campo, le leggi di Zipf e Heaps, e vengono esposti vari modelli sullo sviluppo del linguaggio. Nella seconda parte si giunge alla discussione di risultati più specifici sulla presenza di fenomeni di burstiness e di correlazioni a lungo raggio nei testi. Tutti questi studi teorici sono affiancati da analisi sperimentali, svolte utilizzando varie traduzioni del libro "Guerra e pace" di Leo Tolstoj e concentrate principalmente sulle eventuali differenze riscontrabili tra le diverse lingue.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

In numerosi campi scientici l'analisi di network complessi ha portato molte recenti scoperte: in questa tesi abbiamo sperimentato questo approccio sul linguaggio umano, in particolare quello scritto, dove le parole non interagiscono in modo casuale. Abbiamo quindi inizialmente presentato misure capaci di estrapolare importanti strutture topologiche dai newtork linguistici(Degree, Strength, Entropia, . . .) ed esaminato il software usato per rappresentare e visualizzare i grafi (Gephi). In seguito abbiamo analizzato le differenti proprietà statistiche di uno stesso testo in varie sue forme (shuffolato, senza stopwords e senza parole con bassa frequenza): il nostro database contiene cinque libri di cinque autori vissuti nel XIX secolo. Abbiamo infine mostrato come certe misure siano importanti per distinguere un testo reale dalle sue versioni modificate e perché la distribuzione del Degree di un testo normale e di uno shuffolato abbiano lo stesso andamento. Questi risultati potranno essere utili nella sempre più attiva analisi di fenomeni linguistici come l'autorship attribution e il riconoscimento di testi shuffolati.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Quando la probabilità di misurare un particolare valore di una certa quantità varia inversamente come potenza di tale valore, il quantitativo è detto come seguente una power-law, conosciuta anche come legge di Zipf o distribuzione di Pareto. Obiettivo di questa tesi sarà principalmente quello di verificare se il campione esteso di imprese segue la power-law (e se sì, in che limiti). A tale fine si configureranno i dati in un formato di rete monomodale, della quale si studieranno alcune macro-proprietà di struttura a livllo complessivo e con riferimento alle componenti (i singoli subnet distinti) di maggior dimensione. Successivamente si compiranno alcuni approfondimenti sulla struttura fine di alcuni subnet, essenzialmente rivolti ad evidenziare la potenza di unapproccio network-based, anche al fine di rivelare rilevanti proprietà nascoste del sistema economico soggiacente, sempre, ovviamente, nei limiti della modellizzazione adottata. In sintesi, ciò che questo lavoro intende ottenere è lo sviluppo di un approccio alternativo al trattamento dei big data a componente relazionale intrinseca (in questo caso le partecipazioni di capitale), verso la loro conversione in "big knowledge": da un insieme di dati cognitivamente inaccessibili, attraverso la strutturazione dell'informazione in modalità di rete, giungere ad una conoscenza sufficientemente chiara e giustificata.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

The large-crowned emergent tree Microberlinia bisulcata dominates rain forest groves at Korup National Park, Cameroon, along with two codominants, Tetraberlinia bifoliolata and T. korupensis. M. bisulcata has a pronounced modal size frequency distribution around 110 cm stem diameter: its recruitment potential is very poor. It is a long-lived light-demanding species, one of many found in African forests. Tetraberlinia species lack modality, are more shade tolerant, and recruit better. All three species are ectomycorrhizal. M. bisulcata dominates grove basal area, even though it has similar numbers of trees (≥50 cm stem diameter) as each of the other two species. This situation presented a conundrum that prompted a long-term study of grove dynamics. Enumerations of two plots (82.5 and 56.25 ha) between 1990 and 2010 showed mortality and recruitment of M. bisulcata to be very low (both rates 0.2% per year) compared with Tetraberlinia (2.4% and 0.8% per year), and M. bisulcata grows twice as fast as the Tetraberlinia. Ordinations indicated that these three species determined community structure by their strong negative associations while other species showed almost none. Ranked species abundance curves fitted the Zipf-Mandelbrot model well and allowed “overdominance” of M. bisulcata to be estimated. Spatial analysis indicated strong repulsion by clusters of large (50 to <100 cm) and very large (≥100 cm) M. bisulcata of their own medium-sized (10 to <50 cm) trees and all sizes of Tetraberlinia. This was interpreted as competition by M. bisulcata increasing its dominance, but also inhibition of its own replacement potential. Stem coring showed a modal age of 200 years for M. bisulcata, but with large size variation (50–150 cm). Fifty-year model projections suggested little change in medium, decreases in large, and increases in very large trees of M. bisulcata, accompanied by overall decreases in medium and large trees of Tetraberlinia species. Realistically increasing very-large-tree mortality led to grove collapse without short-term replacement. M. bisulcata most likely depends on climatic events to rebuild its stands: the ratio of disturbance interval to median species' longevity is important. A new theory of transient dominance explains how M. bisulcata may be cycling in abundance over time and displaying nonequilibrium dynamics.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Se analiza un conjunto representativo, no exhaustivo, de temas básicos de la tecnología de la información estrechamente ligados al problema bibliotecológico, en los que es necesario alguna capacidad de aplicación de la matemática a la resolución de problemas documentales, con el objetivo de mostrar que, con sólo una pequeña parte de los temas incluidos en los programas de matemática de la escuela media, varios de ellos en las etapas iniciales, basta para comprender la literatura y aplicar técnicas y métodos basados en trabajos fundacionales de la era pre-computacional, como los de Lotka, Zipf, Bradford y Price, y sus correlatos en la era computacional, como son los de Cleverdon, La ncaster, Brookes y otros. Se enumera el conjunto de temas matemáticos citados y su vinculación con la bibliotecología a partir de su presencia en los trabajos fundacionales, se discute el grado de profundidad y formalización necesario para adquirir las capacidades de aplicación citadas más arriba, se los ubica en los paquetes de software más difundidos y se analizan las posibles dificultades y soluciones, todo ello en el marco de las estrategias propuestas por L. Santaló. Finalmente se mencionan algunas experiencias en nuestro país e Iberoamérica, sólo como certificación de factibilidad en nuestro medio

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Se analiza un conjunto representativo, no exhaustivo, de temas básicos de la tecnología de la información estrechamente ligados al problema bibliotecológico, en los que es necesario alguna capacidad de aplicación de la matemática a la resolución de problemas documentales, con el objetivo de mostrar que, con sólo una pequeña parte de los temas incluidos en los programas de matemática de la escuela media, varios de ellos en las etapas iniciales, basta para comprender la literatura y aplicar técnicas y métodos basados en trabajos fundacionales de la era pre-computacional, como los de Lotka, Zipf, Bradford y Price, y sus correlatos en la era computacional, como son los de Cleverdon, La ncaster, Brookes y otros. Se enumera el conjunto de temas matemáticos citados y su vinculación con la bibliotecología a partir de su presencia en los trabajos fundacionales, se discute el grado de profundidad y formalización necesario para adquirir las capacidades de aplicación citadas más arriba, se los ubica en los paquetes de software más difundidos y se analizan las posibles dificultades y soluciones, todo ello en el marco de las estrategias propuestas por L. Santaló. Finalmente se mencionan algunas experiencias en nuestro país e Iberoamérica, sólo como certificación de factibilidad en nuestro medio

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Se analiza un conjunto representativo, no exhaustivo, de temas básicos de la tecnología de la información estrechamente ligados al problema bibliotecológico, en los que es necesario alguna capacidad de aplicación de la matemática a la resolución de problemas documentales, con el objetivo de mostrar que, con sólo una pequeña parte de los temas incluidos en los programas de matemática de la escuela media, varios de ellos en las etapas iniciales, basta para comprender la literatura y aplicar técnicas y métodos basados en trabajos fundacionales de la era pre-computacional, como los de Lotka, Zipf, Bradford y Price, y sus correlatos en la era computacional, como son los de Cleverdon, La ncaster, Brookes y otros. Se enumera el conjunto de temas matemáticos citados y su vinculación con la bibliotecología a partir de su presencia en los trabajos fundacionales, se discute el grado de profundidad y formalización necesario para adquirir las capacidades de aplicación citadas más arriba, se los ubica en los paquetes de software más difundidos y se analizan las posibles dificultades y soluciones, todo ello en el marco de las estrategias propuestas por L. Santaló. Finalmente se mencionan algunas experiencias en nuestro país e Iberoamérica, sólo como certificación de factibilidad en nuestro medio

Relevância:

10.00% 10.00%

Publicador:

Resumo:

This paper presents empirical evidence on the size distribution of all Cambodian establishments in the nonfarm sector for 2009. Small- and large-scale establishments account for the largest share of employment, pointing to a “missing middle” that is commonly observed in developing countries. The analysis provides little evidence for Zipf’s law because Cambodian industry is characterized by a more dense mass of small establishments than the Zipf distribution would predict.