10 resultados para Modelos Estatísticos
em Repositório Institucional da Universidade de Aveiro - Portugal
Resumo:
Os Modelos de Equações Simultâneas (SEM) são modelos estatísticos com muita tradição em estudos de Econometria, uma vez que permitem representar e estudar uma vasta gama de processos económicos. Os estimadores mais usados em SEM resultam da aplicação do Método dos Mínimos Quadrados ou do Método da Máxima Verosimilhança, os quais não são robustos. Em Maronna e Yohai (1997), os autores propõem formas de “robustificar” esses estimadores. Um outro método de estimação com interesse nestes modelos é o Método dos Momentos Generalizado (GMM), o qual também conduz a estimadores não robustos. Estimadores que sofrem de falta de robustez são muito inconvenientes uma vez que podem conduzir a resultados enganadores quando são violadas as hipóteses subjacentes ao modelo assumido. Os estimadores robustos são de grande valor, em particular quando os modelos em estudo são complexos, como é o caso dos SEM. O principal objectivo desta investigação foi o de procurar tais estimadores tendo-se construído um estimador robusto a que se deu o nome de GMMOGK. Trata-se de uma versão robusta do estimador GMM. Para avaliar o desempenho do novo estimador foi feito um adequado estudo de simulação e foi também feita a aplicação do estimador a um conjunto de dados reais. O estimador robusto tem um bom desempenho nos modelos heterocedásticos considerados e, nessas condições, comporta-se melhor do que os estimadores não robustos usados no estudo. Contudo, quando a análise é feita em cada equação separadamente, a especificidade de cada equação individual e a estrutura de dependência do sistema são dois aspectos que influenciam o desempenho do estimador, tal como acontece com os estimadores usuais. Para enquadrar a investigação, o texto inclui uma revisão de aspectos essenciais dos SEM, o seu papel em Econometria, os principais métodos de estimação, com particular ênfase no GMM, e uma curta introdução à estimação robusta.
Resumo:
The work reported in this thesis aimed at applying the methodology known as metabonomics to the detailed study of a particular type of beer and its quality control, with basis on the use of multivariate analysis (MVA) to extract meaningful information from given analytical data sets. In Chapter 1, a detailed description of beer is given considering the brewing process, main characteristics and typical composition of beer, beer stability and the commonly used analytical techniques for beer analysis. The fundamentals of the analytical methods employed here, namely nuclear magnetic resonance (NMR) spectroscopy, gas-chromatography-mass spectrometry (GC-MS) and mid-infrared (MIR) spectroscopy, together with the description of the metabonomics methodology are described shortly in Chapter 2. In Chapter 3, the application of high resolution NMR to characterize the chemical composition of a lager beer is described. The 1H NMR spectrum obtained by direct analysis of beer show a high degree of complexity, confirming the great potential of NMR spectroscopy for the detection of a wide variety of families of compounds, in a single run. Spectral assignment was carried out by 2D NMR, resulting in the identification of about 40 compounds, including alcohols, amino acids, organic acids, nucleosides and sugars. In a second part of Chapter 3, the compositional variability of beer was assessed. For that purpose, metabonomics was applied to 1H NMR data (NMR/MVA) to evaluate beer variability between beers from the same brand (lager), produced nationally but differing in brewing site and date of production. Differences between brewing sites and/or dates were observed, reflecting compositional differences related to particular processing steps, including mashing, fermentation and maturation. Chapter 4 describes the quantification of organic acids in beer by NMR, using different quantitative methods: direct integration of NMR signals (vs. internal reference or vs. an external electronic reference, ERETIC method) and by quantitative statistical methods (using the partial least squares (PLS) regression) were developed and compared. PLS1 regression models were built using different quantitative methods as reference: capillary electrophoresis with direct and indirect detection and enzymatic essays. It was found that NMR integration results generally agree with those obtained by the best performance PLS models, although some overestimation for malic and pyruvic acids and an apparent underestimation for citric acid were observed. Finally, Chapter 5 describes metabonomic studies performed to better understand the forced aging (18 days, at 45 ºC) beer process. The aging process of lager beer was followed by i) NMR, ii) GC-MS, and iii) MIR spectroscopy. MVA methods of each analytical data set revealed clear separation between different aging days for both NMR and GC-MS data, enabling the identification of compounds closely related with the aging process: 5-hydroxymethylfurfural (5-HMF), organic acids, γ-amino butyric acid (GABA), proline and the ratio linear/branched dextrins (NMR domain) and 5-HMF, furfural, diethyl succinate and phenylacetaldehyde (known aging markers) and, for the first time, 2,3-dihydro-3,5-dihydroxy-6-methyl-4(H)-pyran-4-one xii (DDMP) and maltoxazine (by GC-MS domain). For MIR/MVA, no aging trend could be measured, the results reflecting the need of further experimental optimizations. Data correlation between NMR and GC-MS data was performed by outer product analysis (OPA) and statistical heterospectroscopy (SHY) methodologies, enabling the identification of further compounds (11 compounds, 5 of each are still unassigned) highly related with the aging process. Data correlation between sensory characteristics and NMR and GC-MS was also assessed through PLS1 regression models using the sensory response as reference. The results obtained showed good relationships between analytical data response and sensory response, particularly for the aromatic region of the NMR spectra and for GC-MS data (r > 0.89). However, the prediction power of all built PLS1 regression models was relatively low, possibly reflecting the low number of samples/tasters employed, an aspect to improve in future studies.
Resumo:
O cancro da mama feminino pela sua magnitude merece uma especial atenção ao nível das políticas de saúde. Emerge, pois uma visão abrangente que, por um lado, deve atentar para o encargo que esta representa para qualquer sistema de saúde, pelos custos que acarreta, como também, para a qualidade de vida das mulheres portadoras da mesma. Desta forma, a Liga Portuguesa Contra o Cancro (LPCC) tem desenvolvido, em colaboração com as Administrações Regionais de Saúde (ARS), o Programa de Rastreio do Cancro da Mama (PRCM), o qual apresenta, no Concelho de Aveiro, taxas de adesão na ordem dos 50%, ainda distantes dos 70%, objetivo recomendado pelas guidelines da Comissão Europeia. A não adesão tem sido considerada como um dos principais problemas do sistema de saúde, tanto pelas repercussões ao nível de ganhos em saúde, como também na qualidade de vida e na satisfação dos pacientes com os cuidados de saúde, constituindo-se como um fenómeno multifatorial e multidimensional. É neste sentido que o presente trabalho se propõe identificar os fatores, de cariz individual e do meio envolvente, determinantes da adesão ao PRCM, numa amostra de mulheres residentes no Concelho de Aveiro, com idades compreendidas entre os 45 e os 69 anos e, a partir dos resultados emergentes, propor estratégias de educação em saúde. Como procedimentos metodológicos e, numa primeira fase, entre outubro 2009 e maio 2010 foi aplicado um survey, o qual foi complementado com notas de campo dos entrevistadores a uma amostra não aleatória de 805 mulheres, em dois contextos distintos: no centro de saúde às aderentes à mamografia e, no domicílio, às não aderentes. Numa segunda fase, realizamos duas sessões de Focus Group (FG), num total de 12 elementos, um grupo heterogéneo com enfermeiros, médicos e utentes, e um outro grupo homogéneo, apenas com profissionais de saúde. O tratamento dos dados do survey foi efetuado através de procedimentos estatísticos, com utilização do SPSS® versão 17 e realizadas análises bivariadas (qui-quadrado) e multivariadas (discriminação de função e árvore de decisão através do algoritmo Chi-squared Automatic Interaction Detector) com o intuito de determinar as diferenças entre os grupos e predizer as variáveis exógenas. No que diz respeito a indicadores sociodemográficos, os resultados mostram que aderem mais, as mulheres com idades <50 anos e ≥ 56 anos, as que vivem em localidades urbanas, as trabalhadoras não qualificadas e as reformadas. As que aderem menos ao PRCM têm idades compreendidas entre os 50-55 anos, vivem nas zonas periurbanas, são licenciadas, apresentam categoria profissional superior ou estão desempregadas. Em relação às restantes variáveis exógenas, aderem ao PRCM, as mulheres que apresentam um Bom Perfil de Conhecimentos (46.6%), enquanto as não aderentes apresentam um Fraco Perfil de Conhecimentos (50.6%), sendo esta relação estatisticamente significativa (X2= 10.260; p=0.006).Cerca de 59% das mulheres aderentes realiza o seu rastreio de forma concordante com as orientações programáticas presentes no PRCM, comparativamente com 41.1% das mulheres que não o faz, verificando-se uma relação de dependência bastante significativa entre as variáveis Perfil de Comportamentos e adesão(X2= 348.193; p=0.000). Apesar de não existir dependência estatisticamente significativa entre as Motivações e a adesão ao PRCM (X2= 0.199; p=0.656), se analisarmos particularmente, os motivos de adesão, algumas inquiridas demonstram preocupação, tanto na deteção precoce da doença, como na hereditariedade. Por outro lado, os motivos de não adesão, também denotam aspetos de nível pessoal como o desleixo com a saúde, o desconhecimento e o esquecimento da marcação. As mulheres que revelam Boa Acessibilidade aos Cuidados de Saúde Primários e um Bom Atendimento dos Prestadores de Cuidados aderem mais ao PRCM, comparativamente com as inquiridas que relatam Fraca Acessibilidade e Atendimento, não aderindo. A partir dos resultados da análise multivariada podemos inferir que as variáveis exógenas estudadas possuem um poder discriminante significativo, sendo que, o Perfil de Comportamentos é a variável que apresenta maior grau de diferenciação entre os grupos das aderentes e não aderentes. Como variáveis explicativas resultantes da árvore de decisão CHAID, permaneceram, o Perfil de Comportamentos (concordantes e não concordantes com as guidelines), os grupos etários (<50 anos, 50-55anos e ≥56anos) e o Atendimento dos prestadores de cuidados de saúde. As mulheres mais novas (<50 anos) com Perfil de comportamentos «concordantes» com as guidelines são as que aderem mais, comparativamente com os outros grupos etários. Por outro lado, as não aderentes necessitam de um «bom» atendimento dos prestadores de cuidados para se tornarem aderentes ao PRCM. Tanto as notas de campo, como a discussão dos FG foram sujeitas a análise de conteúdo segundo as categorias em estudo obtidas na primeira fase e os relatos mostram a importância de fatores de ordem individual e do meio envolvente. No que se refere a aspetos psicossociais, destaca-se a importância das crenças e como fatores ambientais menos facilitadores para a adesão apontam a falta de transportes, a falta de tempo das pessoas e a oferta de recursos, principalmente se existirem radiologistas privados como alternativa ao PRCM. Tal como na primeira fase do estudo, uma das motivações para a adesão é a recomendação dos profissionais de saúde para o PRCM, bem como a marcação de consultas pela enfermeira, que pode ser uma oportunidade de contacto para a sensibilização. Os hábitos de vigilância de saúde, a perceção positiva acerca dos programas de saúde no geral, o acesso à informação pertinente sobre o PRCM e a operacionalização deste no terreno parecem ser fatores determinantes segundo a opinião dos elementos dos FG. O tipo e a regularidade no atendimento por parte dos profissionais de saúde, a relação entre profissional de saúde/paciente, a personalização das intervenções educativas, a divulgação que estes fazem do PRCM junto das suas pacientes, bem como, a organização do modelos de cuidados de saúde das unidades de saúde e a forma como os profissionais se envolvem e tomam a responsabilização por um programa desta natureza são fatores condicionantes da adesão. Se atendermos aos resultados deste estudo, verificamos um envolvimento de fatores que integram múltiplos níveis de intervenção, sendo um desafio para as equipas de saúde que pretendam intervir no âmbito do programa de rastreio do cancro da mama. Com efeito, os resultados também apontam para a combinação de múltiplas estratégias que são transversais a vários programas de promoção da saúde, assumindo, desta forma, uma perspetiva multidimensional e dinâmica que visa, essencialmente, a construção social da saúde e do bem-estar (i.e. responsabilização do cidadão pela sua própria saúde e o seu empowerment).
Resumo:
No contexto econômico competitivo e globalizado no qual as corporações estão inseridas, emerge a necessidade de evolução constante para acompanhar as mudanças que o ambiente lhes impõe, visando a sustentabilidade e a perpetuidade. A evolução econômica e financeira das corporações pode promover o desenvolvimento de uma nação, mesmo que o aumento da concorrência no mercado obrigue-as a investirem em novas relações com o seu universo, buscando melhorar os seus níveis de desempenho mensurados por meio de novos instrumentos economicos e financeiros. Desta forma, o grau de investimento corporativo passa a ser relevante, pois pode gerar confiança em novos investimentos, sendo visto como sinônimo de economia forte. No concernente ao objetivo, esta tese teve como escopo o desenvolvimento de um indicador econômico e financeiro visando balizar o grau de credibilidade rating que as corporações apresentam em sua estrutura corporativa, por meio de um conjunto de índices econômicos e financeiros ligados à liquidez, à lucratividade, ao endividamento e à rentabilidade, provindos das demonstrações econômicas e financeiras das corporações estudadas. Este estudo caracteriza-se no contexto da tipologia aplicada, de objetivo descritivo com delineamento bibliográfico, na amplitude da problemática, caracteriza-se como quantitativo, compreendendo a população de 70 corporações brasileiras reconhecidas pelas certificadoras internacionais, Standard & Poor's, Moody's e Fitch Ratings, as quais detinham o grau de investimento corporativo no ano de 2008. Quanto aos métodos e procedimentos estatísticos, primeiramente utilizou-se a análise descritiva com vistas ao resumo dos dados, posteriormente foi feita a análise de correlação por meio do Coeficiente de Correlação Linear de Pearson, aplicando-se em seguida a análise de regressão. Em seguida para a confecção do modelo utilizou-se a análise fatorial e para testificar sua confiabilidade o Alfa de Cronbach, utilizou-se também a análise discriminante, para classificação dos quartis. As conclusões do estudo baseiamse nos resultados apresentados pela evolução do tratamento estatístico, que inicialmente apresentam uma correlação predominantemente fraca, no entanto isto não invalida a correlação de Pearson, pois todos os coeficientes apresentaram uma significância de (p<0,05). Na aplicação da análise de regressão, todos os modelos apresentaram resultados satisfatórios sendo perceptível a existência de uma forte correlação. A confiabilidade do modelo de grau de investimento corporativo provindo da análise fatorial foi testificada pelo coeficiente do Alpha de Cronbach, que apresentou valor de 0,768, o que indica consistência interna satisfatória ao estudo. O grau de investimento na base longitudinal de 2008 a 2010 apresenta variabilidade de 95,72% a 98,33% de acertividade. Portanto, conclui-se que o indicador criado por este estudo, possui condições de ser utilizado como base de definição do grau de investimento de corporações empresariais.
Resumo:
A modelação e análise de séries temporais de valores inteiros têm sido alvo de grande investigação e desenvolvimento nos últimos anos, com aplicações várias em diversas áreas da ciência. Nesta tese a atenção centrar-se-á no estudo na classe de modelos basedos no operador thinning binomial. Tendo como base o operador thinning binomial, esta tese focou-se na construção e estudo de modelos SETINAR(2; p(1); p(2)) e PSETINAR(2; 1; 1)T , modelos autorregressivos de valores inteiros com limiares autoinduzidos e dois regimes, admitindo que as inovações formam uma sucessão de variáveis independentes com distribuição de Poisson. Relativamente ao primeiro modelo analisado, o modelo SETINAR(2; p(1); p(2)), além do estudo das suas propriedades probabilísticas e de métodos, clássicos e bayesianos, para estimar os parâmetros, analisou-se a questão da seleção das ordens, no caso de elas serem desconhecidas. Com este objetivo consideraram-se algoritmos de Monte Carlo via cadeias de Markov, em particular o algoritmo Reversible Jump, abordando-se também o problema da seleção de modelos, usando metodologias clássica e bayesiana. Complementou-se a análise através de um estudo de simulação e uma aplicação a dois conjuntos de dados reais. O modelo PSETINAR(2; 1; 1)T proposto, é também um modelo autorregressivo com limiares autoinduzidos e dois regimes, de ordem unitária em cada um deles, mas apresentando uma estrutura periódica. Estudaram-se as suas propriedades probabilísticas, analisaram-se os problemas de inferência e predição de futuras observações e realizaram-se estudos de simulação.
Resumo:
Chapter 1 introduces the scope of the work by identifying the clinically relevant prenatal disorders and presently available diagnostic methods. The methodology followed in this work is presented, along with a brief account of the principles of the analytical and statistical tools employed. A thorough description of the state of the art of metabolomics in prenatal research concludes the chapter, highlighting the merit of this novel strategy to identify robust disease biomarkers. The scarce use of maternal and newborn urine in previous reports enlightens the relevance of this work. Chapter 2 presents a description of all the experimental details involved in the work performed, comprising sampling, sample collection and preparation issues, data acquisition protocols and data analysis procedures. The proton Nuclear Magnetic Resonance (NMR) characterization of maternal urine composition in healthy pregnancies is presented in Chapter 3. The urinary metabolic profile characteristic of each pregnancy trimester was defined and a 21-metabolite signature found descriptive of the metabolic adaptations occurring throughout pregnancy. 8 metabolites were found, for the first time to our knowledge, to vary in connection to pregnancy, while known metabolic effects were confirmed. This chapter includes a study of the effects of non-fasting (used in this work) as a possible confounder. Chapter 4 describes the metabolomic study of 2nd trimester maternal urine for the diagnosis of fetal disorders and prediction of later-developing complications. This was achieved by applying a novel variable selection method developed in the context of this work. It was found that fetal malformations (FM) (and, specifically those of the central nervous system, CNS) and chromosomal disorders (CD) (and, specifically, trisomy 21, T21) are accompanied by changes in energy, amino acids, lipids and nucleotides metabolic pathways, with CD causing a further deregulation in sugars metabolism, urea cycle and/or creatinine biosynthesis. Multivariate analysis models´ validation revealed classification rates (CR) of 84% for FM (87%, CNS) and 85% for CD (94%, T21). For later-diagnosed preterm delivery (PTD), preeclampsia (PE) and intrauterine growth restriction (IUGR), it is found that urinary NMR profiles have early predictive value, with CRs ranging from 84% for PTD (11-20 gestational weeks, g.w., prior to diagnosis), 94% for PE (18-24 g.w. pre-diagnosis) and 94% for IUGR (2-22 g.w. pre-diagnosis). This chapter includes results obtained for an ultraperformance liquid chromatography-mass spectrometry (UPLC-MS) study of pre-PTD samples and correlation with NMR data. One possible marker was detected, although its identification was not possible. Chapter 5 relates to the NMR metabolomic study of gestational diabetes mellitus (GDM), establishing a potentially predictive urinary metabolic profile for GDM, 2-21 g.w. prior to diagnosis (CR 83%). Furthermore, the NMR spectrum was shown to carry information on individual phenotypes, able to predict future insulin treatment requirement (CR 94%). Chapter 6 describes results that demonstrate the impact of delivery mode (CR 88%) and gender (CR 76%) on newborn urinary profile. It was also found that newborn prematurity, respiratory depression, large for gestational age growth and malformations induce relevant metabolic perturbations (CR 82-92%), as well as maternal conditions, namely GDM (CR 82%) and maternal psychiatric disorders (CR 91%). Finally, the main conclusions of this thesis are presented in Chapter 7, highlighting the value of maternal or newborn urine metabolomics for pregnancy monitoring and disease prediction, towards the development of new early and non-invasive diagnostic methods.
Resumo:
The main objective of this work was to monitor a set of physical-chemical properties of heavy oil procedural streams through nuclear magnetic resonance spectroscopy, in order to propose an analysis procedure and online data processing for process control. Different statistical methods which allow to relate the results obtained by nuclear magnetic resonance spectroscopy with the results obtained by the conventional standard methods during the characterization of the different streams, have been implemented in order to develop models for predicting these same properties. The real-time knowledge of these physical-chemical properties of petroleum fractions is very important for enhancing refinery operations, ensuring technically, economically and environmentally proper refinery operations. The first part of this work involved the determination of many physical-chemical properties, at Matosinhos refinery, by following some standard methods important to evaluate and characterize light vacuum gas oil, heavy vacuum gas oil and fuel oil fractions. Kinematic viscosity, density, sulfur content, flash point, carbon residue, P-value and atmospheric and vacuum distillations were the properties analysed. Besides the analysis by using the standard methods, the same samples were analysed by nuclear magnetic resonance spectroscopy. The second part of this work was related to the application of multivariate statistical methods, which correlate the physical-chemical properties with the quantitative information acquired by nuclear magnetic resonance spectroscopy. Several methods were applied, including principal component analysis, principal component regression, partial least squares and artificial neural networks. Principal component analysis was used to reduce the number of predictive variables and to transform them into new variables, the principal components. These principal components were used as inputs of the principal component regression and artificial neural networks models. For the partial least squares model, the original data was used as input. Taking into account the performance of the develop models, by analysing selected statistical performance indexes, it was possible to conclude that principal component regression lead to worse performances. When applying the partial least squares and artificial neural networks models better results were achieved. However, it was with the artificial neural networks model that better predictions were obtained for almost of the properties analysed. With reference to the results obtained, it was possible to conclude that nuclear magnetic resonance spectroscopy combined with multivariate statistical methods can be used to predict physical-chemical properties of petroleum fractions. It has been shown that this technique can be considered a potential alternative to the conventional standard methods having obtained very promising results.
Resumo:
O presente trabalho propõe-se a conceptualizar os modelos e a criar novas ferramentas para a espacialização da música electroacústica, bem como a explorar formas de integração deste parâmetro na composição musical. É proposta uma taxonomia da espacialização na música electroacústica, com base no levantamento de fontes realizado. O conjunto de aplicações informáticas concebido utiliza o conhecimento actual sobre a audição espacial, implementa duas propostas de desenvolvimento sobre as técnicas de espacialização e incorpora os modelos de espacialização conceptualizados. Por fim, as obras musicais compostas propõem e exploram formas para a utilização da espacialização enquanto elemento gerador do material musical na composição de música electroacústica.
Resumo:
This thesis reports the application of metabolomics to human tissues and biofluids (blood plasma and urine) to unveil the metabolic signature of primary lung cancer. In Chapter 1, a brief introduction on lung cancer epidemiology and pathogenesis, together with a review of the main metabolic dysregulations known to be associated with cancer, is presented. The metabolomics approach is also described, addressing the analytical and statistical methods employed, as well as the current state of the art on its application to clinical lung cancer studies. Chapter 2 provides the experimental details of this work, in regard to the subjects enrolled, sample collection and analysis, and data processing. In Chapter 3, the metabolic characterization of intact lung tissues (from 56 patients) by proton High Resolution Magic Angle Spinning (HRMAS) Nuclear Magnetic Resonance (NMR) spectroscopy is described. After careful assessment of acquisition conditions and thorough spectral assignment (over 50 metabolites identified), the metabolic profiles of tumour and adjacent control tissues were compared through multivariate analysis. The two tissue classes could be discriminated with 97% accuracy, with 13 metabolites significantly accounting for this discrimination: glucose and acetate (depleted in tumours), together with lactate, alanine, glutamate, GSH, taurine, creatine, phosphocholine, glycerophosphocholine, phosphoethanolamine, uracil nucleotides and peptides (increased in tumours). Some of these variations corroborated typical features of cancer metabolism (e.g., upregulated glycolysis and glutaminolysis), while others suggested less known pathways (e.g., antioxidant protection, protein degradation) to play important roles. Another major and novel finding described in this chapter was the dependence of this metabolic signature on tumour histological subtype. While main alterations in adenocarcinomas (AdC) related to phospholipid and protein metabolisms, squamous cell carcinomas (SqCC) were found to have stronger glycolytic and glutaminolytic profiles, making it possible to build a valid classification model to discriminate these two subtypes. Chapter 4 reports the NMR metabolomic study of blood plasma from over 100 patients and near 100 healthy controls, the multivariate model built having afforded a classification rate of 87%. The two groups were found to differ significantly in the levels of lactate, pyruvate, acetoacetate, LDL+VLDL lipoproteins and glycoproteins (increased in patients), together with glutamine, histidine, valine, methanol, HDL lipoproteins and two unassigned compounds (decreased in patients). Interestingly, these variations were detected from initial disease stages and the magnitude of some of them depended on the histological type, although not allowing AdC vs. SqCC discrimination. Moreover, it is shown in this chapter that age mismatch between control and cancer groups could not be ruled out as a possible confounding factor, and exploratory external validation afforded a classification rate of 85%. The NMR profiling of urine from lung cancer patients and healthy controls is presented in Chapter 5. Compared to plasma, the classification model built with urinary profiles resulted in a superior classification rate (97%). After careful assessment of possible bias from gender, age and smoking habits, a set of 19 metabolites was proposed to be cancer-related (out of which 3 were unknowns and 6 were partially identified as N-acetylated metabolites). As for plasma, these variations were detected regardless of disease stage and showed some dependency on histological subtype, the AdC vs. SqCC model built showing modest predictive power. In addition, preliminary external validation of the urine-based classification model afforded 100% sensitivity and 90% specificity, which are exciting results in terms of potential for future clinical application. Chapter 6 describes the analysis of urine from a subset of patients by a different profiling technique, namely, Ultra-Performance Liquid Chromatography coupled to Mass Spectrometry (UPLC-MS). Although the identification of discriminant metabolites was very limited, multivariate models showed high classification rate and predictive power, thus reinforcing the value of urine in the context of lung cancer diagnosis. Finally, the main conclusions of this thesis are presented in Chapter 7, highlighting the potential of integrated metabolomics of tissues and biofluids to improve current understanding of lung cancer altered metabolism and to reveal new marker profiles with diagnostic value.
Resumo:
Urban soil quality may be severely affected by hydrophobic organic contaminants (HOCs), impairing environmental quality and human health. A comprehensive study was conducted in two contrasting Portuguese urban areas (Lisbon and Viseu) in order to assess the levels and potential risks of these contaminants, to identify sources and study their behaviour in soils. The concentrations of HOCs were related to the size of the city, with much higher contamination levels observed in Lisbon urban area. Source apportionment was performed by studying the HOCs profiles, their relationship with potentially toxic elements and general characteristics of soil using multivariate statistical methods. Lisbon seems to be affected by nearby sources (traffic, industry and incineration processes) whereas in Viseu the atmospheric transport may be playing an important role. In a first tier of risk assessment (RA) it was possible to identify polycyclic aromatic hydrocarbons (PAHs) in Lisbon soils as a potential hazard. The levels of PAHs in street dusts were further studied and allowed to clarify that traffic, tire and pavement debris can be an important source of PAHs to urban soils. Street dusts were also identified as being a potential concern regarding human and environmental health, especially if reaching the nearby aquatic bodies. Geostatistical tools were also used and their usefulness in a RA analysis and urban planning was discussed. In order to obtain a more realistic assessment of risks of HOCs to environment and human health it is important to evaluate their available fraction, which is also the most accessible for organisms. Therefore, a review of the processes involved on the availability of PAHs was performed and the outputs produced by the different chemical methods were evaluated. The suitability of chemical methods to predict bioavailability of PAHs in dissimilar naturally contaminated soils has not been demonstrated, being especially difficult for high molecular weight compounds. No clear relationship between chemical and biological availability was found in this work. Yet, in spite of the very high total concentrations found in some Lisbon soils, both the water soluble fraction and the body residues resulting from bioaccumulation assays were generally very low, which may be due to aging phenomena. It was observed that the percentage of soluble fraction of PAHs in soils was found to be different among compounds and mostly regulated by soil properties. Regarding bioaccumulation assays, although no significant relationship was found between soil properties and bioavailability, it was verified that biota-to-soil bioaccumulation factors were sample dependent rather than compound dependent. In conclusion, once the compounds of potential concern are targeted, then performing a chemical screening as a first tier can be a simple and effective approach to start a RA. However, reliable data is still required to improve the existing models for risk characterization.