961 resultados para Seleção de Atributos
Resumo:
Classifier ensembles are systems composed of a set of individual classifiers and a combination module, which is responsible for providing the final output of the system. In the design of these systems, diversity is considered as one of the main aspects to be taken into account since there is no gain in combining identical classification methods. The ideal situation is a set of individual classifiers with uncorrelated errors. In other words, the individual classifiers should be diverse among themselves. One way of increasing diversity is to provide different datasets (patterns and/or attributes) for the individual classifiers. The diversity is increased because the individual classifiers will perform the same task (classification of the same input patterns) but they will be built using different subsets of patterns and/or attributes. The majority of the papers using feature selection for ensembles address the homogenous structures of ensemble, i.e., ensembles composed only of the same type of classifiers. In this investigation, two approaches of genetic algorithms (single and multi-objective) will be used to guide the distribution of the features among the classifiers in the context of homogenous and heterogeneous ensembles. The experiments will be divided into two phases that use a filter approach of feature selection guided by genetic algorithm
Resumo:
Pós-graduação em Engenharia Elétrica - FEIS
Resumo:
Traditional applications of feature selection in areas such as data mining, machine learning and pattern recognition aim to improve the accuracy and to reduce the computational cost of the model. It is done through the removal of redundant, irrelevant or noisy data, finding a representative subset of data that reduces its dimensionality without loss of performance. With the development of research in ensemble of classifiers and the verification that this type of model has better performance than the individual models, if the base classifiers are diverse, comes a new field of application to the research of feature selection. In this new field, it is desired to find diverse subsets of features for the construction of base classifiers for the ensemble systems. This work proposes an approach that maximizes the diversity of the ensembles by selecting subsets of features using a model independent of the learning algorithm and with low computational cost. This is done using bio-inspired metaheuristics with evaluation filter-based criteria
Resumo:
The objective of the researches in artificial intelligence is to qualify the computer to execute functions that are performed by humans using knowledge and reasoning. This work was developed in the area of machine learning, that it s the study branch of artificial intelligence, being related to the project and development of algorithms and techniques capable to allow the computational learning. The objective of this work is analyzing a feature selection method for ensemble systems. The proposed method is inserted into the filter approach of feature selection method, it s using the variance and Spearman correlation to rank the feature and using the reward and punishment strategies to measure the feature importance for the identification of the classes. For each ensemble, several different configuration were used, which varied from hybrid (homogeneous) to non-hybrid (heterogeneous) structures of ensemble. They were submitted to five combining methods (voting, sum, sum weight, multiLayer Perceptron and naïve Bayes) which were applied in six distinct database (real and artificial). The classifiers applied during the experiments were k- nearest neighbor, multiLayer Perceptron, naïve Bayes and decision tree. Finally, the performance of ensemble was analyzed comparatively, using none feature selection method, using a filter approach (original) feature selection method and the proposed method. To do this comparison, a statistical test was applied, which demonstrate that there was a significant improvement in the precision of the ensembles
Resumo:
Data Mining surge, hoje em dia, como uma ferramenta importante e crucial para o sucesso de um negócio. O considerável volume de dados que atualmente se encontra disponível, por si só, não traz valor acrescentado. No entanto, as ferramentas de Data Mining, capazes de transformar dados e mais dados em conhecimento, vêm colmatar esta lacuna, constituindo, assim, um trunfo que ninguém quer perder. O presente trabalho foca-se na utilização das técnicas de Data Mining no âmbito da atividade bancária, mais concretamente na sua atividade de telemarketing. Neste trabalho são aplicados catorze algoritmos a uma base de dados proveniente do call center de um banco português, resultante de uma campanha para a angariação de clientes para depósitos a prazo com taxas de juro favoráveis. Os catorze algoritmos aplicados no caso prático deste projeto podem ser agrupados em sete grupos: Árvores de Decisão, Redes Neuronais, Support Vector Machine, Voted Perceptron, métodos Ensemble, aprendizagem Bayesiana e Regressões. De forma a beneficiar, ainda mais, do que a área de Data Mining tem para oferecer, este trabalho incide ainda sobre o redimensionamento da base de dados em questão, através da aplicação de duas estratégias de seleção de atributos: Best First e Genetic Search. Um dos objetivos deste trabalho prende-se com a comparação dos resultados obtidos com os resultados presentes no estudo dos autores Sérgio Moro, Raul Laureano e Paulo Cortez (Sérgio Moro, Laureano, & Cortez, 2011). Adicionalmente, pretende-se identificar as variáveis mais relevantes aquando da identificação do potencial cliente deste produto financeiro. Como principais conclusões, depreende-se que os resultados obtidos são comparáveis com os resultados publicados pelos autores mencionados, sendo os mesmos de qualidade e consistentes. O algoritmo Bagging é o que apresenta melhores resultados e a variável referente à duração da chamada telefónica é a que mais influencia o sucesso de campanhas similares.
Resumo:
Esta tese apresenta contribuições ao processo de Descoberta de Conhecimento em Bases de Dados (DCBD). DCBD pode ser entendido como um conjunto de técnicas automatizadas – ou semi-automatizadas – otimizadas para extrair conhecimento a partir de grandes bases de dados. Assim, o já, de longa data, praticado processo de descoberta de conhecimento passa a contar com aprimoramentos que o tornam mais fácil de ser realizado. A partir dessa visão, bem conhecidos algoritmos de Estatística e de Aprendizado de Máquina passam a funcionar com desempenho aceitável sobre bases de dados cada vez maiores. Da mesma forma, tarefas como coleta, limpeza e transformação de dados e seleção de atributos, parâmetros e modelos recebem um suporte que facilita cada vez mais a sua execução. A contribuição principal desta tese consiste na aplicação dessa visão para a otimização da descoberta de conhecimento a partir de dados não-classificados. Adicionalmente, são apresentadas algumas contribuições sobre o Modelo Neural Combinatório (MNC), um sistema híbrido neurossimbólico para classificação que elegemos como foco de trabalho. Quanto à principal contribuição, percebeu-se que a descoberta de conhecimento a partir de dados não-classificados, em geral, é dividida em dois subprocessos: identificação de agrupamentos (aprendizado não-supervisionado) seguida de classificação (aprendizado supervisionado). Esses subprocessos correspondem às tarefas de rotulagem dos itens de dados e obtenção das correlações entre os atributos da entrada e os rótulos. Não encontramos outra razão para que haja essa separação que as limitações inerentes aos algoritmos específicos. Uma dessas limitações, por exemplo, é a necessidade de iteração de muitos deles buscando a convergência para um determinado modelo. Isto obriga a que o algoritmo realize várias leituras da base de dados, o que, para Mineração de Dados, é proibitivo. A partir dos avanços em DCBD, particularmente com o desenvolvimento de algoritmos de aprendizado que realizam sua tarefa em apenas uma leitura dos dados, fica evidente a possibilidade de se reduzir o número de acessos na realização do processo completo. Nossa contribuição, nesse caso, se materializa na proposta de uma estrutura de trabalho para integração dos dois paradigmas e a implementação de um protótipo dessa estrutura utilizando-se os algoritmos de aprendizado ART1, para identificação de agrupamentos, e MNC, para a tarefa de classificação. É também apresentada uma aplicação no mapeamento de áreas homogêneas de plantio de trigo no Brasil, de 1975 a 1999. Com relação às contribuições sobre o MNC são apresentados: (a) uma variante do algoritmo de treinamento que permite uma redução significativa do tamanho do modelo após o aprendizado; (b) um estudo sobre a redução da complexidade do modelo com o uso de máquinas de comitê; (c) uma técnica, usando o método do envoltório, para poda controlada do modelo final e (d) uma abordagem para tratamento de inconsistências e perda de conhecimento que podem ocorrer na construção do modelo.
Resumo:
Pós-graduação em Agronomia (Energia na Agricultura) - FCA
Resumo:
The objective of this study was to assess families and highlight the superior progenies of sugarcane originating from 38 biparental crosses for the following attributes: tons of cane per hectare (TCH), tons of biomass per hectare (TBIOH), brix (% cane juice), fiber content, purity, pol and total recoverable sugar (TRS). The data were analyzed by mixed model REML / BLUP in the REML (Restricted Maximum Likelihood) allowed us to estimate genetic parameters and BLUP (best linear unbiased prediction) to predict the additive and genotypic values. The best family for the attributes TCH and TBIOH was 41, whose parents are cultivars IACSP022019 x CTC9. In individual selection for TCH, the plant number 3 of Block 2, the crossing 78, showed the best results. To TBIOH the plant number 33, Block 1, family 41, showed the best results. Families 40, 41, 43, 68, 69, 79, 91, 92 and 147, were higher for the variables brix, pol, purity, and ATR, where as 85 families, 147, 148, 149, 161, 163, 177, 178, 179, and 183 were higher for fiber. The family 147 whose parents are IACSP042286 x IACSP963055, showed three progenies ranked among the top ten for both brix, and for fiber, which identifies the combination as a potential source of progenies for bioenergy production.
Resumo:
Neste trabalho, analisamos o modo como o processo de seleção de pessoal se estabeleceu em meio às determinações de sentido nesta que Martin Heidegger denominou a era da técnica. Esse filósofo descreve a época em que vivemos como uma era que se caracteriza essencialmente pela ênfase no pensamento técnico-calculante, em que todas as coisas são tomadas pelo caráter da mensuração e calculabilidade. Nesse sentido, podemos afirmar que a era moderna detém como verdades algumas características, como: fundo de reserva, funcionalidade (serventia) e a produtividade sem limites. Esse modelo de pensamento tem um impacto direto na realização do processo de seleção de pessoal pela Psicologia, haja vista ser esse o critério básico exigido para que o trabalhador seja aprovado. Ocorre que, ao tomar esse critério como a única e absoluta verdade da capacidade do trabalhador, outras capacidades e motivações, quando muito, ficam relegadas a um segundo plano. O homem, tomado como um estoque de matéria-prima, com funcionalidades específicas e pela determinação da produtividade incessante, passa a se comportar de modo autômato, tal como a máquina, cuja utilidade dura enquanto durar a necessidade de sua produção, sendo descartado quando outras necessidades se sobrepõem àquela. Através da análise da trajetória da organização do trabalho e sua interface com a Psicologia, procuramos esclarecer o domínio do caráter técnico instrumental que vem sustentando a Psicologia no modo de realização da seleção de pessoal, baseando-nos em autores como Sampaio, Chiavenato, Pontes e Leme. Apresentamos, também, a contribuição de outros autores, como Sennett, Dejours e Schwartz, que tentaram, a seu modo, construir uma análise crítica da relação homem-trabalho sob os parâmetros predominantes na atualidade. Por fim, por meio a uma visada fenomenológico-hermenêutica, pudemos refletir sobre o processo de seleção em Psicologia e compreender como esta, ao ser constantemente interpelada pela era da técnica, vem tomando os atributos dessa era como verdades absolutas e, assim, estabelecendo seu fazer em seleção de pessoal sob essas verdades. Ao orientar seu fazer por esse modo, a Psicologia, comprometida com o processo de seleção, compactua, sedimenta e fortalece essa forma de pensar em que o homem é tomado como objeto de produção tal qual a máquina, consolidando uma relação homem-trabalho em bases preponderantemente deterministas e, como tal, aprisionadoras. A proposta aqui desenvolvida consiste em evidenciar a possibilidade de outra posição da Psicologia frente ao modo de estabelecimento do processo de seleção, de forma a resistir à perspectiva de homem apenas como um fator produtivo.
Resumo:
A presente pesquisa partiu de uma revisão teórica dos assuntos relacionados à seleção sexual proposta por Charles Darwin, passando para evolução dos sistemas e da psicologia do acasalamento humano. Os estudos práticos, divididos em dois momentos, foram coletados numa comunidade litorânea de baixa renda no nordeste brasileiro, na qual as mulheres tiveram pelo menos duas uniões estáveis até a data da coleta, no ano de 2008. Nas primeiras análises, foram contempladas as expectativas dessas mulheres em relação aos atributos dos parceiros. E posteriormente, o perfil e valor das mesmas entraram em perspectiva. De uma forma geral, foi constatado que as mulheres, no primeiro casamento, de fato realizam matrimônios com parceiros mais parecidos com o que consideram ideal do que os posteriores. Assim como as segundas e subseqüentes uniões apresentam uma ligeira queda no valor (no mercado de casamentos) desses homens quando comparados aos primeiros companheiros levando em consideração indicadores biosocioeconômicos como idade, escolaridade e renda (status socioeconômico).
Resumo:
Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq)
Resumo:
Diferentes critérios utilizados para a escolha de parceiros entre homens e mulheres têm sido identificados. Essa diferença, provavelmente, origina-se pelos diferentes graus de investimento parental entre gêneros. Mulheres parecem ter predisposição a selecionar parceiros com características de investimento emocional, material e com bons indicativos de saúde. Já homens podem utilizar os mesmos critérios que as mulheres, porém dão mais importância que estas à aparência física e juventude. Em relacionamentos de curto e longo prazo a literatura indica que há uma diferença nas escolhas entre mulheres. No primeiro caso, elas têm demonstrando preferir características relacionadas à saúde física, comparado ao segundo tipo de relacionamento, no qual a ênfase tem sido voltada à parceiros bons provedores de recursos e com alto nível de investimento emocional. Há poucas pesquisas que investigaram os critérios que mulheres homossexuais utilizam na escolha de suas parceiras amorosas. Estudos que investigaram a origem da homossexualidade apontaram a possibilidade de influências biológicas. Em termos evolutivos, a homossexualidade poderia ter surgido, em parte, como subproduto da evolução do prazer característico das atividades sexuais. Se esta hipótese estiver correta, o potencial para o desenvolvimento de uma orientação homo, hetero ou bissexual pode ser potencializado por ambientes característicos dos indivíduos em particular. Tal hipótese pode sugerir que os mecanismos psicológicos para escolha de parceiros sejam semelhantes entre as mulheres de variadas orientações sexuais. Para testar esta hipótese, investigou-se as preferências na escolha de parceiras de 100 mulheres em período reprodutivo, entre 18 e 40 anos, que se auto-classificaram como “homossexual exclusivo” ou “homossexual, e às vezes heterossexual”. Para a coleta de dados foram utilizados dois instrumentos, um para seleção das participantes e outro para a coleta de informações. O instrumento de coleta de dados foi dividido em: 1) Dados Demográficos; 2) Dados da parceira; 3) Critérios valorizados na escolha de uma parceira; 4) Critérios valorizados na escolha de uma parceira de curto e longo prazo; 5) Variáveis relacionadas ao desempenho sexual. As participantes foram contatadas pelo método a) “snow ball”, b) bares frequentados por grupos homossexuais e c) associações GLBT. Especificamente, investigou-se as variáveis envolvidas na escolha de parceiras de curto e longo prazo e comparou-se os resultados com os dados coletados por Cruz (2009), com mulheres heterossexuais em período reprodutivo. Os resultados indicaram que há maior preferência por atributos físicos em relacionamentos de curto prazo entre mulheres homo e heterossexuais. Atributos referentes à formação de vínculo foram mais solicitados em relacionamentos de longo prazo, possivelmente porque 75,6% dessas mulheres têm renda e não dependem do parceiro(a) para o provimento na relação, diminuindo a necessidade de parceiro(a)s que invistam recursos materiais. Mulheres homossexuais parecem ter os mesmos padrões de escolha de parceiros que heterossexuais.
Resumo:
A utilização de ecossistemas naturais como meta a ser atingida e a seleção de indicadores para monitoramento dos projetos são temas controversos na ciência e na prática da restauração. Analisamos a vegetação ripária em quatro remanescentes de Floresta Estacional Semidecidual, para verificar se alguns atributos dessas comunidades se repetem em diferentes locais, podendo ser referência para esta região fitogeográfica. Instalamos dez parcelas de 100 m² em cada local, amostramos plantas lenhosas com altura ≥ 0,5 m, divididas em estrato regenerante (DAP < 5 cm) e estrato arbóreo (DAP ≥ 5 cm) e classificamos as espécies com base em atributos funcionais, raridade e status de ameaça. Contabilizamos lianas, pteridófitas e árvores com epífitas. As variáveis estruturais de densidade (estrato arbóreo e regenerante e árvores com epífitas), área basal e cobertura de copas não diferiram entre locais. Foram pouco variáveis entre as áreas a riqueza rarefeita para 100 indivíduos no estrato arbóreo, a riqueza total estimada por Jackknife e as proporções de espécies raras, tolerantes à sombra, de crescimento lento e zoocóricas. Porém, analisando-se a proporção de indivíduos na comunidade, somente a tolerância à sombra foi pouco variável. Para as outras variáveis analisadas não existem padrões que possam ser considerados referência para esta região fitogeográfica. No entanto, ainda que para algumas variáveis existam padrões, sua utilização como meta da restauração depende de: 1) prazos longos para monitoramento de projetos e, sobretudo, 2) estudos que demonstrem que os ecossistemas restaurados podem, um dia, igualar aos ecossistemas pré-existentes.
Resumo:
Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP)
Resumo:
Pós-graduação em Design - FAAC