985 resultados para Error estimate.


Relevância:

20.00% 20.00%

Publicador:

Resumo:

Single-molecule sequencing instruments can generate multikilobase sequences with the potential to greatly improve genome and transcriptome assembly. However, the error rates of single-molecule reads are high, which has limited their use thus far to resequencing bacteria. To address this limitation, we introduce a correction algorithm and assembly strategy that uses short, high-fidelity sequences to correct the error in single-molecule sequences. We demonstrate the utility of this approach on reads generated by a PacBio RS instrument from phage, prokaryotic and eukaryotic whole genomes, including the previously unsequenced genome of the parrot Melopsittacus undulatus, as well as for RNA-Seq reads of the corn (Zea mays) transcriptome. Our long-read correction achieves >99.9% base-call accuracy, leading to substantially better assemblies than current sequencing strategies: in the best example, the median contig size was quintupled relative to high-coverage, second-generation assemblies. Greater gains are predicted if read lengths continue to increase, including the prospect of single-contig bacterial chromosome assembly.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Estimation of the skeleton of a directed acyclic graph (DAG) is of great importance for understanding the underlying DAG and causal effects can be assessed from the skeleton when the DAG is not identifiable. We propose a novel method named PenPC to estimate the skeleton of a high-dimensional DAG by a two-step approach. We first estimate the nonzero entries of a concentration matrix using penalized regression, and then fix the difference between the concentration matrix and the skeleton by evaluating a set of conditional independence hypotheses. For high-dimensional problems where the number of vertices p is in polynomial or exponential scale of sample size n, we study the asymptotic property of PenPC on two types of graphs: traditional random graphs where all the vertices have the same expected number of neighbors, and scale-free graphs where a few vertices may have a large number of neighbors. As illustrated by extensive simulations and applications on gene expression data of cancer patients, PenPC has higher sensitivity and specificity than the state-of-the-art method, the PC-stable algorithm.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

p.1-16

Relevância:

20.00% 20.00%

Publicador:

Resumo:

p.1-16

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Pensar que existen soluciones para cerrar la brecha entre el colegio y la universidad es utópico. Sin embargo, sí tiene sentido el trabajo que se haga con respecto al problema de la brecha para conocer y acercar los ideales y las expectativas que tienen las diferentes instituciones de educación. En la Universidad de los Andes fue evidente que dicho trabajo se podría orientar en diferentes direcciones y haciendo énfasis en la institución o bien en los profesores o bien en los estudiantes. Se podían abordar temas como: diseño curricular, creencias y actitudes de los profesores y de los estudiantes, métodos de enseñanza, concepciones sobre la enseñanza y el aprendizaje, dificultades y errores de aprendizaje y otros temas. Luego de varios traspiés en la elección del tema de investigación, elegimos finalmente explorar el tema del aprendizaje y considerar a los primíparos para el estudio por ser ellos los que viven realmente el proceso de transición del colegio a la universidad. Por otra parte, nos restringimos al área de precálculo motivados en parte porque en esta materia había un mayor índice de desaprobación. Concretamente, se propuso como objetivo general describir un perfil de aprendizaje en matemáticas del estudiante de Precálculo en el momento de ingresar a la Universidad. Del objetivo anterior se derivó el problema principal de este proyecto: definir los elementos conceptuales con los cuáles articular la descripción de dicho perfil. La presentación está dividida en cuatro partes, en la primera se expone un marco conceptual que presenta los elementos con los cuales se describirá el perfil, la segunda y tercera se refieren respectivamente a la metodología de la investigación y a los resultados obtenidos y la última a las conclusiones del trabajo.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

La investigación tiene dos fases: 1) Se plantea a los estudiantes de primer ingreso a la Universidad Panamericana, Guadalajara, México la simplificación de la expresión algebraica ; analizándose las respuestas equivocadas con su posible origen. 2) Se hace un estudio con 7 profesores de educación media básica y media superior, en el cual, se les presenta la simplificación errónea (a la izq.) con la consigna de mencionar el origen del error y cómo le ayudarían al alumno. Alumnos cometen errores de muy diverso origen, y los profesores encuestados no siempre analizan a profundidad el origen del error cometido por este alumno.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

The concept of a “true” ground-truth map is introduced, from which the inaccuracy/error of any production map may be measured. A partition of the mapped region is defined in terms of the “residual rectification” transformation. Geometric RMS-type and Geometric Distortion error criteria are defined as well as a map mis-classification error criterion (the latter for hard and fuzzy produc-tion maps). The total map error is defined to be the sum (over each set of the map partition men-tioned above) of these three error components integrated over each set of the partition.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

In this paper we propose a case base reduction technique which uses a metric defined on the solution space. The technique utilises the Generalised Shepard Nearest Neighbour (GSNN) algorithm to estimate nominal or real valued solutions in case bases with solution space metrics. An overview of GSNN and a generalised reduction technique, which subsumes some existing decremental methods, such as the Shrink algorithm, are presented. The reduction technique is given for case bases in terms of a measure of the importance of each case to the predictive power of the case base. A trial test is performed on two case bases of different kinds, with several metrics proposed in the solution space. The tests show that GSNN can out-perform standard nearest neighbour methods on this set. Further test results show that a caseremoval order proposed based on a GSNN error function can produce a sparse case base with good predictive power.