891 resultados para information source
Resumo:
In France, farmers commission about 250,000 soil-testing analyses per year to assist them managing soil fertility. The number and diversity of origin of the samples make these analyses an interesting and original information source regarding cultivated topsoil variability. Moreover, these analyses relate to several parameters strongly influenced by human activity (macronutrient contents, pH...), for which existing cartographic information is not very relevant. Compiling the results of these analyses into a database makes it possible to re-use these data within both a national and temporal framework. A database compilation relating to data collected over the period 1990-2009 has been recently achieved. So far, commercial soil-testing laboratories approved by the Ministry of Agriculture have provided analytical results from more than 2,000,000 samples. After the initial quality control stage, analytical results from more than 1,900,000 samples were available in the database. The anonymity of the landholders seeking soil analyses is perfectly preserved, as the only identifying information stored is the location of the nearest administrative city to the sample site. We present in this dataset a set of statistical parameters of the spatial distributions for several agronomic soil properties. These statistical parameters are calculated for 4 different nested spatial entities (administrative areas: e.g. regions, departments, counties and agricultural areas) and for 4 time periods (1990-1994, 1995-1999, 2000-2004, 2005-2009). Two kinds of agronomic soil properties are available: the firs one correspond to the quantitative variables like the organic carbon content and the second one corresponds to the qualitative variables like the texture class. For each spatial unit and temporal period, we calculated the following statistics stets: the first set is calculated for the quantitative variables and corresponds to the number of samples, the mean, the standard deviation and, the 2-,4-,10-quantiles; the second set is calculated for the qualitative variables and corresponds to the number of samples, the value of the dominant class, the number of samples of the dominant class, the second dominant class, the number of samples of the second dominant class.
Resumo:
El presente artículo se basa en los primeros resultados de un proyecto de investigación, cuyo objetivo general es caracterizar los procesos económicos, legales, urbanos y sociales que se llevan adelante, y los productos que se obtienen a partir de la acción de las familias, en el mercado informal de suelo urbano de la ciudad de Córdoba. La importancia de este proyecto, radica en que la fuente de información esencial, surge de entrevistas cualitativas a ocupantes de villas y asentamientos.
Resumo:
Los documentos manuscritos constituyen fuentes de información primaria, tanto para estudios históricos como para estudios literarios del área de la filología y la crítica genética. La descripción y difusión de este patrimonio constituye una prioridad para las bibliotecas que son depositarias del mismo, dado el creciente interés observado por este tipo de documentos. En pos de contribuir a este objetivo, se brinda un panorama de la normativa vigente aplicable a la descripción de manuscritos. Se enfatizan los beneficios de la descripción normalizada y del empleo de esquemas de metadatos específicos para la difusión de este tipo de material en Internet y se propone su integración a las prácticas bibliotecológicas corrientes
Resumo:
Los documentos manuscritos constituyen fuentes de información primaria, tanto para estudios históricos como para estudios literarios del área de la filología y la crítica genética. La descripción y difusión de este patrimonio constituye una prioridad para las bibliotecas que son depositarias del mismo, dado el creciente interés observado por este tipo de documentos. En pos de contribuir a este objetivo, se brinda un panorama de la normativa vigente aplicable a la descripción de manuscritos. Se enfatizan los beneficios de la descripción normalizada y del empleo de esquemas de metadatos específicos para la difusión de este tipo de material en Internet y se propone su integración a las prácticas bibliotecológicas corrientes
Resumo:
Los documentos manuscritos constituyen fuentes de información primaria, tanto para estudios históricos como para estudios literarios del área de la filología y la crítica genética. La descripción y difusión de este patrimonio constituye una prioridad para las bibliotecas que son depositarias del mismo, dado el creciente interés observado por este tipo de documentos. En pos de contribuir a este objetivo, se brinda un panorama de la normativa vigente aplicable a la descripción de manuscritos. Se enfatizan los beneficios de la descripción normalizada y del empleo de esquemas de metadatos específicos para la difusión de este tipo de material en Internet y se propone su integración a las prácticas bibliotecológicas corrientes
Resumo:
The design and development of spoken interaction systems has been a thoroughly studied research scope for the last decades. The aim is to obtain systems with the ability to interact with human agents with a high degree of naturalness and efficiency, allowing them to carry out the actions they desire using speech, as it is the most natural means of communication between humans. To achieve that degree of naturalness, it is not enough to endow systems with the ability to accurately understand the user’s utterances and to properly react to them, even considering the information provided by the user in his or her previous interactions. The system has also to be aware of the evolution of the conditions under which the interaction takes place, in order to act the most coherent way as possible at each moment. Consequently, one of the most important features of the system is that it has to be context-aware. This context awareness of the system can be reflected in the modification of the behaviour of the system taking into account the current situation of the interaction. For instance, the system should decide which action it has to carry out, or the way to perform it, depending on the user that requests it, on the way that the user addresses the system, on the characteristics of the environment in which the interaction takes place, and so on. In other words, the system has to adapt its behaviour to these evolving elements of the interaction. Moreover that adaptation has to be carried out, if possible, in such a way that the user: i) does not perceive that the system has to make any additional effort, or to devote interaction time to perform tasks other than carrying out the requested actions, and ii) does not have to provide the system with any additional information to carry out the adaptation, which could imply a lesser efficiency of the interaction, since users should devote several interactions only to allow the system to become adapted. In the state-of-the-art spoken dialogue systems, researchers have proposed several disparate strategies to adapt the elements of the system to different conditions of the interaction (such as the acoustic characteristics of a specific user’s speech, the actions previously requested, and so on). Nevertheless, to our knowledge there is not any consensus on the procedures to carry out these adaptation. The approaches are to an extent unrelated from one another, in the sense that each one considers different pieces of information, and the treatment of that information is different taking into account the adaptation carried out. In this regard, the main contributions of this Thesis are the following ones: Definition of a contextualization framework. We propose a unified approach that can cover any strategy to adapt the behaviour of a dialogue system to the conditions of the interaction (i.e. the context). In our theoretical definition of the contextualization framework we consider the system’s context as all the sources of variability present at any time of the interaction, either those ones related to the environment in which the interaction takes place, or to the human agent that addresses the system at each moment. Our proposal relies on three aspects that any contextualization approach should fulfill: plasticity (i.e. the system has to be able to modify its behaviour in the most proactive way taking into account the conditions under which the interaction takes place), adaptivity (i.e. the system has also to be able to consider the most appropriate sources of information at each moment, both environmental and user- and dialogue-dependent, to effectively adapt to the conditions aforementioned), and transparency (i.e. the system has to carry out the contextualizaton-related tasks in such a way that the user neither perceives them nor has to do any effort in providing the system with any information that it needs to perform that contextualization). Additionally, we could include a generality aspect to our proposed framework: the main features of the framework should be easy to adopt in any dialogue system, regardless of the solution proposed to manage the dialogue. Once we define the theoretical basis of our contextualization framework, we propose two cases of study on its application in a spoken dialogue system. We focus on two aspects of the interaction: the contextualization of the speech recognition models, and the incorporation of user-specific information into the dialogue flow. One of the modules of a dialogue system that is more prone to be contextualized is the speech recognition system. This module makes use of several models to emit a recognition hypothesis from the user’s speech signal. Generally speaking, a recognition system considers two types of models: an acoustic one (that models each of the phonemes that the recognition system has to consider) and a linguistic one (that models the sequences of words that make sense for the system). In this work we contextualize the language model of the recognition system in such a way that it takes into account the information provided by the user in both his or her current utterance and in the previous ones. These utterances convey information useful to help the system in the recognition of the next utterance. The contextualization approach that we propose consists of a dynamic adaptation of the language model that is used by the recognition system. We carry out this adaptation by means of a linear interpolation between several models. Instead of training the best interpolation weights, we make them dependent on the conditions of the dialogue. In our approach, the system itself will obtain these weights as a function of the reliability of the different elements of information available, such as the semantic concepts extracted from the user’s utterance, the actions that he or she wants to carry out, the information provided in the previous interactions, and so on. One of the aspects more frequently addressed in Human-Computer Interaction research is the inclusion of user specific characteristics into the information structures managed by the system. The idea is to take into account the features that make each user different from the others in order to offer to each particular user different services (or the same service, but in a different way). We could consider this approach as a user-dependent contextualization of the system. In our work we propose the definition of a user model that contains all the information of each user that could be potentially useful to the system at a given moment of the interaction. In particular we will analyze the actions that each user carries out throughout his or her interaction. The objective is to determine which of these actions become the preferences of that user. We represent the specific information of each user as a feature vector. Each of the characteristics that the system will take into account has a confidence score associated. With these elements, we propose a probabilistic definition of a user preference, as the action whose likelihood of being addressed by the user is greater than the one for the rest of actions. To include the user dependent information into the dialogue flow, we modify the information structures on which the dialogue manager relies to retrieve information that could be needed to solve the actions addressed by the user. Usage preferences become another source of contextual information that will be considered by the system towards a more efficient interaction (since the new information source will help to decrease the need of the system to ask users for additional information, thus reducing the number of turns needed to carry out a specific action). To test the benefits of the contextualization framework that we propose, we carry out an evaluation of the two strategies aforementioned. We gather several performance metrics, both objective and subjective, that allow us to compare the improvements of a contextualized system against the baseline one. We will also gather the user’s opinions as regards their perceptions on the behaviour of the system, and its degree of adaptation to the specific features of each interaction. Resumen El diseño y el desarrollo de sistemas de interacción hablada ha sido objeto de profundo estudio durante las pasadas décadas. El propósito es la consecución de sistemas con la capacidad de interactuar con agentes humanos con un alto grado de eficiencia y naturalidad. De esta manera, los usuarios pueden desempeñar las tareas que deseen empleando la voz, que es el medio de comunicación más natural para los humanos. A fin de alcanzar el grado de naturalidad deseado, no basta con dotar a los sistemas de la abilidad de comprender las intervenciones de los usuarios y reaccionar a ellas de manera apropiada (teniendo en consideración, incluso, la información proporcionada en previas interacciones). Adicionalmente, el sistema ha de ser consciente de las condiciones bajo las cuales transcurre la interacción, así como de la evolución de las mismas, de tal manera que pueda actuar de la manera más coherente en cada instante de la interacción. En consecuencia, una de las características primordiales del sistema es que debe ser sensible al contexto. Esta capacidad del sistema de conocer y emplear el contexto de la interacción puede verse reflejada en la modificación de su comportamiento debida a las características actuales de la interacción. Por ejemplo, el sistema debería decidir cuál es la acción más apropiada, o la mejor manera de llevarla a término, dependiendo del usuario que la solicita, del modo en el que lo hace, etcétera. En otras palabras, el sistema ha de adaptar su comportamiento a tales elementos mutables (o dinámicos) de la interacción. Dos características adicionales son requeridas a dicha adaptación: i) el usuario no ha de percibir que el sistema dedica recursos (temporales o computacionales) a realizar tareas distintas a las que aquél le solicita, y ii) el usuario no ha de dedicar esfuerzo alguno a proporcionar al sistema información adicional para llevar a cabo la interacción. Esto último implicaría una menor eficiencia de la interacción, puesto que los usuarios deberían dedicar parte de la misma a proporcionar información al sistema para su adaptación, sin ningún beneficio inmediato. En los sistemas de diálogo hablado propuestos en la literatura, se han propuesto diferentes estrategias para llevar a cabo la adaptación de los elementos del sistema a las diferentes condiciones de la interacción (tales como las características acústicas del habla de un usuario particular, o a las acciones a las que se ha referido con anterioridad). Sin embargo, no existe una estrategia fija para proceder a dicha adaptación, sino que las mismas no suelen guardar una relación entre sí. En este sentido, cada una de ellas tiene en cuenta distintas fuentes de información, la cual es tratada de manera diferente en función de las características de la adaptación buscada. Teniendo en cuenta lo anterior, las contribuciones principales de esta Tesis son las siguientes: Definición de un marco de contextualización. Proponemos un criterio unificador que pueda cubrir cualquier estrategia de adaptación del comportamiento de un sistema de diálogo a las condiciones de la interacción (esto es, el contexto de la misma). En nuestra definición teórica del marco de contextualización consideramos el contexto del sistema como todas aquellas fuentes de variabilidad presentes en cualquier instante de la interacción, ya estén relacionadas con el entorno en el que tiene lugar la interacción, ya dependan del agente humano que se dirige al sistema en cada momento. Nuestra propuesta se basa en tres aspectos que cualquier estrategia de contextualización debería cumplir: plasticidad (es decir, el sistema ha de ser capaz de modificar su comportamiento de la manera más proactiva posible, teniendo en cuenta las condiciones en las que tiene lugar la interacción), adaptabilidad (esto es, el sistema ha de ser capaz de considerar la información oportuna en cada instante, ya dependa del entorno o del usuario, de tal manera que adecúe su comportamiento de manera eficaz a las condiciones mencionadas), y transparencia (que implica que el sistema ha de desarrollar las tareas relacionadas con la contextualización de tal manera que el usuario no perciba la manera en que dichas tareas se llevan a cabo, ni tampoco deba proporcionar al sistema con información adicional alguna). De manera adicional, incluiremos en el marco propuesto el aspecto de la generalidad: las características del marco de contextualización han de ser portables a cualquier sistema de diálogo, con independencia de la solución propuesta en los mismos para gestionar el diálogo. Una vez hemos definido las características de alto nivel de nuestro marco de contextualización, proponemos dos estrategias de aplicación del mismo a un sistema de diálogo hablado. Nos centraremos en dos aspectos de la interacción a adaptar: los modelos empleados en el reconocimiento de habla, y la incorporación de información específica de cada usuario en el flujo de diálogo. Uno de los módulos de un sistema de diálogo más susceptible de ser contextualizado es el sistema de reconocimiento de habla. Este módulo hace uso de varios modelos para generar una hipótesis de reconocimiento a partir de la señal de habla. En general, un sistema de reconocimiento emplea dos tipos de modelos: uno acústico (que modela cada uno de los fonemas considerados por el reconocedor) y uno lingüístico (que modela las secuencias de palabras que tienen sentido desde el punto de vista de la interacción). En este trabajo contextualizamos el modelo lingüístico del reconocedor de habla, de tal manera que tenga en cuenta la información proporcionada por el usuario, tanto en su intervención actual como en las previas. Estas intervenciones contienen información (semántica y/o discursiva) que puede contribuir a un mejor reconocimiento de las subsiguientes intervenciones del usuario. La estrategia de contextualización propuesta consiste en una adaptación dinámica del modelo de lenguaje empleado en el reconocedor de habla. Dicha adaptación se lleva a cabo mediante una interpolación lineal entre diferentes modelos. En lugar de entrenar los mejores pesos de interpolación, proponemos hacer los mismos dependientes de las condiciones actuales de cada diálogo. El propio sistema obtendrá estos pesos como función de la disponibilidad y relevancia de las diferentes fuentes de información disponibles, tales como los conceptos semánticos extraídos a partir de la intervención del usuario, o las acciones que el mismo desea ejecutar. Uno de los aspectos más comúnmente analizados en la investigación de la Interacción Persona-Máquina es la inclusión de las características específicas de cada usuario en las estructuras de información empleadas por el sistema. El objetivo es tener en cuenta los aspectos que diferencian a cada usuario, de tal manera que el sistema pueda ofrecer a cada uno de ellos el servicio más apropiado (o un mismo servicio, pero de la manera más adecuada a cada usuario). Podemos considerar esta estrategia como una contextualización dependiente del usuario. En este trabajo proponemos la definición de un modelo de usuario que contenga toda la información relativa a cada usuario, que pueda ser potencialmente utilizada por el sistema en un momento determinado de la interacción. En particular, analizaremos aquellas acciones que cada usuario decide ejecutar a lo largo de sus diálogos con el sistema. Nuestro objetivo es determinar cuáles de dichas acciones se convierten en las preferencias de cada usuario. La información de cada usuario quedará representada mediante un vector de características, cada una de las cuales tendrá asociado un valor de confianza. Con ambos elementos proponemos una definición probabilística de una preferencia de uso, como aquella acción cuya verosimilitud es mayor que la del resto de acciones solicitadas por el usuario. A fin de incluir la información dependiente de usuario en el flujo de diálogo, llevamos a cabo una modificación de las estructuras de información en las que se apoya el gestor de diálogo para recuperar información necesaria para resolver ciertos diálogos. En dicha modificación las preferencias de cada usuario pasarán a ser una fuente adicional de información contextual, que será tenida en cuenta por el sistema en aras de una interacción más eficiente (puesto que la nueva fuente de información contribuirá a reducir la necesidad del sistema de solicitar al usuario información adicional, dando lugar en consecuencia a una reducción del número de intervenciones necesarias para llevar a cabo una acción determinada). Para determinar los beneficios de las aplicaciones del marco de contextualización propuesto, llevamos a cabo una evaluación de un sistema de diálogo que incluye las estrategias mencionadas. Hemos recogido diversas métricas, tanto objetivas como subjetivas, que nos permiten determinar las mejoras aportadas por un sistema contextualizado en comparación con el sistema sin contextualizar. De igual manera, hemos recogido las opiniones de los participantes en la evaluación acerca de su percepción del comportamiento del sistema, y de su capacidad de adaptación a las condiciones concretas de cada interacción.
Resumo:
Objetivo. Consciente de la necesidad de una herramienta consensuada para medir la clase social en ciencias de la salud, la Sociedad Española de Epidemiología (SEE) realizó en 1995 una propuesta para su medida. El objetivo de este trabajo es explorar el impacto bibliométrico de dicha medida. Métodos. Utilizando Google Scholar y Scopus se recuperaron los artículos que citan el informe de la SEE y los que citan los artículos publicados a partir del informe. La información que se extrajo de estas citas fue: año, origen y factor de impacto de la revista de publicación, autocitas, fuente de información, área temática, ciudad del primer autor, tipo de publicación, diseño del estudio, utilización de la clase social como variable, número de categorías en las que se ha agrupado la clase social y utilización de la ocupación o de los estudios para determinar la clase social. Resultados. Se observa un aumento progresivo de las citas y una gran heterogeneidad en los temas. Generalmente las citas se publicaron en revistas con factor de impacto, en artículos originales, en trabajos de diseño transversal y por investigadores residentes en Barcelona o Madrid. Conclusiones. La propuesta de la SEE ha mostrado ser una herramienta de creciente utilidad, aplicable en distintos contextos. Como sugirió la SEE, puede ser necesaria su actualización.
Resumo:
La migración internacional de retirados no es un fenómeno nuevo entre los países de la Unión Europea. Hay un buen número de sociólogos que han descrito el proceso y sus implicaciones en las formas de vida, especialmente en los casos de migración de los hogares de jóvenes retirados desde los países del norte de Europa hacia los soleados del sur. Muchos de estos movimientos afectan al mercado de viviendas desde el mismo momento de la llegada al país de destino y, en muchos casos, los flujos de población generados por esta migración contribuyen al cambio en las tendencias de edificación en los casos en que los destinos tienen bajos niveles de renta. Estos flujos tienen también implicaciones futuras como la necesidad de aumentar los servicios de atención a la tercera edad o en salud lo que, hoy por hoy, implican un elevado gasto público para el sistema español. Este artículo se interesa por las implicaciones en el corto plazo, así como en indagar en el fenómeno en sí. A través de la explotación de parte de los resultados de un proyecto de investigación denominado REVIcVAL (Retirados y vivienda en la Comunidad Valenciana), el artículo muestra algunas características de este flujo migratorio así como la racionalidad a la hora de tomar la decisión de comprar una vivienda. El ejercicio empírico utiliza información primaria recogida a través de un cuestionario recopilando información de retirados ingleses y alemanes en la costa de Alicante durante los años 2005 y 2006, con una base municipal, y estima la racionalidad en la toma de decisión de compra de viviendas.
Resumo:
La incorporación de Twitter al ámbito de la comunicación ha supuesto una serie de cambios en el entorno periodístico que afectan no sólo a la distribución de las noticias, sino también a la identificación de fuentes, tendencias y noticias de alcance. El objetivo de esta investigación es determinar la estrategia de utilización periodística de Twitter como fuente informativa por parte de la Cadena SER. La metodología empleada es el análisis de contenido del perfil de Twitter de los cuatro programas informativos más representativos de la emisora durante los meses de julio a diciembre de 2012. Los resultados apuntan la prevalencia de esta plataforma como mecanismo de interconexión con el sistema mediático, frente a su posible uso como espacio en el que identificar e incorporar a su audiencia como fuente potencial.
Resumo:
Antecedentes: En la actualidad los medios de comunicación se constituyen como la principal fuente de información de la que se nutren los jóvenes. No obstante, y pese a la gran cantidad y variedad de mensajes disponibles, la información no siempre se construye adecuadamente debido a las frecuentes discrepancias con las que los medios de comunicación suelen exponerla. En referencia al tratamiento informativo que los diversos medios confieren a temas relacionados con la salud en general, y de forma más concreta sobre temas referentes a las drogas, es muy frecuente que la percepción tienda hacia un sensacionalismo exacerbado y una gran descontextualización de la información, lo que incide negativamente en la credibilidad que se otorga a los diversos medios. Metodología: En este estudio piloto se analiza la relación existente entre el grado de credibilidad que los jóvenes encuestados conceden a los distintos medios de comunicación, tanto si se refiere a información en general como si se refiere a temas sobre drogas. De igual modo, se indaga la relación existente entre el grado de información objetivo que poseen los sujetos sobre las distintas sustancias y la percepción del tratamiento que los medios de comunicación dan a la información sobre drogas. Para ello, participaron en el estudio 115 alumnos (27% varones y 73% mujeres) de primero de grado en Psicología, de la Universidad Miguel Hernández de Elche (Alicante-España). Conclusiones: Los resultados muestran correlaciones positivas del grado de credibilidad otorgado a los diversos medios, tanto si se trata sobre temas de información general como sobre temas relacionados con las drogas. Por otra parte, los jóvenes mantienen diferentes percepciones sobre el tratamiento que realizan los medios de comunicación de las noticias y contenidos sobre drogas, en función del nivel de información objetivo que poseen de las distintas sustancias de abuso.
Resumo:
Tradicionalmente gran parte de los programas preventivos de drogas y otras adicciones dirigidos a preadolescentes y adolescentes, se han apoyado en la información como estrategia fundamental para disuadir el consumo, utilizando argumentos basados en las consecuencias del deterioro al ser consumidores de sustancias, así como en el abuso de otras conductas adictivas no químicas. El enfoque clásico se apoya en que los jóvenes toman sus decisiones de consumir, o no, en base a una elaboración racional, por tanto en el caso de estar informados de los riesgos que asumen al consumir optarían por no hacerlo. Es fundamental incidir en la importancia que adquieren tres cuestiones alrededor de la información: el nivel y calidad de la información que tienen los jóvenes, el nivel y calidad de la información que tienen los padres y la búsqueda de las fuentes de información sobre drogas y su nivel de credibilidad. Posiblemente los modelos de transmisión y contenido de información que utiliza la publicidad comercial podrían ser más adecuados y eficaces que los del recurso al miedo en el ámbito de los comportamientos de salud, y por supuesto, de las adicciones en general. La tendencia de los promotores de mensajes de salud sigue siendo la de transmitir las consecuencias y los riesgos, en la línea de la apelación al miedo. Presumimos que se alcanzaría una mayor eficiencia con mensajes positivos, reforzando los estilos de vida saludables.
Resumo:
CyBase is a curated database and information source for backbone-cyclized proteins. The database incorporates naturally occurring cyclic proteins as well as synthetic derivatives, grafted analogues and acyclic permutants. The database provides a centralized repository of information on all aspects of cyclic protein biology and addresses issues pertaining to the management and searching of topologically circular sequences. The database is freely available at http://research.imb.uq.edu.au/cybase.
Resumo:
The paper focuses on inter-personal aspects of the context in the analysis of evidential and related epistemic marking systems. While evidentiality is defined by its capacity to qualify the speaker's indexical point of view in terms of information source, it is argued that other aspects of the context are important to analyze evidentiality both conceptually and grammatically. These distinct, analytical components concern the illocutionary status of a given marker and its scope properties. The importance of the hearer's point of view in pragmatics and semantics is well attested and constitutes a convincing argument for an increased emphasis on the perspective of the hearer/addressee in analyses of epistemic marking, such as evidentiality. The paper discusses available accounts of evidentials that attend to the perspective of the addressee and also introduces lesser-known epistemic marking systems that share a functional space with evidentiality.
Resumo:
In this paper we present, LEAPS, a Semantic Web and Linked data framework for searching and visualising datasets from the domain of Algal biomass. LEAPS provides tailored interfaces to explore algal biomass datasets via REST services and a SPARQL endpoint for stakeholders in the domain of algal biomass. The rich suite of datasets include data about potential algal biomass cultivation sites, sources of CO2, the pipelines connecting the cultivation sites to the CO2 sources and a subset of the biological taxonomy of algae derived from the world's largest online information source on algae.
Resumo:
Uncertainty text detection is important to many social-media-based applications since more and more users utilize social media platforms (e.g., Twitter, Facebook, etc.) as information source to produce or derive interpretations based on them. However, existing uncertainty cues are ineffective in social media context because of its specific characteristics. In this paper, we propose a variant of annotation scheme for uncertainty identification and construct the first uncertainty corpus based on tweets. We then conduct experiments on the generated tweets corpus to study the effectiveness of different types of features for uncertainty text identification. © 2013 Association for Computational Linguistics.