1 resultado para Two stages
em Illinois Digital Environment for Access to Learning and Scholarship Repository
Filtro por publicador
- Aberdeen University (1)
- Academic Research Repository at Institute of Developing Economies (2)
- Acceda, el repositorio institucional de la Universidad de Las Palmas de Gran Canaria. España (2)
- Adam Mickiewicz University Repository (1)
- AMS Tesi di Dottorato - Alm@DL - Università di Bologna (6)
- AMS Tesi di Laurea - Alm@DL - Università di Bologna (4)
- Andina Digital - Repositorio UASB-Digital - Universidade Andina Simón Bolívar (1)
- Aquatic Commons (1)
- ArchiMeD - Elektronische Publikationen der Universität Mainz - Alemanha (2)
- Archimer: Archive de l'Institut francais de recherche pour l'exploitation de la mer (1)
- Archive of European Integration (1)
- Aston University Research Archive (24)
- B-Digital - Universidade Fernando Pessoa - Portugal (2)
- Biblioteca de Teses e Dissertações da USP (12)
- Biblioteca Digital | Sistema Integrado de Documentación | UNCuyo - UNCUYO. UNIVERSIDAD NACIONAL DE CUYO. (1)
- Biblioteca Digital da Produção Intelectual da Universidade de São Paulo (19)
- Biblioteca Digital da Produção Intelectual da Universidade de São Paulo (BDPI/USP) (59)
- Biblioteca Virtual del Sistema Sanitario Público de Andalucía (BV-SSPA), Junta de Andalucía. Consejería de Salud y Bienestar Social, Spain (1)
- Bioline International (5)
- BORIS: Bern Open Repository and Information System - Berna - Suiça (20)
- Brock University, Canada (4)
- Bucknell University Digital Commons - Pensilvania - USA (2)
- Bulgarian Digital Mathematics Library at IMI-BAS (3)
- CentAUR: Central Archive University of Reading - UK (29)
- Central European University - Research Support Scheme (2)
- Cochin University of Science & Technology (CUSAT), India (2)
- Comissão Econômica para a América Latina e o Caribe (CEPAL) (1)
- Consorci de Serveis Universitaris de Catalunya (CSUC), Spain (21)
- Dalarna University College Electronic Archive (5)
- Digital Commons - Michigan Tech (1)
- Digital Commons at Florida International University (4)
- Digital Peer Publishing (1)
- DigitalCommons@The Texas Medical Center (6)
- DigitalCommons@University of Nebraska - Lincoln (2)
- Diposit Digital de la UB - Universidade de Barcelona (1)
- Doria (National Library of Finland DSpace Services) - National Library of Finland, Finland (15)
- DRUM (Digital Repository at the University of Maryland) (2)
- Escola Superior de Educação de Paula Frassinetti (2)
- Glasgow Theses Service (1)
- Illinois Digital Environment for Access to Learning and Scholarship Repository (1)
- Instituto Politécnico de Viseu (2)
- Instituto Politécnico do Porto, Portugal (19)
- Instituto Superior de Psicologia Aplicada - Lisboa (1)
- Iowa Publications Online (IPO) - State Library, State of Iowa (Iowa), United States (2)
- Lume - Repositório Digital da Universidade Federal do Rio Grande do Sul (2)
- Memoria Académica - FaHCE, UNLP - Argentina (7)
- National Center for Biotechnology Information - NCBI (6)
- Nottingham eTheses (3)
- Publishing Network for Geoscientific & Environmental Data (19)
- ReCiL - Repositório Científico Lusófona - Grupo Lusófona, Portugal (1)
- Repositorio Academico Digital UANL (1)
- Repositório Alice (Acesso Livre à Informação Científica da Embrapa / Repository Open Access to Scientific Information from Embrapa) (2)
- Repositório Científico da Universidade de Évora - Portugal (5)
- Repositório Científico do Instituto Politécnico de Lisboa - Portugal (8)
- Repositório da Produção Científica e Intelectual da Unicamp (53)
- Repositório da Universidade Federal do Espírito Santo (UFES), Brazil (3)
- Repositorio de la Universidad de Cuenca (1)
- Repositório digital da Fundação Getúlio Vargas - FGV (16)
- REPOSITORIO DIGITAL IMARPE - INSTITUTO DEL MAR DEL PERÚ, Peru (2)
- Repositorio Institucional da UFLA (RIUFLA) (3)
- Repositório Institucional da Universidade de Aveiro - Portugal (1)
- Repositório Institucional da Universidade de Brasília (4)
- Repositório Institucional da Universidade Estadual de São Paulo - UNESP (5)
- Repositório Institucional da Universidade Tecnológica Federal do Paraná (RIUT) (1)
- Repositório Institucional UNESP - Universidade Estadual Paulista "Julio de Mesquita Filho" (255)
- Research Open Access Repository of the University of East London. (1)
- RUN (Repositório da Universidade Nova de Lisboa) - FCT (Faculdade de Cienecias e Technologia), Universidade Nova de Lisboa (UNL), Portugal (6)
- SAPIENTIA - Universidade do Algarve - Portugal (2)
- Scielo Saúde Pública - SP (65)
- Scottish Institute for Research in Economics (SIRE) (SIRE), United Kingdom (1)
- Universidad de Alicante (5)
- Universidad del Rosario, Colombia (3)
- Universidad Politécnica de Madrid (17)
- Universidade de Lisboa - Repositório Aberto (2)
- Universidade do Minho (5)
- Universidade dos Açores - Portugal (1)
- Universidade Estadual Paulista "Júlio de Mesquita Filho" (UNESP) (1)
- Universidade Federal de Uberlândia (1)
- Universidade Federal do Pará (19)
- Universidade Federal do Rio Grande do Norte (UFRN) (67)
- Universidade Metodista de São Paulo (8)
- Universidade Técnica de Lisboa (4)
- Universitat de Girona, Spain (2)
- Universitätsbibliothek Kassel, Universität Kassel, Germany (1)
- Université de Lausanne, Switzerland (17)
- Université de Montréal, Canada (9)
- University of Michigan (1)
- University of Queensland eSpace - Australia (26)
- University of Washington (2)
Resumo:
Discovery Driven Analysis (DDA) is a common feature of OLAP technology to analyze structured data. In essence, DDA helps analysts to discover anomalous data by highlighting 'unexpected' values in the OLAP cube. By giving indications to the analyst on what dimensions to explore, DDA speeds up the process of discovering anomalies and their causes. However, Discovery Driven Analysis (and OLAP in general) is only applicable on structured data, such as records in databases. We propose a system to extend DDA technology to semi-structured text documents, that is, text documents with a few structured data. Our system pipeline consists of two stages: first, the text part of each document is structured around user specified dimensions, using semi-PLSA algorithm; then, we adapt DDA to these fully structured documents, thus enabling DDA on text documents. We present some applications of this system in OLAP analysis and show how scalability issues are solved. Results show that our system can handle reasonable datasets of documents, in real time, without any need for pre-computation.