1 resultado para Character Recognition
em Universidad de Alicante
Filtro por publicador
- Acceda, el repositorio institucional de la Universidad de Las Palmas de Gran Canaria. España (6)
- AMS Tesi di Dottorato - Alm@DL - Università di Bologna (6)
- AMS Tesi di Laurea - Alm@DL - Università di Bologna (3)
- Aston University Research Archive (2)
- Biblioteca Digital da Produção Intelectual da Universidade de São Paulo (18)
- Biblioteca Digital da Produção Intelectual da Universidade de São Paulo (BDPI/USP) (43)
- Biblioteca Virtual del Sistema Sanitario Público de Andalucía (BV-SSPA), Junta de Andalucía. Consejería de Salud y Bienestar Social, Spain (1)
- Biodiversity Heritage Library, United States (3)
- Brock University, Canada (18)
- Bulgarian Digital Mathematics Library at IMI-BAS (5)
- CentAUR: Central Archive University of Reading - UK (93)
- CiencIPCA - Instituto Politécnico do Cávado e do Ave, Portugal (3)
- Cochin University of Science & Technology (CUSAT), India (24)
- Comissão Econômica para a América Latina e o Caribe (CEPAL) (3)
- Consorci de Serveis Universitaris de Catalunya (CSUC), Spain (31)
- Cor-Ciencia - Acuerdo de Bibliotecas Universitarias de Córdoba (ABUC), Argentina (1)
- Dalarna University College Electronic Archive (12)
- Department of Computer Science E-Repository - King's College London, Strand, London (3)
- Digital Archives@Colby (6)
- Digital Commons at Florida International University (6)
- DigitalCommons@University of Nebraska - Lincoln (6)
- Diposit Digital de la UB - Universidade de Barcelona (1)
- Doria (National Library of Finland DSpace Services) - National Library of Finland, Finland (16)
- Fachlicher Dokumentenserver Paedagogik/Erziehungswissenschaften (1)
- Galway Mayo Institute of Technology, Ireland (1)
- Instituto Politécnico do Porto, Portugal (12)
- Iowa Publications Online (IPO) - State Library, State of Iowa (Iowa), United States (1)
- Lume - Repositório Digital da Universidade Federal do Rio Grande do Sul (1)
- Martin Luther Universitat Halle Wittenberg, Germany (12)
- Massachusetts Institute of Technology (30)
- Ministerio de Cultura, Spain (9)
- ReCiL - Repositório Científico Lusófona - Grupo Lusófona, Portugal (3)
- Repositorio Académico de la Universidad Nacional de Costa Rica (2)
- Repositório Científico da Universidade de Évora - Portugal (1)
- Repositório Científico do Instituto Politécnico de Lisboa - Portugal (8)
- Repositório da Produção Científica e Intelectual da Unicamp (2)
- Repositório da Universidade Federal do Espírito Santo (UFES), Brazil (1)
- Repositório digital da Fundação Getúlio Vargas - FGV (4)
- Repositório Institucional UNESP - Universidade Estadual Paulista "Julio de Mesquita Filho" (62)
- RUN (Repositório da Universidade Nova de Lisboa) - FCT (Faculdade de Cienecias e Technologia), Universidade Nova de Lisboa (UNL), Portugal (12)
- School of Medicine, Washington University, United States (13)
- Scielo Saúde Pública - SP (36)
- Universidad Autónoma de Nuevo León, Mexico (3)
- Universidad de Alicante (1)
- Universidad del Rosario, Colombia (8)
- Universidad Politécnica de Madrid (2)
- Universidade do Minho (13)
- Universidade dos Açores - Portugal (1)
- Universidade Federal do Pará (9)
- Universidade Federal do Rio Grande do Norte (UFRN) (8)
- Universitat de Girona, Spain (5)
- Universitätsbibliothek Kassel, Universität Kassel, Germany (5)
- Université de Lausanne, Switzerland (104)
- Université de Montréal (1)
- Université de Montréal, Canada (21)
- University of Michigan (4)
- University of Queensland eSpace - Australia (52)
- University of Southampton, United Kingdom (2)
Resumo:
Information Retrieval systems normally have to work with rather heterogeneous sources, such as Web sites or documents from Optical Character Recognition tools. The correct conversion of these sources into flat text files is not a trivial task since noise may easily be introduced as a result of spelling or typeset errors. Interestingly, this is not a great drawback when the size of the corpus is sufficiently large, since redundancy helps to overcome noise problems. However, noise becomes a serious problem in restricted-domain Information Retrieval specially when the corpus is small and has little or no redundancy. This paper devises an approach which adds noise-tolerance to Information Retrieval systems. A set of experiments carried out in the agricultural domain proves the effectiveness of the approach presented.