1 resultado para Vector space,
em SerWisS - Server für Wissenschaftliche Schriften der Fachhochschule Hannover
Filtro por publicador
- Acceda, el repositorio institucional de la Universidad de Las Palmas de Gran Canaria. España (1)
- AMS Tesi di Dottorato - Alm@DL - Università di Bologna (3)
- AMS Tesi di Laurea - Alm@DL - Università di Bologna (3)
- ArchiMeD - Elektronische Publikationen der Universität Mainz - Alemanha (2)
- Aston University Research Archive (4)
- Biblioteca Digital da Produção Intelectual da Universidade de São Paulo (9)
- Biblioteca Digital da Produção Intelectual da Universidade de São Paulo (BDPI/USP) (63)
- Biblioteca Virtual del Sistema Sanitario Público de Andalucía (BV-SSPA), Junta de Andalucía. Consejería de Salud y Bienestar Social, Spain (4)
- Biodiversity Heritage Library, United States (2)
- BORIS: Bern Open Repository and Information System - Berna - Suiça (17)
- Brock University, Canada (16)
- Bucknell University Digital Commons - Pensilvania - USA (1)
- Bulgarian Digital Mathematics Library at IMI-BAS (12)
- CentAUR: Central Archive University of Reading - UK (1)
- Cochin University of Science & Technology (CUSAT), India (15)
- Consorci de Serveis Universitaris de Catalunya (CSUC), Spain (131)
- Cor-Ciencia - Acuerdo de Bibliotecas Universitarias de Córdoba (ABUC), Argentina (1)
- Dalarna University College Electronic Archive (1)
- Digital Peer Publishing (1)
- DigitalCommons@University of Nebraska - Lincoln (1)
- Diposit Digital de la UB - Universidade de Barcelona (1)
- Doria (National Library of Finland DSpace Services) - National Library of Finland, Finland (33)
- FUNDAJ - Fundação Joaquim Nabuco (1)
- Glasgow Theses Service (1)
- Illinois Digital Environment for Access to Learning and Scholarship Repository (1)
- Institute of Public Health in Ireland, Ireland (1)
- Instituto Politécnico do Porto, Portugal (19)
- Iowa Publications Online (IPO) - State Library, State of Iowa (Iowa), United States (3)
- Martin Luther Universitat Halle Wittenberg, Germany (7)
- Massachusetts Institute of Technology (16)
- Ministerio de Cultura, Spain (1)
- National Center for Biotechnology Information - NCBI (3)
- QUB Research Portal - Research Directory and Institutional Repository for Queen's University Belfast (2)
- ReCiL - Repositório Científico Lusófona - Grupo Lusófona, Portugal (1)
- Repositório Científico da Universidade de Évora - Portugal (1)
- Repositório Científico do Instituto Politécnico de Lisboa - Portugal (21)
- Repositório da Produção Científica e Intelectual da Unicamp (1)
- Repositório de Administração Pública (REPAP) - Direção-Geral da Qualificação dos Trabalhadores em Funções Públicas (INA), Portugal (1)
- Repositório Institucional UNESP - Universidade Estadual Paulista "Julio de Mesquita Filho" (22)
- RUN (Repositório da Universidade Nova de Lisboa) - FCT (Faculdade de Cienecias e Technologia), Universidade Nova de Lisboa (UNL), Portugal (24)
- Scielo Saúde Pública - SP (170)
- Scottish Institute for Research in Economics (SIRE) (SIRE), United Kingdom (12)
- SerWisS - Server für Wissenschaftliche Schriften der Fachhochschule Hannover (1)
- Universidad Autónoma de Nuevo León, Mexico (14)
- Universidad de Alicante (5)
- Universidad del Rosario, Colombia (6)
- Universidad Politécnica de Madrid (7)
- Universidade Complutense de Madrid (1)
- Universidade do Minho (13)
- Universidade dos Açores - Portugal (1)
- Universidade Federal do Rio Grande do Norte (UFRN) (1)
- Universitat de Girona, Spain (11)
- Universitätsbibliothek Kassel, Universität Kassel, Germany (8)
- Université de Lausanne, Switzerland (163)
- Université de Montréal, Canada (28)
- University of Connecticut - USA (1)
- University of Michigan (3)
- University of Queensland eSpace - Australia (88)
- University of Southampton, United Kingdom (11)
Resumo:
The dependency of word similarity in vector space models on the frequency of words has been noted in a few studies, but has received very little attention. We study the influence of word frequency in a set of 10 000 randomly selected word pairs for a number of different combinations of feature weighting schemes and similarity measures. We find that the similarity of word pairs for all methods, except for the one using singular value decomposition to reduce the dimensionality of the feature space, is determined to a large extent by the frequency of the words. In a binary classification task of pairs of synonyms and unrelated words we find that for all similarity measures the results can be improved when we correct for the frequency bias.