678 resultados para P2P, Bilanciamento, Traffico, Reti, GGrid


Relevância:

10.00% 10.00%

Publicador:

Resumo:

Conventional web search engines are centralised in that a single entity crawls and indexes the documents selected for future retrieval, and the relevance models used to determine which documents are relevant to a given user query. As a result, these search engines suffer from several technical drawbacks such as handling scale, timeliness and reliability, in addition to ethical concerns such as commercial manipulation and information censorship. Alleviating the need to rely entirely on a single entity, Peer-to-Peer (P2P) Information Retrieval (IR) has been proposed as a solution, as it distributes the functional components of a web search engine – from crawling and indexing documents, to query processing – across the network of users (or, peers) who use the search engine. This strategy for constructing an IR system poses several efficiency and effectiveness challenges which have been identified in past work. Accordingly, this thesis makes several contributions towards advancing the state of the art in P2P-IR effectiveness by improving the query processing and relevance scoring aspects of a P2P web search. Federated search systems are a form of distributed information retrieval model that route the user’s information need, formulated as a query, to distributed resources and merge the retrieved result lists into a final list. P2P-IR networks are one form of federated search in routing queries and merging result among participating peers. The query is propagated through disseminated nodes to hit the peers that are most likely to contain relevant documents, then the retrieved result lists are merged at different points along the path from the relevant peers to the query initializer (or namely, customer). However, query routing in P2P-IR networks is considered as one of the major challenges and critical part in P2P-IR networks; as the relevant peers might be lost in low-quality peer selection while executing the query routing, and inevitably lead to less effective retrieval results. This motivates this thesis to study and propose query routing techniques to improve retrieval quality in such networks. Cluster-based semi-structured P2P-IR networks exploit the cluster hypothesis to organise the peers into similar semantic clusters where each such semantic cluster is managed by super-peers. In this thesis, I construct three semi-structured P2P-IR models and examine their retrieval effectiveness. I also leverage the cluster centroids at the super-peer level as content representations gathered from cooperative peers to propose a query routing approach called Inverted PeerCluster Index (IPI) that simulates the conventional inverted index of the centralised corpus to organise the statistics of peers’ terms. The results show a competitive retrieval quality in comparison to baseline approaches. Furthermore, I study the applicability of using the conventional Information Retrieval models as peer selection approaches where each peer can be considered as a big document of documents. The experimental evaluation shows comparative and significant results and explains that document retrieval methods are very effective for peer selection that brings back the analogy between documents and peers. Additionally, Learning to Rank (LtR) algorithms are exploited to build a learned classifier for peer ranking at the super-peer level. The experiments show significant results with state-of-the-art resource selection methods and competitive results to corresponding classification-based approaches. Finally, I propose reputation-based query routing approaches that exploit the idea of providing feedback on a specific item in the social community networks and manage it for future decision-making. The system monitors users’ behaviours when they click or download documents from the final ranked list as implicit feedback and mines the given information to build a reputation-based data structure. The data structure is used to score peers and then rank them for query routing. I conduct a set of experiments to cover various scenarios including noisy feedback information (i.e, providing positive feedback on non-relevant documents) to examine the robustness of reputation-based approaches. The empirical evaluation shows significant results in almost all measurement metrics with approximate improvement more than 56% compared to baseline approaches. Thus, based on the results, if one were to choose one technique, reputation-based approaches are clearly the natural choices which also can be deployed on any P2P network.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

La gestione del fine vita dei prodotti è un argomento di interesse attuale per le aziende; sempre più spesso l’imprese non possono più esimersi dall’implementare un efficiente sistema di Reverse Logistics. Per rispondere efficacemente a queste nuove esigenze diventa fondamentale ampliare i tradizionali sistemi logistici verso tutte quelle attività svolte all’interno della Reverse Logitics. Una gestione efficace ed efficiente dell’intera supply chain è un aspetto di primaria importanza per un’azienda ed incide notevolmente sulla sua competitività; proprio per perseguire questo obiettivo, sempre più aziende promuovono politiche di gestione delle supply chain sia Lean che Green. L’obiettivo di questo lavoro, nato dalle esigenze descritte sopra, è quello di applicare un modello innovativo che consideri sia politiche di gestione Lean, che dualmente politiche Green, alla gestione di una supply chain del settore automotive, comprendente anche le attività di gestione dei veicoli fuori uso (ELV). Si è analizzato per prima cosa i principi base e gli strumenti utilizzati per l’applicazione della Lean Production e del Green supply chain management e in seguito si è analizzato le caratteristiche distintive della Reverse Logistics e in particolare delle reti che trattano i veicoli a fine vita. L’obiettivo finale dello studio è quello di elaborare e implementare, tramite l’utilizzo del software AMPL, un modello di ottimizzazione multi-obiettivo (MOP- Multi Objective Optimization) Lean e Green a una Reverse Supply Chain dei veicoli a fine vita. I risultati ottenuti evidenziano che è possibile raggiungere un ottimo compromesso tra le due logiche. E' stata effettuata anche una valutazione economica dei risultati ottenuti, che ha evidenziato come il trade-off scelto rappresenti anche uno degli scenari con minor costi.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

La ricerca è nata dalla volontà di indagare il legame tra innovazione sociale, sviluppo e turismo. La domanda di ricerca che ha guidato questo lavoro ha assunto una duplice natura. Il primo obiettivo, di natura teorica, è stato quello di concettualizzare l’IS attraverso uno studio comparativo della letteratura internazionale, definendone le dimensioni e i processi di diffusione. Dal punto di vista empirico, è stata effettuata una ricerca-azione di tipo qualitativo nella città di Bologna. Partendo da un approfondimento storico che ha analizzato alcune peculiarità territoriali – il movimento cooperativo, i distretti industriali, etc. – l’indagine ha fornito una prima panoramica del fenomeno attraverso una mappatura delle realtà bolognesi. I risultati emersi hanno dimostrato che i legami tra IS, sviluppo e turismo sono complessi. L’IS comporta delle conseguenze per il territorio, andando ad intervenire all’interno dei processi di sviluppo. Nel rispondere a bisogni emergenti, essa promuove agency ed empowerment, creatività e capitale sociale abilitante. In un’ottica di sviluppo territoriale integrato, l’IS agisce sul processo di capacitazione, sia attraverso la valorizzazione del capitale sociale e la creazione di reti, sia attraverso processi di negoziazione e conflitto. L’indagine ha mostrato che tra turismo e IS esiste una triplice relazione. Innanzitutto, il turismo può essere considerato come uno strumento di analisi per osservare l’IS, ma la relazione avviene soprattutto a livello di pratiche sociali. Esistono, infatti, a Bologna diversi casi di iniziative di IS che diventano esperienze turistiche e viceversa. Citando Lefebvre, quando IS e turismo trovano spazi di intersezione emerge un duplice diritto alla città. Un diritto che si manifesta nella (ri)appropriazione di spazi fisici e simbolici dove si collocano le relazioni sociali e dove si elaborano progettualità condivise e dove la comunità può partecipare, supportando la capacità di aspirare dei soggetti locali

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Este proyecto pretende profundizar en algunos aspectos del funcionamiento institucional y político del Colegio de España, como ente integrado en las redes políticas y sociales de la ciudad italiana, a través del análisis de sus relaciones con la familia Malvezzi a inicios de la Edad Moderna, un período caracterizado por la creación y reforzamiento gradual de una red social conectada con el mundo hispano. Además, se pretende señalar los canales de colaboración y acuerdo recíproco que el Colegio de San Clemente puso en marcha con distintos miembros de la aristocracia boloñesa. Este estudio concibe el Colegio de España como una institución que va más allá de los límites estrictamente universitarios y que desarrolla un rol político y económico de primer nivel en el contexto local. Por otra parte, se interpretan las dinámicas del poder urbano en clave de red, dentro de la cual se entrecruzaban diversos intereses privados, familiares, clientelares y personales que tuvieron su repercusión en la esfera pública. En resumen, se trata de ofrecer una visión amplia y rica del cuadro de relaciones de poder de la ciudad de Bolonia. El objetivo final es conocer las razones, lógicas y fases que han plasmado, reforzado y caracterizado los vínculos personales e institucionales entre la familia Malvezzi y el Colegio de España.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

La presente tesi affronta l’evoluzione dei rapporti tra costituzionalismo democratico e diritto sovranazionale in Europa. L’ipotesi della ricerca si basa sull’idea che l’aumentare sempre più incessante negli ultimi decenni di conflitti costituzionali tra i due ordinamenti sia dovuto ad una loro differenza di fondo, di cui una parte importante è rappresentata dall’assenza della questione sociale nel diritto sovranazionale. Il primo capitolo si occupa di analizzare le principali teorie giuridiche che hanno fornito l’habitus teorico per leggere il processo di integrazione, giustificando l’adozione di una lettura delle dinamiche ordinamentali attraverso il prisma dei conflitti e della costituzione materiale. Nel secondo capitolo si volge lo sguardo all’analisi del diritto giurisprudenziale, suddiviso in due blocchi: un primo in cui – dopo aver approfondito alcuni capisaldi del diritto sovranazionale – si confrontano i due sistemi, in maniera statica, su alcuni temi (principio di non discriminazione, libertà di impresa e il bilanciamento con interessi collettivi, i diritti di pressione democratica, ecc.) per mettere in luce i diversi approcci; un secondo blocco in cui, invece, si studiano, in maniera più dinamica, le diverse perturbazioni che hanno interessato i rapporti tra ordinamenti, di cui una prima si è sviluppata sul rispetto dei diritti fondamentali da parte del diritto sovranazionale, mentre una seconda, ancora in corso, si concentra sul discorso sull’identità costituzionale. Nel terzo capitolo, in chiusura, si prova a sviluppare – sulla base delle risultanze del dibattito teorico e dell’analisi giurisprudenziale – una proposta finale che cerchi di unire la questione sociale e il discorso sull’identità costituzionale nel diritto pubblico europeo, che abbia alla sua base un nuovo e più centrale ruolo che dovranno svolgere le Corti costituzionali nello sviluppo delle dinamiche ordinamentali, al fine di far emergere alcuni conflitti di valore assenti nello spazio pubblico europeo.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

I simulatori di guida sono strumenti altamente tecnologici che permettono di svolgere attività di ricerca in vari ambiti quali la psicologia, la medicina e l’ingegneria. Tuttavia, affinché i dati ottenuti mediante le simulazioni siano rapportabili alla loro controparte reale, la fedeltà delle componenti del simulatore di guida deve essere elevata. Questo lavoro tratta del miglioramento del sistema di restituzione del movimento nel simulatore a due gradi di libertà (2DOF) SIMU-LACET Driving Simulator, costruito e sviluppato presso il laboratorio LEPSIS dell’IFSTTAR (Istituto Francese delle Scienze e Tecnologie dei Trasporti, dello Sviluppo e delle Reti), in particolare nella sua sede di Parigi – Marne-la-Vallée. Si è deciso di andare a riprogettare la parte software del sistema di restituzione del movimento (motion cueing), operando su due elementi principali: lo scale factor (fattore di scala) applicato agli impulsi dinamici provenienti dal modello veicolare e i Motion Cueing Algorihms (MCA, algoritmi di restituzione del movimento), questo per entrambi i gradi di libertà. Si è quindi intervenuti sul modello esistente implementato in MATLAB-Simulink nello specifico blocco del motion cueing sul surge (traslazione longitudinale) e sul yaw (imbardata). Riguardo lo scale factor, è stata introdotta una metodologia per creare uno scale factor non lineare in forma esponenziale, tale da migliorare la restituzione degli impulsi meno ampi, pur rispettando i limiti fisici della piattaforma di movimento. Per quanto concerne il MCA, si sono vagliate diverse transfer function dell’algoritmo classico. La scelta finale dei MCA e la validazione del motion cueig in genere è stata effettuata mediante due esperimenti ed il giudizio dei soggetti che vi hanno partecipato. Inoltre, in virtù dei risultati del primo esperimento, si è investigata l’influenza che la strategia in merito al cambio delle marce avesse sulla percezione del movimento da parte del guidatore.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

La metodologia convenzionalmente adottata per l’analisi e progettazione di reti acquedottistiche è la Demand Driven (DD), ovvero un’analisi guidata dalla domanda idrica dell’utenza che viene imposta, dal punto di vista matematico, nelle equazioni del modello idraulico; la struttura di risoluzione matematica di tale approccio è costituita dalle sole equazioni di continuità e del moto, le cui incognite sono i carichi idraulici da garantire per soddisfare la richiesta idrica (dato noto). Purtroppo la DD non è in grado di simulare, in modo ottimale, scenari in cui le pressioni in rete risultano essere inferiori rispetto a quelle richieste per un servizio di erogazione corretto. Dunque, per una completa analisi di una rete di distribuzione idrica, è utile adottare la metodologia Pressure Driven (PD), che si basa sullo stesso modello matematico utilizzato per l’analisi DD al quale viene aggiunta un’equazione che lega la portata erogata alle utenze e la perdita idrica al carico idraulico disponibile in corrispondenza dei nodi. In questo caso un ulteriore dato incognito, oltre al carico idraulico nei nodi ed alla portata nelle condotte della rete, risulta essere la portata effettivamente prelevata ai nodi oppure persa (leakage) dalla rete. Il presente lavoro di tesi ha portato alla calibrazione del modello di un distretto della rete di distribuzione idrica della città di Rapallo. Le simulazioni sono state eseguite attraverso il codice InfoWorks applicando sia la Demand Driven Analysis che risulta funzionale per l’ottenimento del modello calibrato, sia la Pressure Driven Analysis che non agisce sul bilancio complessivo della rete, ma interviene localmente nelle zone in cui le problematiche di funzionamento riscontrate riguardano le pressioni

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Nel presente elaborato di tesi si esporranno le fasi di costruzione ed i risultati del modello idraulico del sistema di distribuzione idrica della città di Cesena, comprendente tutta l’area cittadina e la zona di pianura a nord-ovest adiacente. Il caso di studio è stato reso disponibile dal gestore del Servizio idrico integrato nel territorio Hera S.p.A. Il modello numerico è stato implementato utilizzando il programma Infoworks® WS di HR Wallingford per la progettazione e gestione delle reti idriche. La realizzazione di un modello idraulico richiede la conoscenza topologica della rete e del suo funzionamento, nonché informazioni sul consumo idrico, fondamentali per la determinazione della domanda idrica. Essa comprende il consumo idropotabile delle utenze e la perdita idrica. Per le elaborazioni sono stati utilizzati i programmi open source QGis e RStudio. La variabilità del consumo è stata rappresentata attraverso una curva costruita sulla base del bilancio idrico della rete, mentre quella della perdita attraverso un pattern basato sul metodo del Minimum Night Flow. Compiuta la prima simulazione su un periodo di 7 giorni e ottenuti i primi risultati, si sono rese necessarie delle operazioni di calibrazione eseguite confrontando i dati risultanti dal modello con quelli misurati sul campo. Uno dei vantaggi di un modello numerico è quello di poter indagare le grandezze idrauliche in ogni punto della rete. È stato, infatti, possibile creare vere e proprie mappe tematiche che illustrano la variazione delle grandezze di interesse al variare dello spazio e del tempo. Un altro vantaggio è quello di poter prevedere il comportamento della rete in seguito a delle modifiche. Si è potuto, infatti, applicare lo strumento modellistico ad un’ipotesi di distrettualizzazione del sistema.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

La tesi si propone l'obiettivo di esaminare le caratteristiche della lingua dell'aviazione, il cosiddetto Aviation English (AE), rivolgendo un'attenzione particolare alle dinamiche delle interazioni verbali che avvengono tra piloti e controllori del traffico aereo. A partire da un breve excursus sui diversi tipi di linguaggi, da quelli specialistici alle lingue controllate, si cercherà di fornire una chiara definizione dell'AE, delineando gli aspetti che lo rendono una vera e propria lingua e non una semplice varietà di inglese. La tesi passerà in rassegna tutte le convenzioni e le regole che compongono questa lingua e che rendono la comunicazione in volo efficace a livello internazionale. Si vedrà anche come la comunicazione in aviazione sia suscettibile a molti fattori linguistici (e non), il che comporta per gli operatori del settore, l'obbligo di conoscerla a fondo, più della loro stessa lingua madre. In conclusione, si eseguirà un'analisi conversazionale di una comunicazione terra-bordo-terra realmente avvenuta in un'emergenza. Più precisamente, si tratta dell'estratto del volo US Airways 1549, diventato famoso come "il miracolo dell'Hudson". Questo permetterà di mettere in risalto le regole dell'AE, applicate in un caso concreto, quanto singolare, e notare come queste siano efficaci nel gestire, a livello comunicativo e operativo, gli imprevisti.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Ultimamente si stanno sviluppando tecnologie per rendere più efficiente la virtualizzazione a livello di sistema operativo, tra cui si cita la suite Docker, che permette di gestire processi come se fossero macchine virtuali. Inoltre i meccanismi di clustering, come Kubernetes, permettono di collegare macchine multiple, farle comunicare tra loro e renderle assimilabili ad un server monolitico per l'utente esterno. Il connubio tra virtualizzazione a livello di sistema operativo e clustering permette di costruire server potenti quanto quelli monolitici ma più economici e possono adattarsi meglio alle richieste esterne. Data l'enorme mole di dati e di potenza di calcolo necessaria per gestire le comunicazioni e le interazioni tra utenti e servizi web, molte imprese non possono permettersi investimenti su un server proprietario e la sua manutenzione, perciò affittano le risorse necessarie che costituiscono il cosiddetto "cloud", cioè l'insieme di server che le aziende mettono a disposizione dei propri clienti. Il trasferimento dei servizi da macchina fisica a cloud ha modificato la visione che si ha dei servizi stessi, infatti non sono più visti come software monolitici ma come microservizi che interagiscono tra di loro. L'infrastruttura di comunicazione che permette ai microservizi di comunicare è chiamata service mesh e la sua suddivisione richiama la tecnologia SDN. È stato studiato il comportamento del software di service mesh Istio installato in un cluster Kubernetes. Sono state raccolte metriche su memoria occupata, CPU utilizzata, pacchetti trasmessi ed eventuali errori e infine latenza per confrontarle a quelle ottenute da un cluster su cui non è stato installato Istio. Lo studio dimostra che, in un cluster rivolto all'uso in produzione, la service mesh offerta da Istio fornisce molti strumenti per il controllo della rete a scapito di una richiesta leggermente più alta di risorse hardware.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Lo studio ha indagato l’impatto delle reti di distribuzione idrica sulla qualità dell’acqua ed il supporto che in questo ambito possono fornire i modelli numerici nella redazione dei Piani di Sicurezza delle Acque (PSA) o Water Safety Plan (WSP). In una prima fase, esso è stato analizzato prendendo atto del percorso normativo europeo e nazionale e delle linee guida fornite dall’Organizzazione Mondiale di Sanità (OMS) e dall’Istituto Superiore di Sanità (ISS) che hanno portato i Piani di Sicurezza delle Acque nell’ambito del controllo delle acque potabili, tenendo conto, anche, dei vari soggetti coinvolti e delle problematiche generate dai cambiamenti climatici. In una seconda fase, si è analizzato il caso studio della rete di distribuzione idrica della città di Cesena, fornito dal gestore HERA S.p.A., modellando la qualità dell’acqua attraverso il programma EPANET 2.2. Questa analisi è stata sviluppata successivamente alla calibrazione del modello idraulico. Per gli aspetti che richiedono una georeferenziazione è stato utilizzato il programma open source QGIS, mentre per le analisi dei dati e le elaborazioni statistiche relative al campionamento del cloro residuo e delle portate immesse dalle fonti idriche è stato utilizzato il linguaggio R. E' stato quindi possibile creare mappe georeferenziate per diversi momenti della giornata del tempo di permanenza dell'acqua nella rete di distribuzione, delle concentrazioni di cloro residuo dell'acqua prelevata dagli utenti e analizzare il ruolo dei serbatoi di compenso.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Le malattie rare pongono diversi scogli ai pazienti, ai loro familiari e ai sanitari. Uno fra questi è la mancanza di informazione che deriva dall'assenza di fonti sicure e semplici da consultare su aspetti dell'esperienza del paziente. Il lavoro presentato ha lo scopo di generare da set termini correlati semanticamente, delle frasi che abbiamo la capacità di spiegare il legame fra di essi e aggiungere informazioni utili e veritiere in un linguaggio semplice e comprensibile. Il problema affrontato oggigiorno non è ben documentato in letteratura e rappresenta una sfida interessante si per complessità che per mancanza di dataset per l'addestramento. Questo tipo di task, come altri di NLP, è affrontabile solo con modelli sempre più potenti ma che richiedono risorse sempre più elevate. Per questo motivo, è stato utilizzato il meccanismo di recente pubblicazione del Performer, dimostrando di riuscire a mantenere uno stesso grado di accuratezza e di qualità delle frasi prodotte, con una parallela riduzione delle risorse utilizzate. Ciò apre la strada all'utilizzo delle reti neurali più recenti anche senza avere i centri di calcolo delle multinazionali. Il modello proposto dunque è in grado di generare frasi che illustrano le relazioni semantiche di termini estratti da un mole di documenti testuali, permettendo di generare dei riassunti dell'informazione e della conoscenza estratta da essi e renderla facilmente accessibile e comprensibile al pazienti o a persone non esperte.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Il problema del rumore derivante dai volumi di traffico sempre crescente richiede la ricerca di svariate soluzioni, tra cui l'installazione di barriere di sicurezza e antirumore, definite anche integrate. La tesi, svolta in collaborazione con Piacentini Ingegneri srl, dopo un primo inquadramento del problema dei livelli di rumore eccessivi e dei limiti imposti da normativa, descrive le possibili soluzioni trovate nel tempo e in corso di ricerca. Vengono dunque descritte nel dettaglio le barriere integrate, specialmente quelle trovate nei tratti autostradali di Genova e Milano nel corso del tirocinio svolto presso Piacentini Ingegneri srl. È stata eseguita una modellazione FEM delle barriere Integauto-s e diverse prove sperimentali sui new jersey e sulle opere di supporto alle barriere (pull-out, carotaggi, prove a trazione, ecc). Dai certificati delle prove si ricavano i parametri di resistenza degli elementi (barriera e cordoli di sostegno) grazie ai quali, in aggiunta alla documentazione originale fornita da Autostrade per l'Italia, si raggiunge il Livello di Conoscenza accurato, il massimo possibile: LC3. Ciò è indispensabile per rispettare la procedura per il rialzamento delle barriere integrate concordate tra le 2 società sopracitate. Quindi, si procede con le verifiche delle barriere e delle opere di supporto alle barriere (cordolo su terreno, cordolo con micropali o pali, cordolo su opera d'arte esistente, pile da ponte). L'intera tesi è finalizzata alla definizione delle altezze delle barriere integrate, in quanto per motivi di sicurezza erano state abbassate. I calcoli strutturali, la modellazione FEM e le prove condotte hanno portato alla conoscenza massima possibile delle seguenti barriere: Integauto-s, NJBP C1.2 Martellona, e NJBP Ecotecnica (trovate nei tratti autostradali oggetto di rialzamento).

Relevância:

10.00% 10.00%

Publicador:

Resumo:

In questo elaborato di tesi si affronta lo sviluppo di un framework per l'analisi di URL di phishing estratte da documenti malevoli. Tramite il linguaggio python3 e browsers automatizzati si è sviluppata una pipeline per analizzare queste campagne malevole. La pipeline ha lo scopo di arrivare alla pagina finale, evitando di essere bloccata da tecniche anti-bot di cloaking, per catturare una schermata e salvare la pagina in locale. Durante l'analisi tutto il traffico è salvato per analisi future. Ad ogni URL visitato vengono salvate informazioni quali entry DNS, codice di Autonomous System e lo stato nella blocklist di Google. Un'analisi iniziale delle due campagne più estese è stata effettuata, rivelando il business model dietro ad esse e le tecniche usate per proteggere l'infrastruttura stessa.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Dopo lo sviluppo dei primi casi di Covid-19 in Cina nell’autunno del 2019, ad inizio 2020 l’intero pianeta è precipitato in una pandemia globale che ha stravolto le nostre vite con conseguenze che non si vivevano dall’influenza spagnola. La grandissima quantità di paper scientifici in continua pubblicazione sul coronavirus e virus ad esso affini ha portato alla creazione di un unico dataset dinamico chiamato CORD19 e distribuito gratuitamente. Poter reperire informazioni utili in questa mole di dati ha ulteriormente acceso i riflettori sugli information retrieval systems, capaci di recuperare in maniera rapida ed efficace informazioni preziose rispetto a una domanda dell'utente detta query. Di particolare rilievo è stata la TREC-COVID Challenge, competizione per lo sviluppo di un sistema di IR addestrato e testato sul dataset CORD19. Il problema principale è dato dal fatto che la grande mole di documenti è totalmente non etichettata e risulta dunque impossibile addestrare modelli di reti neurali direttamente su di essi. Per aggirare il problema abbiamo messo a punto nuove soluzioni self-supervised, a cui abbiamo applicato lo stato dell'arte del deep metric learning e dell'NLP. Il deep metric learning, che sta avendo un enorme successo soprattuto nella computer vision, addestra il modello ad "avvicinare" tra loro immagini simili e "allontanare" immagini differenti. Dato che sia le immagini che il testo vengono rappresentati attraverso vettori di numeri reali (embeddings) si possano utilizzare le stesse tecniche per "avvicinare" tra loro elementi testuali pertinenti (e.g. una query e un paragrafo) e "allontanare" elementi non pertinenti. Abbiamo dunque addestrato un modello SciBERT con varie loss, che ad oggi rappresentano lo stato dell'arte del deep metric learning, in maniera completamente self-supervised direttamente e unicamente sul dataset CORD19, valutandolo poi sul set formale TREC-COVID attraverso un sistema di IR e ottenendo risultati interessanti.