885 resultados para Semantic Publishing, Linked Data, Bibliometrics, Informetrics, Data Retrieval, Citations


Relevância:

100.00% 100.00%

Publicador:

Resumo:

L'objectiu d'aquest treball és estudiar els sistemes de gestió de bases de dades (SGBD) utilitzats en el context de la web semàntica en general i analitzar-ne un en particular.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Volumes of data used in science and industry are growing rapidly. When researchers face the challenge of analyzing them, their format is often the first obstacle. Lack of standardized ways of exploring different data layouts requires an effort each time to solve the problem from scratch. Possibility to access data in a rich, uniform manner, e.g. using Structured Query Language (SQL) would offer expressiveness and user-friendliness. Comma-separated values (CSV) are one of the most common data storage formats. Despite its simplicity, with growing file size handling it becomes non-trivial. Importing CSVs into existing databases is time-consuming and troublesome, or even impossible if its horizontal dimension reaches thousands of columns. Most databases are optimized for handling large number of rows rather than columns, therefore, performance for datasets with non-typical layouts is often unacceptable. Other challenges include schema creation, updates and repeated data imports. To address the above-mentioned problems, I present a system for accessing very large CSV-based datasets by means of SQL. It's characterized by: "no copy" approach - data stay mostly in the CSV files; "zero configuration" - no need to specify database schema; written in C++, with boost [1], SQLite [2] and Qt [3], doesn't require installation and has very small size; query rewriting, dynamic creation of indices for appropriate columns and static data retrieval directly from CSV files ensure efficient plan execution; effortless support for millions of columns; due to per-value typing, using mixed text/numbers data is easy; very simple network protocol provides efficient interface for MATLAB and reduces implementation time for other languages. The software is available as freeware along with educational videos on its website [4]. It doesn't need any prerequisites to run, as all of the libraries are included in the distribution package. I test it against existing database solutions using a battery of benchmarks and discuss the results.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Information about the genomic coordinates and the sequence of experimentally identified transcription factor binding sites is found scattered under a variety of diverse formats. The availability of standard collections of such high-quality data is important to design, evaluate and improve novel computational approaches to identify binding motifs on promoter sequences from related genes. ABS (http://genome.imim.es/datasets/abs2005/index.html) is a public database of known binding sites identified in promoters of orthologous vertebrate genes that have been manually curated from bibliography. We have annotated 650 experimental binding sites from 68 transcription factors and 100 orthologous target genes in human, mouse, rat or chicken genome sequences. Computational predictions and promoter alignment information are also provided for each entry. A simple and easy-to-use web interface facilitates data retrieval allowing different views of the information. In addition, the release 1.0 of ABS includes a customizable generator of artificial datasets based on the known sites contained in the collection and an evaluation tool to aid during the training and the assessment of motif-finding programs.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Tutkimuksen pääasiallisena tavoitteena on selvittää ne moninaiset näkökulmat, joita mentori sekä mentoroitava läpikäyvät osallistuessaan mentorointiohjelmaan. Tutkimuksen avulla pyritään myös selvittämään vastaavanlaisen tuen saannin tehokkuutta sekä mentoroinnin sisältäminen elementtien hyödyllisyyttä. Pyrkimyksenä on myös selvittää sekä ymmärtää ne dynaamiset mentorointiprosessin ominaisuudet molempien prosessiin osallistuvien tahojen näkökulmasta. Tutkimuksen teoriaosuudessa käsitellään mentorointia, mentorointiin liittyviä vuorovaikutussuhteita sekä näihin liittyviä eri näkökulmia. Teoria koostuu monipuolisesta, kansainvälisestä sekä kotimaisesta kirjallisuudesta. Tutkimuksen aineiston keruu suoritetaan puolistrukturoiduilla avoimilla haastatteluilla, jotka suoritetaan järjestämällä kahdenkeskisiä teemahaastatteluita. Mentorointisuhteella on todettu olevan voimakas vaikutus siihen osallistuvien henkilöiden elämään. Mentorointisuhteen tarkoituksellisuus on tullut todettua myös kun itse vuorovaikutussuhde on osoittautunut hyödylliseksi osallistujille. Mentoroitavilla on odotuksia, että mentorit täyttävät seuraavanlaisia rooleja: neuvonantaja, roolimalli sekä mahdollisesti tukea antava ystävä. Kaikissa läpikäydyissä tapauksissa mentori pystyi tarjoamaan jonkun näistärooleista mentoroitavalle. Mentoroitava, puolestaan, otti tämän tuen vastaan jahyötyi siitä.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Diplomityössä tutustuttiin ohjelmistoyrityksen tuotteiden asiakastarpeiden ja vaatimusten käsittelyyn tuotehallinnan tietoprosessin näkökulmasta. Työssä kuvattiin yrityksen nykyinen prosessi sekä analysoitiin erityisesti sen haasteita. Teoriatiedon sekä yrityksen asiantuntijalausuntojen pohjalta laadittiin tuotehallinnan tietoprosessin kehitysehdotuksia. Kvalitatiivinen tapaustutkimus toteutettiin käytännönläheisesti esittämällä kohdeyrityksen asiantuntijoille avoimia kysymyksiä sekä heidän kanssaan keskustellen. Tutkimus tehtiin neljässä vaiheessa ja sen päätavoitteena oli selvittää, millä keinoilla voidaan tukea kohdeyrityksen tuotekehitystarpeisiin ja tuotekehitysehdotuksiin liittyvän tiedon hallintaa sekä tuotantopäätöksiä. Tutkimuksen teoreettinen viitekehys koostui organisaation tietoprosessista, organisaation päätöksentekoprosessista, ohjelmistotuotteen erityispiirteistä sekä ohjelmiston tuotehallinnasta. Kohdeyrityksen tuotehallinnan tietoprosessin kehittämisen keskeisiksi tekijöiksi nousivat tuotehallinnan tukena käytettävän tietojärjestelmän ominaisuudet, tiedon hakeminen, tiedon löytäminen ja tulkinta. Kehityskohteiksi nousivat lisäksi prosessin kulku, perustuotekehityksen ja asiakastoimituksien rinnakkainen hallinta sekä asiakasarvon tuottaminen tuotehallinnan keinoin. Tutkimuksen lopputuloksena toteutettiin kohdeyrityksen tuotehallinnan tietoprosessin tavoitetilan kuvaus. Tavoitetilan elementtejä olivat tuotteiden pidemmän tähtäimen suunnitelmat (roadmap), tuotehallinnan organisointi tiimeille sekä sensemaking-prosessin hyödyntäminen osapuolien yhteisen ymmärryksen luomiseksi kehitystarpeille. Käytössä olevan tietojärjestelmän kehitysehdotukset perustuivat näiden tuotehallinnan elementtien tukemiseen.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Presentation at Open Repositories 2014, Helsinki, Finland, June 9-13, 2014

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Presentation at Open Repositories 2014, Helsinki, Finland, June 9-13, 2014

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Presentation at Open Repositories 2014, Helsinki, Finland, June 9-13, 2014

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Tutkimuksen tavoitteena oli kehittää mallimittaristo logistiikkapalvelualalla toimivan yrityksen operatiivisen tason suorituskyvyn seurantaan ja toiminnanohjausta varten, päivittäisen johtamisen tueksi. Tutkimus suoritettiin pääosin toiminta-analyyttisena, yhden yrityksen empiirisenä tapaustutkimuksena. Tutkimuksen kohdeyrityksen toiminnanmittaus perustuu tällä hetkellä pääasiassa taloudellisiin mittareihin ja muutamaan kyselyyn. Toiminnanohjauksen ja – kehittämisen, päätöksenteon tueksi tarvitaan, taloudellisten mittareiden lisäksi, mittareita, joilla pystytään seuraamaan suorituskyvyn taustalla vaikuttavien tekijöiden kehittymistä. Tutkimuksen kohdeyrityksen operatiivisen tason suorituskyvyn mallimittariston suunnittelussa haluttiin varmistaa, että jatkossa mittaamisella vaikutettaisiin seuraustekijöiden lisäksi myös syytekijöihin, selkiyttää liiketoiminnan tavoitteet, operatiivisen tason näkökulmasta, ja mittaamisen tavoite. Tutkimuksessa esitelty mallimittaristo on suunniteltu, tasapainotetun mittariston viitekehyksen avulla. Mittariston näkökulmiksi valittiin: talous, sidosryhmä (asiakas), prosessi ja henkilöstö. Mittariston tuottaman tiedon tavoitteena on toiminnanohjauksen, -kehittämisen ja päätöksenteon tukeminen, kun mittaustulokset ja trendi ovat yhdessä paikassa, on tiedonhaku ja - hyödyntäminen helpompaa. Mallimittaristoa ei testattu eikä käyttöönotettu tutkimuksessa.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

With the growth in new technologies, using online tools have become an everyday lifestyle. It has a greater impact on researchers as the data obtained from various experiments needs to be analyzed and knowledge of programming has become mandatory even for pure biologists. Hence, VTT came up with a new tool, R Executables (REX) which is a web application designed to provide a graphical interface for biological data functions like Image analysis, Gene expression data analysis, plotting, disease and control studies etc., which employs R functions to provide results. REX provides a user interactive application for the biologists to directly enter the values and run the required analysis with a single click. The program processes the given data in the background and prints results rapidly. Due to growth of data and load on server, the interface has gained problems concerning time consumption, poor GUI, data storage issues, security, minimal user interactive experience and crashes with large amount of data. This thesis handles the methods by which these problems were resolved and made REX a better application for the future. The old REX was developed using Python Django and now, a new programming language, Vaadin has been implemented. Vaadin is a Java framework for developing web applications and the programming language is extremely similar to Java with new rich components. Vaadin provides better security, better speed, good and interactive interface. In this thesis, subset functionalities of REX was selected which includes IST bulk plotting and image segmentation and implemented those using Vaadin. A code of 662 lines was programmed by me which included Vaadin as the front-end handler while R language was used for back-end data retrieval, computing and plotting. The application is optimized to allow further functionalities to be migrated with ease from old REX. Future development is focused on including Hight throughput screening functions along with gene expression database handling

Relevância:

100.00% 100.00%

Publicador:

Resumo:

An inspirational and educational flashcard resource for secondary school children. Can be used as flashcards or as a matching activity (depending on how cards are cut out).

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Topics Include: 3.1 Cyber-Hate and Online Bullying 3.2 Sustainablilty; 3.3 Green IT - solutions and benefits 3.4 Open and Linked Data

Relevância:

100.00% 100.00%

Publicador:

Resumo:

This is a set of slides and a tutorial exercise which we used to teach people the basics of RDF and how they can manipulate data in this format to make quite powerful web pages very simply. It is not intended as full introduction to RDF and it's subtleties the aim is to teach the very bare minimum to be able to do something quickly. It empowers programmers to go away and play with linked data.