Data Archiving and Networked Services Ervaringen buitenlandse instellingen met PURE, CONVERIS en Symplectic Elly Dijk SURFacademy ‘CRIS in NL; van beleid naar onderzoeker’ 13 december 2013 DANS is een instituut van KNAW en NWO Onderwerpen • • • • • • Achtergrond van de vergelijking Gestelde vragen Welke instellingen hebben meegewerkt? Antwoorden per instelling Conclusies Vragen SIG research information • • • • • • • Nick Vos – RIVM Magchiel Bijsterbosch – SURF Clasien Lock – WUR Wouter Mettrop – CWI Lieneke Roepers – Utwente Saskia Woutersen – UvA Elly Dijk - DANS PURE, CONVERIS en Symplectic • SIG Research Information heeft vergelijking gemaakt • Alle bieden actieve koppelingen met WoS, Scopus, ArXiv en Pubmed voor import • Echter: de kwaliteit van deze systemen kan op basis van de informatie van de leverancier niet voldoende worden onderscheiden. • Daarom: informeren bij afnemers van deze drie systemen • Aan de hand van een aantal vragen… Vragen 1. Sterke punten van het systeem - in het algemeen 2. Zwakke punten van het systeem - in het algemeen 3. Als je importeert uit de bronsystemen (WoS, Scopus etc.): hoe is dan de match (goed, redelijk, matig)? Wat mist, wat is teveel, wat kun je er aan doen? 4. Welke nabewerkingen zijn na het importeren van een record nog nodig? Welke instelling – welke onderzoekinformatiesysteem? • University of St. Andrews in Schotland - PURE • Universität Kassel in Duitsland - CONVERIS • University of Oxford - Symplectic Door Saskia Woutersen Voorbehoud antwoorden • Twee universiteiten voor de zomer bevraagd: situatie kan zijn gewijzigd. • Bepaalde voordelen of nadelen niet noemen wil niet zeggen dat die er niet zijn, bijv. CERIF relatie. • We hebben niet doorgevraagd op deze punten: eenmalige actie. Sterke punten van het systeem - PURE • Easy to use system for academics and admin staff • Excellent working relationship with Elsevier • Thriving User Group that works well to develop the system eg to develop REF module for UK • CERIF like with flexible linkages between entities • Elsevier engaged with CERIF and EuroCRIS • Good connectivity to other corporate data sources eg Staff data, student data, financial data • Good integration with 3rd party sources eg WoS, Scopus, Pubmed, ArXiv and formats eg Bibtex, Refman • Extensive Web services if known how to use effectively (see weaknesses also) Sterke punten van het systeem - CONVERIS • Very flexible in terms of adjusting the data model, workflows, user permissions • Provides a web interface to configure the data model, workflows, user permissions, etc.; database management skills are needed, though • Clear user interface structure • Good support for import of publication data; other data can be imported by admins via Excel files Sterke punten van het systeem – Symplectic • Technical support is very good. User :“Could not rate them any higher. Calls are being answered very quickly”. • The information that has been aggregated for evaluation purposes can be used via atom feed for departmental websites. Zwakke punten van het systeem - PURE • Connection to dSpace is complicated and inflexible ... We may therefore scrap this in future and keep full text in PURE (as others are doing eg Edinburgh, KCL, Dundee) • Reporting module - has improved greatly recently, but still needs more work • Extensive web services - can mean large XML documents clog up system & need to watch data confidentiality Zwakke punten van het systeem – CONVERIS • The user interface of CONVERIS 4 (which we still use) could be sleeker, it sometimes requires a lot of mouse clicks. However, CONVERIS 5 is a significant improvement in this respect. • The powers of CONVERIS come at a price: if you choose to configure the system yourself and harness its powers to their full extent, you need to be prepared to delve really deep into the logic of CONVERIS.This is manageable, though, and requires no programming skills (but xml/xslt skills). Zwakke punten van het systeem Symplectic • The server can be heavily loaded while searching the external databases. Therefore it is recommended to search for new information no more than every two weeks. • Symplectic is just a publication registration system and is not used as a project registration system or a grant registration system. Import uit de bronsystemen (WoS, Scopus etc.) - PURE • We import from WoS (and ArXiv) • Matching to internal authors is very good • Elsevier have responded to requests to improve the interface to cope with eg papers with very many authors • There is always a manual step that has to be taken to confirm internal author matches, because we don’t have ORCIDs or similar • For all import sources, individuals can setup a profile for regular automated alerts when probable new records appear for them to check/import. Import uit de bronsystemen (WoS, Scopus etc.)- CONVERIS • We only use the lite interface to WoS, which is limited in its functionality and the data provided. The quality of the match depends on the quality of the search query. In general, when searching for author + affiliation, the match is good. • Regarding the identification of duplicates, CONVERIS does an acceptable job. • Actually, from our experience, the quality of imported publication data depends much more on the source (say, WoS) than CONVERIS. Import uit de bronsystemen (WoS, Scopus etc.) - Symplectic • The import is automatic. The frequency is determined per data source by the administrator. • Exchanging information from external databases goes very well. Advice: use a CV of the researcher to fine-tune. • No control before import, but direct import: Confirmation needed by the author(s) of authorship. Welke nabewerkingen zijn na het importeren van een record nog nodig? PURE • None: No need for any additional metadata to be input as brings in all bib details, incl DOI, keywords, abstract. Welke nabewerkingen zijn na het importeren van een record nog nodig? Converis To some extent, this depends on the data model you choose to implement: •If you choose to implement relationships between publications and all authors (and their affiliation), CONVERIS will suggest matching authors based on the data imported. You will then need to either confirm the suggested author(s) and/or create new entries for authors (and their affiliation). This becomes an issue when importing from sources which provide all authors in a single string, without affiliation information. •If you choose to implement relationships between publications and authors only from your own institution, the above is much less of an issue. You would lose, however, the ability to identify cooperations with other institutions. Welke nabewerkingen zijn na het importeren van een record nog nodig? - Symplectic • “None, only for REF classification.” Conclusies • Vergelijking op basis van deze vragen/antwoorden niet mogelijk • Wel geven de antwoorden informatie over de systemen door de gebruikers • Maar houd het voorbehoud in gedachte! • Informatie over de vergelijking: SIG Research Information bij Edugroepen • Via Saskia of mij contact opnemen met gebruiker Data Archiving and Networked Services Bedankt voor jullie aandacht! Contact: elly.dijk@dans.knaw.nl DANS is an institute of KNAW en NWO