Θεσσαλονίκη, 13/4/2020
Με πρωτοβουλία ερευνητών του Αριστοτέλειου Πανεπιστημίου Θεσσαλονίκης και του Πανεπιστημίου Duke των ΗΠΑ δημιουργήθηκε ο γράφος βιβλιογραφικών αναφορών, μία βάση δεδομένων με επιστημονικά άρθρα από όλον τον κόσμο, σχετικά με τη μελέτη του COVID-19. Η πρωτοτυπία αυτής της βάσης έγκειται στο ότι τα άρθρα δεν απαριθμούνται μεμονωμένα, αλλά συνδέονται άμεσα με το σύνολο των παραπομπών και των αναφορών τους.
Περισσότερα από 100.000 άρθρα -από τα οποία πάνω από χίλια έχουν δημοσιευθεί από τον Ιανουάριο του 2020 μέχρι σήμερα- και περίπου 1.000.000 σύνδεσμοι περιέχονται στον γράφο. Σύμφωνα με τους ερευνητές, ο αριθμός συνδέσεων ανά κόμβο είναι πολύ υψηλότερος από ό,τι συνήθως παρατηρείται σε άλλους γράφους αναφορών.
Τα βιβλιογραφικά δεδομένα είναι διαθέσιμα στους ακόλουθους συνδέσμους:
- https://lg-covid-19-hotp.cs.duke.edu
- https://www.kaggle.com/nikospitsianis/lgcovid19hotp
- https://dx.doi.org/10.5281/zenodo.3728215
Στον πρώτο σύνδεσμο προστίθενται καθημερινά νέα άρθρα, ενώ τα διαγράμματα ενημερώνονται εβδομαδιαία. Στους άλλους δύο συνδέσμους αποθηκεύονται τα βιβλιογραφικά δεδομένα, τα οποία ενημερώνονται σε εβδομαδιαία βάση.
Ιδιαίτερο ενδιαφέρον παρουσιάζουν οι αναλύσεις που βασίζονται στον γράφο βιβλιογραφικών αναφορών, όπως κατανομές και λίστες άρθρων με βάση τον αριθμό των ετεροαναφορών, καθώς και η οπτικοποιημένη απεικόνιση των άρθρων, μέσα από τη δημιουργία μίας «σφαίρας μελέτης».
Η «σφαίρα μελέτης» βασίζεται στην τεχνική αναπαράστασης στοχαστικού γράφου (stochastic graph embedding), η οποία παρουσιάζεται σε πρόσφατα δημοσιευμένο έργο των ερευνητών (http://t-sne-pi.cs.duke.edu). Οι ομαδοποιήσεις στη «σφαίρα» απεικονίζουν ισχυρές διασυνδέσεις μεταξύ των ερευνητικών δραστηριοτήτων γειτονικών άρθρων. Όπως σημειώνει ο Αν. Καθηγητής και Διευθυντής του Εργαστηρίου Αρχιτεκτονικής Υπολογιστικών Συστημάτων του Τμήματος Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών του ΑΠΘ, Νίκος Πιτσιάνης, «δύο άρθρα, δηλαδή δύο σημεία της “σφαίρας” απεικονίζονται σε αυτή σε κοντινή απόσταση, εάν οι αναφορές τους ή οι αναφορές τρίτων άρθρων προς αυτά είναι αριθμητικά πολλές».
Στον πρώτο σύνδεσμο (https://lg-covid-19-hotp.cs.duke.edu) παρέχεται επιπρόσθετα μία διαδραστική έκδοση της «σφαίρας», που επιτρέπει στον χρήστη να βλέπει, να εντοπίζει και να εξερευνά τα άρθρα, σύμφωνα με τα ενδιαφέροντα και την τεχνογνωσία του. Έτσι ο χρήστης δεν περιορίζεται στους καταλόγους άρθρων που προσφέρει μια συμβατική μηχανή αναζήτησης.
Επόμενος στόχος των ερευνητών είναι η εκτεταμένη ανάλυση των δεδομένων με σκοπό την ανίχνευση κοινοτήτων και την ταξινόμηση των άρθρων σε θεματικές ενότητες, προκειμένου να διευκολυνθεί περαιτέρω η συνεχιζόμενη μελέτη του COVID-19.
Εικόνα 1: Ιστόγραμμα με τον αριθμό των άρθρων ανά εβδομάδα δημοσίευσής τους στο Διαδίκτυο (2.754 επιλεγμένα άρθρα μέχρι τις 9 Απριλίου 2020).
Εικόνα 2: «Σφαίρα μελέτης» με βάση τις παραπομπές 100.000 άρθρων σχετικών με τη μελέτη του COVID-19, όπου SEEDS με κόκκινο είναι 100 επιλεγμένα άρθρα, HOTP-FG με μπλε οι 3.940 παραπομπές σε αυτά και HOTP-BG με γκρι οι αναφορές όλων των παραπάνω. Οι ομαδοποιήσεις στον δίσκο απεικονίζουν ισχυρές διασυνδέσεις μεταξύ των ερευνητικών δραστηριοτήτων των γειτονικών άρθρων.