Posted in

Landgericht Hamburg: Σύνολα δεδομένων και εξόρυξη κειμένου και δεδομένων (TDM)

Το Landgericht Hamburg (Πρωτοδικείο Αμβούργου), με την από 27/9/2024 απόφασή του, απέρριψε την αγωγή για προσβολή δικαιωμάτων πνευματικής ιδιοκτησίας του φωτογράφου Robert Kneschke κατά του μη κερδοσκοπικού οργανισμού Large-scale Artificial Intelligence Open Network (LAION) που αφορούσε την εκ μέρους του τελευταίου δημιουργία συνόλου δεδομένων (dataset) μέσω εξαγωγής (scraping) δημόσια διαθέσιμων στο διαδίκτυο φωτογραφιών, το οποίο περιλάμβανε και την επίδικη φωτογραφία του πρώτου, με σκοπό τη συμπερίληψή της στο σύνολο δεδομένων του LAION για σκοπούς εκπαίδευσης μοντέλων τεχνητής νοημοσύνης από τον ίδιο τον οργανισμό ή και από τρίτους με το σκεπτικό ότι η εν λόγω ενέργεια έγινε για σκοπούς επιστημονικής έρευνας και επομένως εμπίπτει στην εξαίρεση του γερμανικού δικαίου για τη μη εμπορική εξόρυξη κειμένου και δεδομένων (text and data mining, TDM).

Σύμφωνα με τα ιστορικό της υπόθεσης, ο εναγόμενος μη κερδοσκοπικός οργανισμός LAION διέθετε δημόσια και δωρεάν ένα σύνολο δεδομένων με σχεδόν 6 δισεκατομμύρια ζεύγη εικόνας-κειμένου, το οποίο περιείχε υπερσυνδέσμους προς δημόσια προσβάσιμες εικόνες ή αρχεία εικόνων στο Διαδίκτυο και πληροφορίες σχετικά με τις αντίστοιχες εικόνες. Το εν λόγω σύνολο δεδομένων  μπορούσε να χρησιμοποιηθεί για την εκπαίδευση της  γεvετικής (ή παραγωγικής) τεχνητής νοημοσύνης (Generative AI).

Σε αυτό το πλαίσιο η επίδικη εικόνα καταγράφηκε, μεταφορτώθηκε, αναλύθηκε και συμπεριλήφθηκε με τα μεταδεδομένα της στο σύνολο δεδομένων που είχε δημιουργήσει ο εναγόμενος οργανισμός και αφού προηγουμένως την είχε μεταφορτώσει από το φωτογραφικό πρακτορείο, στο οποίο η επίδικη φωτογραφία ήταν διαθέσιμη, με το υδατογράφημα που είχε προσθέσει το φωτογραφικό πρακτορείο, το οποίο απαγόρευε, μεταξύ άλλων, την εξαγωγή (scraping) του περιεχομένου του ιστοτόπου του, συμπεριλαμβανομένης και της επίδικης φωτογραφίας.

Ο ενάγων ισχυρίστηκε ότι παραβιάστηκαν τα δικαιώματα πνευματικής ιδιοκτησίας του, ισχυρισμό τον οποίο το δικαστήριο αναγνώρισε βάσει του άρθρου 16 του γερμανικού νόμου περί δικαιωμάτων πνευματικής ιδιοκτησίας και συγγενικών δικαιωμάτων (Urheberrechtsgesetz, UrhG), λόγω της αναπαραγωγής που έλαβε χώρα στο πλαίσιο της διαδικασίας ανάλυσης.

Ο εναγόμενος οργανισμός ισχυρίστηκε ότι με τη λήψη της επίδικης εικόνας προέβη, στο πλαίσιο της δημιουργίας του συνόλου δεδομένων, σε αναπαραγωγή σχετιζόμενη με δικαιώματα πνευματικής ιδιοκτησίας, υποστήριξε όμως η εν λόγω αναπαραγωγή βασιζόταν στις διατάξεις των άρθρων 44a, 44b και 60d UrhG και στη συναίνεση του ενάγοντος. Σύμφωνα με το άρθρο 44a UrhG (Προσωρινές πράξεις αναπαραγωγής), “επιτρέπονται οι προσωρινές πράξεις αναπαραγωγής που είναι προσωρινές ή τυχαίες και αποτελούν αναπόσπαστο και ουσιώδες μέρος μιας τεχνικής διαδικασίας και των οποίων ο μοναδικός σκοπός είναι να επιτρέψουν

i) τη μετάδοση σε δίκτυο μεταξύ τρίτων μερών από ενδιάμεσο φορέα ή

ii) τη νόμιμη χρήση

ενός έργου ή άλλου προστατευόμενου αντικειμένου και οι οποίες δεν έχουν ανεξάρτητη οικονομική αξία.”

Το άρθρο 44b UrhG (Εξόρυξη κειμένου και δεδομένων) ορίζει ότι

“1) ως “εξόρυξη κειμένου και δεδομένων” νοείται η αυτοματοποιημένη ανάλυση μεμονωμένων ή περισσότερων ψηφιακών ή ψηφιοποιημένων έργων με σκοπό τη συλλογή πληροφοριών, ιδίως όσον αφορά μοτίβα, τάσεις και συσχετίσεις.

2) Επιτρέπεται η αναπαραγωγή νομίμως προσβάσιμων έργων για την εξόρυξη κειμένου και δεδομένων. Τα αντίγραφα πρέπει να διαγράφονται όταν δεν χρειάζονται πλέον για την εξόρυξη κειμένου και δεδομένων.

(3) Οι χρήσεις σύμφωνα με το εδάφιο α) της παραγράφου 2 επιτρέπονται μόνο εάν ο δικαιούχος δεν τις έχει περιορίσει. Ο περιορισμός της χρήσης στην περίπτωση έργων που είναι διαθέσιμα στο διαδίκτυο ισχύει μόνο εάν γίνεται σε μηχαναγνώσιμη μορφή.”

Τέλος, το άρθρο 60d UrhG (Εξόρυξη κειμένου και δεδομένων για σκοπούς επιστημονικής έρευνας) προβλέπει τα εξής:

“1) Επιτρέπεται η αναπαραγωγή για την εξόρυξη κειμένου και δεδομένων (άρθρο 44b παρ. 1 και 2 εδάφιο α’ για σκοπούς επιστημονικής έρευνας σύμφωνα με τις ακόλουθες διατάξεις:

2) Οι ερευνητικοί οργανισμοί επιτρέπεται να προβαίνουν σε αναπαραγωγές. Ως “ερευνητικοί οργανισμοί” νοούνται τα πανεπιστήμια, τα ερευνητικά ιδρύματα και άλλα ιδρύματα που διεξάγουν επιστημονική έρευνα εάν

1. επιδιώκουν μη εμπορικούς σκοπούς,

2. επανεπενδύουν όλα τα κέρδη τους στην επιστημονική έρευνα ή

3. ενεργούν προς το δημόσιο συμφέρον βάσει κρατικής εντολής.”

Η άδεια που προβλέπεται στο εδάφιο α΄ δεν επεκτείνεται σε ερευνητικούς οργανισμούς που συνεργάζονται με ιδιωτική επιχείρηση η οποία ασκεί ορισμένο βαθμό επιρροής στον ερευνητικό οργανισμό και έχει προνομιακή πρόσβαση στα πορίσματα της επιστημονικής του έρευνας.”

Ο εναγόμενος οργανισμός ισχυρίστηκε, μεταξύ άλλων, ότι η αποθήκευση της επίδικης αναπαραχθείσας φωτογραφίας ήταν προσωρινή και για σύντομο χρονικό διάστημα για λόγους ανάλυσης και μετά διαγράφηκε. Παράλληλα, ανέφερε ότι η ανάλυση αρχείων εικόνας και η εξαγωγή μεταδεδομένων ήταν σύννομη καθώς έγινε για την εκπαίδευση τεχνητής νοημοσύνης ενώ δεν δημιουργούνται παράλληλα ψηφιακά αρχεία εικόνων παρά μόνο υπερσύνδεσμοι.

Ο εναγόμενος οργανισμός επίσης ισχυρίστηκε ότι παρείχε σύνολα δεδομένων και μοντέλα δωρεάν δημιουργώντας και δοκιμάζοντας παράλληλα τα δικά της μοντέλα ΤΝ βάσει των δεδομένων εκπαίδευσης και ότι το έργο του συνιστούσε έρευνα, καθιστώντας δημόσια διαφανή στο διαδίκτυο τον τρόπο δημιουργίας των συνόλων δεδομένων εκπαίδευσης ώστε να βοηθήσει άλλους ερευνητές να κατανοήσουν τα βήματα που απαιτούνται για τη δημιουργία των συνόλων δεδομένων.

Το δικαστήριο αναγνώρισε ότι η ένδικη φωτογραφία τυγχάνει προστασίας και ότι ο εναγόμενος μη κερδοσκοπικός οργανισμός, με την αναπαραγωγή της φωτογραφίας στην οποία προέβη, παραβίασε τα δικαιώματα του ενάγοντος βάσει του άρθρου 16 UrhG. Το γερμανικό δικαστήριο αποφάνθηκε περαιτέρω ότι η αναπαραγωγή της επίδικης φωτογραφίας δεν ήταν ούτε προσωρινή ούτε τυχαία και ότι έγινε με σκοπό την εξόρυξη κειμένου και δεδομένων κατά την έννοια του άρθρου 44b παρ. 1 UrhG καθώς και για σκοπούς επιστημονικής έρευνας κατά την έννοια του άρθρου 60d παρ. 1 UrhG.

Το δικαστήριο τόνισε, ωστόσο, ότι η αναπαραγωγή δεν καλύπτεται από το άρθρο 44b UrhG, σύμφωνα με το οποίο επιτρέπεται η αναπαραγωγή νομίμως προσβάσιμων έργων για την εξόρυξη κειμένου και δεδομένων εκτός εάν ο δικαιούχος έχει περιορίσει τη χρήση αυτή, καθώς η συγχώνευση δεδομένων με σκοπό την εκπαίδευση τεχνητής νοημοσύνης δεν συνιστά εξόρυξη κειμένου ή δεδομένων, κατά την έννοια του άρθρου 44b UrhG. Όπως διευκρίνισε το δικαστήριο, στην περίπτωση της εξόρυξης κειμένου και δεδομένων, κατά την έννοια του άρθρου 44b UrhG, θα πρέπει να αναλύονται μόνο “οι πληροφορίες που κρύβονται στα δεδομένα” και όχι το περιεχόμενο της πνευματικής δημιουργίας, κάτι που στην υπό εξέταση υπόθεση δεν ίσχυε, καθώς το λεγόμενο “AI web scraping” αφορούσε το πνευματικό περιεχόμενο των έργων που χρησιμοποιούνται για εκπαιδευτικούς σκοπούς οδηγώντας τελικά στη δημιουργία πανομοιότυπων ή παρόμοιων ανταγωνιστικών προϊόντων.

Κατά συνέπεια, σύμφωνα με το σκεπτικό του δικαστηρίου, η δημιουργία ενός συνόλου δεδομένων του επίδικου τύπου, το οποίο αποτελεί τη βάση για την εκπαίδευση συστημάτων τεχνητής νοημοσύνης μπορεί ασφαλώς να θεωρηθεί ως επιστημονική έρευνα υπό την ανωτέρω έννοια ακόμη και αν χρησιμοποιείται από εμπορικές εταιρείες για την εκπαίδευση ή την περαιτέρω ανάπτυξη των συστημάτων τους τεχνητής νοημοσύνης και ακόμη και αν κάποια από τα μέλη του εναγομένου οργανισμού εργάζονται επ’ αμοιβή για τις εν λόγω εμπορικές εταιρείες, εφόσον δεν αποδείχθηκε οποιαδήποτε επιρροή της εταιρείας αυτής στο ερευνητικό έργο του εναγομένου οργανισμού ούτε τέθηκε εκ μέρους του ενάγοντος ζήτημα προνομιακής πρόσβασης στα αποτελέσματα της επιστημονικής έρευνας του εναγομένου οργανισμού, δηλαδή στο επίδικο σύνολο δεδομένων, από αυτές τις εμπορικές εταιρείες.

Αξίζει να σημειωθεί ότι στην εν λόγω υπόθεση το γερμανικό δικαστήριο δεν εφάρμοσε το άρθρο 44b UrhG, σύμφωνα με το οποίο επιτρέπεται η αναπαραγωγή νομίμως προσβάσιμων έργων για την εξόρυξη κειμένου και δεδομένων μόνο εφόσον η χρήση αυτή δεν έχει περιοριστεί από τον δικαιούχο, αλλά βασίστηκε στο άρθρο 60d UrhG για την εξόρυξη κειμένου και δεδομένων για σκοπούς επιστημονικής έρευνας, όπως το άρθρο αυτό ενσωματώνει το άρθρο 3 της Οδηγίας (ΕΕ) 2019/790 (Digital Single Market, DSM).

Δείτε το κείμενο της απόφασης στα γερμανικά.