Η OpenAI κατηγορεί την κινεζική start-up τεχνητής νοημοσύνης DeepSeek για παραβίαση πνευματικών δικαιωμάτων, ισχυριζόμενη ότι χρησιμοποίησε τα δικά της μοντέλα για να εκπαιδεύσει το AI chatbot της
Από τότε που η κινεζική start-up τεχνητής νοημοσύνης (AI) DeepSeek ταρακούνησε την Silicon Valley και την Wall Street με τα οικονομικά αποδοτικά μοντέλα της, η εταιρεία έχει κατηγορηθεί για κλοπή δεδομένων μέσω μιας πρακτικής που είναι κοινή σε ολόκληρο τον κλάδο.
Η OpenAI δήλωσε ότι έχει αποδείξεις ότι η DeepSeek χρησιμοποίησε την μέθοδο της «απόσταξης» (distillation) των μοντέλων GPT της OpenAI, για να εκπαιδεύσει τα μοντέλα ανοιχτού κώδικα V3 και R1 στο DeepSeek, με ένα κλάσμα του κόστους που ξοδεύουν οι δυτικοί τεχνολογικοί γίγαντες για τα δικά τους μοντέλα, όπως ανέφεραν οι Financial Times την Τετάρτη.
Αν και το distillation είναι συνηθισμένη πρακτική στον κλάδο, η OpenAI υποστηρίζει ότι η χρήση της για την δημιουργία ανταγωνιστικού μοντέλου παραβιάζει τους όρους χρήσης της.
Η μέθοδος της απόσταξης είναι ένα μέσο εκπαίδευσης των μικρότερων μοντέλων, ώστε να μιμούνται τη συμπεριφορά μεγαλύτερων και πιο εξελιγμένων μοντέλων. Αυτή η πρακτική είναι κοινή σε πολλές εταιρείες που επιθυμούν να μειώσουν το μέγεθος των μοντέλων τους, προσφέροντας παράλληλα παρόμοια απόδοση με τα μεγαλύτερα μοντέλα στους χρήστες τους.
Όλα τα παραπάνω και σε συνδυασμό με το γεγονός ότι η εκπαίδευση όλων των γνωστών Ai μοντέλων βασίζεται συχνά σε πολλά δεδομένα αμφιβόλου προέλευσης, οδήγησε ορισμένους ειδικούς να αμφισβητήσουν την ειλικρίνεια της OpenAI στις κατηγορίες της για παραβίαση πνευματικής ιδιοκτησίας από την DeepSeek.
Σημειώνεται ότι η DeepSeek προκάλεσε έκπληξη στον κλάδο με την κυκλοφορία του μοντέλου R1, το οποίο πέτυχε επιδόσεις συγκρίσιμες με κορυφαία αμερικανικά μοντέλα παρά το χαμηλό κόστος ανάπτυξής του. Οι ανησυχίες για μειωμένη ανάγκη αγοράς ακριβού υλικού AI συνέβαλαν στην πτώση της μετοχής της Nvidia κατά 17%, αν και ανέκαμψε εν μέρει την επόμενη ημέρα.
Όπως δήλωσε ο Lutz Finger, ανώτερος λέκτορας στο Πανεπιστήμιο του Cornell, ο οποίος έχει εργαστεί στην τεχνητή νοημοσύνη σε εταιρείες τεχνολογίας όπως η Google και το LinkedIn,
Εκτός όμως από όλα τα παραπάνω, τα πράγματα φαίνεται πως γίνονται ακόμη πιο περίπλοκα σε ότι αφορά το DeepSeek, καθώς σύμφωνα με τα όσα ισχυρίζεται ο @Dorialexander, το DeepSeek R1 LLM μπορεί μεν να εκπαιδεύτηκε αρχικά σε Hardware της Nvidia H100, που είναι ένας από τους πιο ισχυρούς επεξεργαστές για την εκπαίδευση μοντέλων AI.
Ωστόσο η εκτέλεση του μοντέλου πραγματοποιείται με τη χρήση του Ascend 910C της Huawei, επειδή τα Ascend τσιπ της Huawei δεν είναι ικανά να αναλαμβάνουν το βάρος της εκπαίδευσης των Ai μοντέλων.
Ο λόγος που χρησιμοποιείται το Ascend 910C είναι ότι για την εκτέλεση του μοντέλου οι απαιτήσεις επεξεργαστικής ισχύος είναι χαμηλότερες σε σχέση με την εκπαίδευση. Ωστόσο, αυτός ο τύπος τσιπ είναι πιο αποδοτικός και πιο οικονομικός για καλύψει τις ανάγκες αυτές.
Μην ξεχάσετε να ακολουθήσετε το Xiaomi-miui.gr στο Google News για να ενημερώνεστε αμέσως για όλα τα νέα άρθρα μας ! Μπορείτε επίσης αν χρησιμοποιείτε RSS reader, να προσθέσετε την σελίδα μας στη λίστα σας, ακολουθώντας απλά αυτό τον σύνδεσμο >> https://xiaomi-miui.gr/feed