Όταν ο Κινέζος ιδρυτής ποσοτικών αμοιβαίων κεφαλαίων κινδύνου Liang Wenfeng αποφάσισε να ασχοληθεί με την έρευνα για την τεχνητή νοημοσύνη, πήρε 10.000 τσιπ Nvidia και συγκέντρωσε μια ομάδα νέων, φιλόδοξων ταλέντων. Δύο χρόνια αργότερα, η DeepSeek έκανε την έκρηξη μπροστά στα μάτια όλων μας.Στις 20 Ιανουαρίου, η DeepSeek, ένα σχετικά άγνωστο ερευνητικό εργαστήριο τεχνητής νοημοσύνης στην Κίνα, κυκλοφόρησε ένα μοντέλο ανοιχτού κώδικα που έγινε γρήγορα το αντικείμενο συζήτησης στη Silicon Valley. Σύμφωνα με άρθρο που συντάχθηκε από την εταιρεία, η DeepSeek-R1 ξεπερνά τα κορυφαία μοντέλα του κλάδου, όπως το OpenAI o1, σε πολλά μαθηματικά και συλλογιστικά σημεία αναφοράς. Στην πραγματικότητα, σε πολλές μετρήσεις που έχουν σημασία – ικανότητα, κόστος, διαφάνεια – η DeepSeek ανταγωνίζεται τους γίγαντες της Δυτικής Τεχνητής Νοημοσύνης επί ίσοις οροις.
Η επιτυχία της DeepSeek αποτελεί μια ακούσια έκβαση του τεχνολογικού ψυχρού πολέμου μεταξύ των ΗΠΑ και της Κίνας. Οι έλεγχοι των εξαγωγών των ΗΠΑ έχουν περιορίσει σοβαρά την ικανότητα των κινεζικών τεχνολογικών εταιρειών να ανταγωνίζονται στην τεχνητή νοημοσύνη με δυτικό τρόπο – δηλαδή κλιμακώνοντας απεριόριστα, αγοράζοντας περισσότερα τσιπ και εκπαιδεύοντας τα μοντέλα AI για μεγαλύτερο χρονικό διάστημα. Ως αποτέλεσμα, οι περισσότερες κινεζικές εταιρείες έχουν επικεντρωθεί στις υπάρχουσες εφαρμογές αντί να κατασκευάζουν τα δικά τους μοντέλα. Όμως με την τελευταία της κυκλοφορία, η DeepSeek αποδεικνύει ότι υπάρχει ένας άλλος τρόπος για να κερδίσει κανείς την κουρσα: ανανεώνοντας τη θεμελιώδη δομή των μοντέλων AI και χρησιμοποιώντας περιορισμένους πόρους πιο αποτελεσματικά.
«Σε αντίθεση με πολλές κινεζικές εταιρείες τεχνητής νοημοσύνης που βασίζονται, σε μεγάλο βαθμό, στην πρόσβαση σε προηγμένο υλικό, η DeepSeek έχει επικεντρωθεί στη μεγιστοποίηση της βελτιστοποίησης πόρων βάσει λογισμικού», εξηγεί η Marina Zhang, αναπληρώτρια καθηγήτρια στο Πανεπιστήμιο Τεχνολογίας του Σίδνεϊ, η οποία μελετά τις κινεζικές καινοτομίες. «Η DeepSeek έχει υιοθετήσει μεθόδους ανοιχτού κώδικα, συγκεντρώνοντας συλλογική τεχνογνωσία και ενισχύοντας τη συνεργατική καινοτομία. Αυτή η προσέγγιση όχι μόνο μετριάζει τους περιορισμούς πόρων, αλλά και επιταχύνει την ανάπτυξη τεχνολογιών αιχμής, ξεχωρίζοντας τη DeepSeek από τους υπόλοιπους ανταγωνιστές».
Ποιος κρύβεται λοιπόν πίσω από αυτή την startup της τεχνητής νοημοσύνης; Και γιατί ξαφνικά κυκλοφορεί ένα κορυφαίο μοντέλο στον κλάδο και το προσφέρει δωρεάν; Το WIRED μίλησε με ειδικούς στον κλάδο της τεχνητής νοημοσύνης της Κίνας και διάβασε λεπτομερείς συνεντεύξεις με τον ιδρυτή της DeepSeek Liang Wenfeng για να συνθέσει την ιστορία πίσω από τη μετεωρική άνοδο της εταιρείας.Ένα αστέρι αμοιβαίων κεφαλαίων κινδύνου στην ΚίναΑκόμη και στην κινεζική βιομηχανία AI, η DeepSeek είναι ένας αντισυμβατικός παίκτης. Ξεκίνησε ως Fire-Flyer, ένας κλάδος έρευνας βαθιάς μάθησης της High-Flyer, ενός από τα ποσοτικά αμοιβαία κεφάλαια κινδύνου της Κίνας με τις καλύτερες επιδόσεις. Ιδρύθηκε το 2015, αναδείχθηκε γρήγορα στην Κίνα, και έγινε το πρώτο ποσοτικό αμοιβαίο κεφάλαιο κινδύνου που συγκέντρωσε πάνω από 100 δισεκατομμύρια RMB (περίπου 15 δις δολ). Από το 2021, ο αριθμός έχει πέσει σε περίπου 8 δις δολ, αν και το High-Flyer παραμένει ένα από τα πιο σημαντικά ποσοτικά αμοιβαία κεφάλαια κινδύνου στη χώρα.
βοήθησε στη δημιουργία μιας συνεργατικής εταιρικής κουλτούρας όπου οι άνθρωποι ήταν ελεύθεροι να χρησιμοποιούν άφθονους υπολογιστικούς πόρους για να συνεχίσουν ανορθόδοξα ερευνητικά έργα. Είναι ένας εντελώς διαφορετικός τρόπος λειτουργίας από καθιερωμένες εταιρείες Διαδικτύου στην Κίνα, όπου οι ομάδες συχνά ανταγωνίζονται για πόρους. Ένα πρόσφατο παράδειγμα: Η ByteDance κατηγόρησε έναν πρώην ασκούμενο – έναν επιστημονα κύρους με ακαδημαϊκα βραβεία – ότι σαμποτάρισε τη δουλειά των συναδέλφων του προκειμένου να προσελκύσει περισσότερους πόρους για την ομάδα του.
Ο Liang είπε ότι οι φοιτητές μπορεί να είναι πιο κατάλληλοι για έρευνα με υψηλές επενδύσεις και χαμηλά κέρδη. «Οι περισσότεροι άνθρωποι, όταν είναι νέοι, μπορούν να αφοσιωθούν πλήρως σε μια αποστολή χωρίς ωφελιμιστικούς λόγους», εξήγησε. Η πρότασή του στους υποψήφιους για πρόσληψη ήταν ότι η DeepSeek δημιουργήθηκε για να «απαντησει τις πιο δύσκολες ερωτήσεις στον κόσμο».Το γεγονός ότι αυτοί οι νέοι ερευνητές είναι σχεδόν εξ ολοκλήρου μορφωμένοι στην Κίνα ενισχύει την ορμή τους, λένε οι ειδικοί. «Αυτή η νεότερη γενιά καθοδηγείται επίσης από ένα αίσθημα πατριωτισμού, ιδιαίτερα καθώς συνειδητοποιεί τους περιορισμούς των ΗΠΑ σε σημείο ασφυξίας σε κρίσιμες τεχνολογίες υλικού και λογισμικού», εξηγεί η Zhang. «Η αποφασιστικότητά τους να ξεπεράσουν αυτά τα εμπόδια αντανακλά όχι μόνο την προσωπική φιλοδοξία αλλά και μια ευρύτερη δέσμευση για την προώθηση της θέσης της Κίνας ως παγκόσμιου ηγέτη στην καινοτομία».
ελέγχους εξαγωγών των ΗΠΑ που επικεντρώνονται στη δημιουργία σημείων συμφόρησης στους υπολογιστικούς πόρους. «Οι υπάρχουσες εκτιμήσεις για το πόση υπολογιστική ισχύ τεχνητής νοημοσύνης έχει η Κίνα και τι μπορούν να επιτύχουν με αυτήν, θα μπορούσαν να ανατραπούν», καταλήγει η Chang.
Wired