Ένα νέο, φθηνό κινεζικό μοντέλο τεχνητής νοημοσύνης πλησιάζει τις Anthropic και OpenAI στην έδρα τους
- Κατηγορία ΤΕΧΝΟΛΟΓΙΑ
- 0 σχόλια
ΠΕΚΙΝΟ/ΜΠΕΝΓΚΑΛΟΥΡΟΥ, 2 Ιουλίου (Reuters) - Από τότε που το DeepSeek σόκαρε τις αγορές στις αρχές του περασμένου έτους με το φθηνό αλλά ισχυρό μοντέλο τεχνητής νοημοσύνης, οι παγκόσμιοι καταναλωτές έχουν βρεθεί αντιμέτωποι με μια επιλογή: Κινεζικές προσφορές με χαμηλότερες τιμές και λιγότερες δυνατότητες ή OpenAI ή Anthropic, οι οποίες έχουν επενδύσει δισεκατομμύρια στην ανάπτυξη.
Ένα μοντέλο που ονομάζεται GLM-5.2 , το οποίο κυκλοφόρησε τον περασμένο μήνα από την νεοσύστατη εταιρεία Z.ai με έδρα το Πεκίνο, μπορεί τελικά να κλείσει αυτό το κενό όσον αφορά το δυτικό ενδιαφέρον.
Το GLM-5.2 έχει κάνει την Silicon Valley να βουίζει με τις δυνατότητες κωδικοποίησης και πρακτόρων του, ή την ικανότητα εκτέλεσης σύνθετων εργασιών με ελάχιστη προτροπή, που σχεδόν ανταγωνίζονται τις κορυφαίες αμερικανικές προσφορές σε ένα κλάσμα του κόστους, σε αυτό που ορισμένοι ειδικοί αποκαλούν «μίνι στιγμή DeepSeek».
Έχει αναρριχηθεί γρήγορα στους πίνακες χρήσης σε πλατφόρμες ανάπτυξης τεχνητής νοημοσύνης τρίτων κατασκευαστών όπως το OpenRouter, όπου πλέον κατατάσσεται πάνω από τα μοντέλα της Anthropic, ενώ στελέχη από τον Διευθύνοντα Σύμβουλο της πλατφόρμας δεδομένων cloud Snowflake, Sridhar Ramaswamy, έως τον επενδυτή επιχειρηματικών κεφαλαίων Marc Andreessen, έχουν επαινέσει τις ικανότητές του.
«Έχουμε τώρα ένα κινεζικό μοντέλο ανοιχτού βάρους που είναι τόσο καλό όσο τα διαθέσιμα μοντέλα από την OpenAI και την Anthropic», δήλωσε ο David Sacks, πρώην επικεφαλής της τεχνητής νοημοσύνης του προέδρου των ΗΠΑ, Donald Trump, την περασμένη εβδομάδα, προτού η Ουάσινγκτον άρει τους περιορισμούς στα μοντέλα Fable και Mythos της Anthropic την Τρίτη.
Αυτές οι δυνατότητες έχουν θέσει το μοντέλο GLM-5.2 της Z.ai στο επίκεντρο μιας αυξανόμενης συζήτησης σχετικά με το αν η Κίνα φτάνει τελικά τις ΗΠΑ στον αγώνα της Τεχνητής Νοημοσύνης, καθώς στελέχη τεχνολογίας προειδοποιούν ότι η απρόβλεπτη ρύθμιση του κλάδου από την Ουάσινγκτον κινδυνεύει να παρεμποδίσει την πρωτοπορία της στην τεχνολογία αιχμής.
«Είναι μόλις ένα τικ κάτω από το Opus 4.8 (από την Anthropic) και ακριβώς εκεί πάνω με το GPT 5.5 (από την OpenAI)», είπε ο Sacks για το GLM-5.2 στο podcast All-In, προσθέτοντας ότι «δεν έχουμε την πολυτέλεια να κάνουμε πράγματα που επιβραδύνουν τις εταιρείες μας».
Οι ανθρωπικοί περιορισμοί και η καθυστερημένη δημόσια κυκλοφορία του τελευταίου μοντέλου GPT-5.6 της OpenAI έχουν τροφοδοτήσει την παγκόσμια ζήτηση για το κινεζικό μοντέλο, ανέφεραν ορισμένοι ειδικοί.
«Η διεθνής κοινότητα προγραμματιστών συνειδητοποιεί ολοένα και περισσότερο ότι η αποκλειστική εξάρτηση από ιδιόκτητα μοντέλα API με έδρα τις ΗΠΑ ενέχει σημαντικό κίνδυνο», δήλωσε ο Brian Tse, ιδρυτής και διευθύνων σύμβουλος της Concordia AI, μιας συμβουλευτικής εταιρείας με έδρα το Πεκίνο που επικεντρώνεται στην ασφάλεια της Τεχνητής Νοημοσύνης.
Η θετική παγκόσμια υποδοχή του GLM-5.2 υποδηλώνει επίσης αυξημένο ενδιαφέρον για φθηνότερη ανάπτυξη ανοιχτού κώδικα, επειδή οι επιχειρήσεις πλήττονται από το αυξανόμενο και συχνά απρόβλεπτο κόστος χρήσης της Τεχνητής Νοημοσύνης για την ολοκλήρωση εργασιών, καθώς τα εργαλεία Τεχνητής Νοημοσύνης κλειστού κώδικα καταναλώνουν περισσότερα tokens, τις μονάδες που χρησιμοποιούνται για τη μέτρηση της χρήσης της Τεχνητής Νοημοσύνης.
Η Z.ai, επίσης γνωστή ως Zhipu AI, αρνήθηκε να σχολιάσει. Οι Anthropic και OpenAI δεν απάντησαν αμέσως σε αιτήματα για σχολιασμό.
Το GLM-5.2 κατέχει επί του παρόντος την πέμπτη θέση στον πίνακα κατάταξης ευφυΐας μεγάλου γλωσσικού μοντέλου (LLM) της Artificial Analysis, ο οποίος κατατάσσει την απόδοση σε μια σειρά από σημεία αναφοράς που έχουν σχεδιαστεί για να μετρούν τη συνολική ικανότητα, συμπεριλαμβανομένων των δεξιοτήτων συλλογισμού και κωδικοποίησης. Και βρίσκεται στη δεύτερη θέση στις κατατάξεις κωδικοποίησης front-end της Code Arena, μετρώντας πόσο καλά τα μοντέλα δημιουργούν ιστότοπους και εφαρμογές front-end, ενώ λειτουργεί με περίπου το ένα έκτο του κόστους των κλειστών μοντέλων των ΗΠΑ, όπως το Claude και η σειρά GPT.
Η Z.ai δεν έχει αποκαλύψει πόσα χρήματα δαπάνησε για την ανάπτυξη του GLM-5.2.
Σε απάντηση στον Elon Musk στο X τον περασμένο μήνα, ο ιδρυτής της Z.ai, Tang Jie, δήλωσε ότι η κινεζική startup θα μπορούσε να παράγει ένα μοντέλο εφάμιλλο με το Fable της Anthropic πριν από το πρώτο τρίμηνο του επόμενου έτους.
«Η αλλαγή που φέρνει το GLM-5.2 είναι ότι το μοντέλο ανοιχτού κώδικα έχει γίνει ένα προϊόν plug-and-play, έτοιμο για χρήση», δήλωσε ο Tiezhen Wang, πρώην επικεφαλής της περιοχής Ασίας-Ειρηνικού στην Hugging Face, μια νεοσύστατη επιχείρηση που λειτουργεί ως κόμβος για προγραμματιστές που πειραματίζονται με μοντέλα ανοιχτού κώδικα.
«Απλώς αναπτύσσετε το μοντέλο και χωρίς να κάνετε σύνθετα συστήματα βελτίωσης, βρίσκεται σε μια εξαιρετικά εύχρηστη και έτοιμη προς χρήση κατάσταση. Αυτό μειώνει δραστικά το εμπόδιο εισόδου για την υιοθέτηση του ανοιχτού κώδικα.»
Ένα σημαντικό εμπόδιο για την ευρεία υιοθέτηση του GLM-5.2 παραμένει η ανησυχία για την ασφάλεια των δεδομένων, η οποία έχει περιορίσει τη χρήση κινεζικών μοντέλων από τις αμερικανικές επιχειρήσεις, ιδίως σε ρυθμιζόμενους κλάδους όπως οι τραπεζικές συναλλαγές και η κυβερνοασφάλεια. Η μετεγκατάσταση και η αναβάθμιση των συστημάτων τεχνητής νοημοσύνης των επιχειρήσεων διαρκεί συνήθως αρκετούς μήνες, δήλωσε ο Wang.
«Έχω δει κάποια συζήτηση μεταξύ ευρωπαϊκών εταιρειών σχετικά με το εάν θα μπορούσε να χρησιμοποιηθεί σε επιχειρηματικά περιβάλλοντα», δήλωσε ο Wei Sun, κύριος αναλυτής Τεχνητής Νοημοσύνης στην Counterpoint Research.
«Στην ΕΕ και τις ΗΠΑ, ορισμένοι πελάτες, συνεργάτες και ρυθμιζόμενες βιομηχανίες ενδέχεται απλώς να μην είναι πρόθυμοι να δεχτούν κινεζικά μοντέλα στη στοίβα τεχνητής νοημοσύνης τους, ανεξάρτητα από την τεχνική απόδοση ή την τιμή.»
Μια έκθεση νωρίτερα φέτος από τον μη κερδοσκοπικό οργανισμό RAND, ανοίγει νέα καρτέλα, με βάση δεδομένα επισκεψιμότητας ιστοσελίδων σε 135 χώρες, διαπίστωσε ότι το παγκόσμιο μερίδιο αγοράς των Κινέζων LLM αυξήθηκε στο 13% από 3% τους δύο μήνες μετά την κυκλοφορία του μοντέλου R1 από την DeepSeek τον Ιανουάριο του περασμένου έτους. Η κυκλοφορία πυροδότησε μια παγκόσμια τεχνολογική πώληση επειδή αντιπαρέβαλε το χαμηλό κόστος του DeepSeek με τις τεράστιες δαπάνες για υποδομές τεχνητής νοημοσύνης αλλού.
Τα κέρδη από τη χρήση του LLM στην Κίνα ήταν πιο έντονα στις αναπτυσσόμενες χώρες και σε εκείνες που έχουν στενούς πολιτικούς και οικονομικούς δεσμούς με το Πεκίνο.
Ορισμένοι ειδικοί δήλωσαν ότι οι ανησυχίες σχετικά με την ασφάλεια των κινεζικών μοντέλων τεχνητής νοημοσύνης ήταν υπερβολικές, υποστηρίζοντας ότι η λειτουργία τους σε αμερικανικούς παρόχους cloud ή σε δικούς τους διακομιστές μιας εταιρείας διασφάλιζε την ασφάλεια των δεδομένων. Ενώ οι μεγάλες εταιρείες αργούν να μεταναστεύσουν, οι νεοσύστατες τεχνολογικές επιχειρήσεις και οι μικρές και μεσαίες επιχειρήσεις κινούνται πολύ πιο γρήγορα.
«Οι προγραμματιστές τείνουν να ενδιαφέρονται λιγότερο για την προέλευση ενός μοντέλου και περισσότερο για το αν λειτουργεί, πόσο κοστίζει και αν μπορούν να το αναπτύξουν ή να έχουν πρόσβαση σε αυτό με αξιοπιστία», δήλωσε ο Poe Zhao, αναλυτής τεχνολογίας για την Κίνα και ιδρυτής του ενημερωτικού δελτίου Hello China Tech.
«Το πιθανό μοτίβο είναι η μερική δρομολόγηση, όχι η αντικατάσταση του OpenAI ή του Anthropic από τη μια μέρα στην άλλη. Οπότε ναι, είναι μια μικρή στιγμή DeepSeek, αλλά με μια πιο στενή, προγραμματιστικά επικεντρωμένη έννοια.»