ChatGPT της OpenAI / συζήτηση για την τεχνητή νοημοσύνη (AI)

1734728144422.png

1734728165325.png


ΓΟΥΑΤΤΤ τι φασηη o3 μοντελο??
αν όλα αυτά τα κάνει στο 4 μοντέλο, τι θα γίνει με τα αντιστοιχα 5 o1 και 5 o3?



Όταν βγήκε το ChatGPT το Νοέμβριο του 2022, πολλοί έσπευσαν να κάνουν λόγο για μια απλή "μηχανή λογοκλοπής". Μπορεί να περνούσε π.χ. εξετάσεις δικηγορικού συλλόγου, αλλά "με παπαγαλία όλα γίνονται".
Λίγους μήνες αργότερα, δημοσιεύτηκε η έκδοση GPT-4, και μια σειρά από ενδελεχή τεστ, έδειξαν ότι σε ένα βαθμό, το σύστημα είχε αναπτύξει δημιουργική και ευέλικτη σκέψη, εκτός της παπαγαλίας από το αχανές υλικό που είχε διαβάσει.
Ο σκεπτικισμός συνέχισε από αρκετούς. "Και πώς μπορεί ένα μηχάνημα που προβλέπει λέξεις να σκέφτεται;" Και όμως, το ένα τεστ μετά το άλλο, αποδείκνυε εκπληκτικές δυνατότητες στα περισσότερα είδη νοητικής εργασίας.
Η πρόοδος που ακολούθησε αφορούσε κυρίως μείωση κόστους και βελτίωση σε ορισμένα σημεία των μοντέλων, χωρίς όμως την ίδια ραγδαία βελτίωση ευφυΐας που είχε παρατηρηθεί προηγουμένως. Το να μεγαλώνει κανείς όλο και περισσότερο τον "εγκέφαλο των μοντέλων" προσέφερε λιγότερο, καθώς ήδη τα προηγούμενα μοντέλα είχαν μπορέσει να μελετήσουν σχεδόν το σύνολο της υπάρχουσας ανθρώπινης πληροφορίας.
Σύντομα όμως προέκυψε η επόμενη καινοτομία, στην εξής λογική: όσο έξυπνος και αν είναι κάποιος, μην περιμένεις να σου λύσει τα δυσκολότερα προβλήματα αν δε καθίσει κάτω να σκεφτεί αναλυτικά, και να δοκιμάσει διαφορετικές προσεγγίσεις προτού φτάσει σε συμπέρασμα.
Έτσι γεννήθηκε η σειρά o1 των GPT μοντέλων, συστήματα που σκέφτονται ελεύθερα επί ώρα προτού απαντήσουν. Στην πρώτη εικόνα κάτω μπορείτε να δείτε ενδεικτικά ένα πρόσφατο αποτέλεσμα αυτής της προσέγγισης, που σόκαρε τον γιατρό του Χάρβαντ που έτρεχε σχετική έρευνα.
Ήδη το GPT-4 φαινόταν ελαφρώς καλύτερο του μέσου γιατρού στην κριτική αξιολόγηση δύσκολων ιατρικών περιστατικών. Αλλά η προκαταρκτική έκδοση του o1 υπερέβη προσδοκίες: από το σκορ ~35% των γιατρών, εκτινάχθηκε στο ~85%. Και μάλιστα, η ικανότητά του δε μειωνόταν όταν εξεταζόταν σε υλικό που είχε δημοσιευτεί μόνο μετά τη βασική του εκπαίδευση.
Πριν λίγο λοιπόν, παρουσιάστηκαν οι πρώτες επιδόσεις της επόμενης γενιάς των "σκεπτόμενων μοντέλων", με την ονομασία o3 (το όνομα 2 προσπεράστηκε λόγω κωλυμάτων copyright).
Καταρχάς, απέναντι στις περισσότερες εκτιμήσεις, το o3 μπόρεσε τελικά να αγγίξει σκορ 88% στο ARC, το πλέον απαιτητικό τεστ ευέλικτης λογικής για τα ΑΙ. Τέτοιου επιπέδου σκορ θεωρείται ένα απαιτούμενο χαρακτηριστικό μιας Γενικής Τεχνητής Νοημοσύνης (AGI), το θεωρητικό σύστημα που θα μπορούσε να σκέφτεται όσο ευέλικτα και ένας άνθρωπος. Πέρσι, το GPT-4 έφτανε μόνο το 7%.
Πριν λίγους μήνες, κορυφαίοι μαθηματικοί διεθνώς δημοσίευσαν μια σειρά από τεστ, που θεωρούσαν απλησίαστα για τα ΑΙ (σκορ των καλύτερων ΑΙ στο 0% με 2%). Ειδικοί μαθηματικοί χρειάζονταν από ώρες, σε μέρες, έως αδυνατούσαν να λύσουν τα περισσότερα προβλήματα. Όταν όμως το o3 σκέφτεται για ώρες, λύνει μέχρι και το 25% των προβλημάτων.
Ένα άλλο κορυφαίο τεστ, αυτή τη φορά στις θετικές επιστήμες, ονομάζεται GPQA Diamond, και περιέχει προβλήματα που απαιτούν βαθιά επιστημονική κατάρτιση, και δε μπορούν να λυθούν με απλές αναζητήσεις τύπου Google. Ο μέσος ειδικός σκόραρε περίπου 70% στο πεδίο του, αλλά το o3, στο μέγιστο χρόνο σκέψης, άγγιζε το 88%.
Θυμηθείτε, αυτά τα άλματα έγιναν με αστραπιαία ταχύτητα μέσα σε μόλις 2 χρόνια.
 
Τελευταία επεξεργασία:
Ό,τι επάγγελμα αντικαθιστούν οι μηχανές πάντα συμβαίνει για βελτίωση της αποδοτικότητας και της ανόδου της ποιότητας ζωής και του βιοτικού επιπέδου.
Αυτο Πέτρο είναι συστημικός μύθος. Η άνοδος αυτή θα υφίστατο αν οι άνθρωποι ήταν σήμερα πιο ευτυχισμένοι απ ότι πριν 50 χρόνια. Θα ίσχυε αν, παράλληλα με τη τεχνολογική πρόοδο, άλλαζε και το κοινωνικό σύστημα γύρω απο την αναγκαστική εργασία. Αφου πλέον οι μηχανές μπορούν να κάνουν σχεδόν τα παντα. Ομως, οπως βλέπεις, προς το παρόν, περα απο ενα μόνο (κυριολεκτικά) βιβλιαράκι παγκοσμίως, δεν υπάρχει ούτε ίχνος τέτοιας αλλαγής στον ορίζοντα.
 
Το γεγονός οτι προσπάθησαν να αποτρέψουν τους Κινέζους απο το να αναπτύξουν προχωρημένη AI και εκείνοι τους ξευτίλισαν είναι πραγματικά κωμικό, και το ακόμα καλύτερο οτι είναι open source. Και on top of that, οι Κινέζοι είπαν βρε δεν γαμιέστε, και σταματήσαν την παροχή σπάνιων γαιών στις ΗΠΑ...χημικά στοιχεία χρήσιμα για την παραγωγή υψηλής τεχνολογίας, απο ηλεκτρονικά, ηλεκτρικούς κινητήρες ως μαχητικά αεροσκάφη και όχι μόνο. No wonder που γλυκοκοιτάζει ο Trump την Γροιλανδία ξαφνικά...

Είχαν την εντύπωση πως απλά θα σκάνε κυρώσεις μέχρι να σβήσει ο ήλιος και οι υπόλοιποι απλώς θα κοιτούσαν. Εν τέλει τους απομόνωσαν και πλέον Ρωσία, Ιράν, Β.Κορέα & Κίνα θα αναπτύσσουν συνεχώς πιο στενούς δεσμούς στην ανάπτυξη τεχνολογίας.
 
οτι είναι open source.
το οτι ορισμένοι δεν καταλαβαίνουν ούτε αυτό μπορεί να με τρελάνε, φίλε γ@μα την Κίνα μπορείς να το κατεβάσεις στο pc σου και να το χεις locally
δηλαδή ήμαρτον να λένε απλά για να λένε

Πολύ χάρηκα που πήρε τον κατήφορο η μετοχή της nvidia πρώτον για την αλαζονεία δεύτερον καθώς πλέον αποσυνδέεται η ενέργεια και τα resources με την ανάπτυξη του ΑΙ. Ή τουλάχιστον δεν μιλάμε για απόλυτα γραμμική σχέση
 
το οτι ορισμένοι δεν καταλαβαίνουν ούτε αυτό μπορεί να με τρελάνε, φίλε γ@μα την Κίνα μπορείς να το κατεβάσεις στο pc σου και να το χεις locally
δηλαδή ήμαρτον να λένε απλά για να λένε

Πολύ χάρηκα που πήρε τον κατήφορο η μετοχή της nvidia πρώτον για την αλαζονεία δεύτερον καθώς πλέον αποσυνδέεται η ενέργεια και τα resources με την ανάπτυξη του ΑΙ. Ή τουλάχιστον δεν μιλάμε για απόλυτα γραμμική σχέση
Μέχρι στιγμής απο τα πιο καυλωτικά τεχνολογικά νέα της χρονιάς ! Καλύτερο και μακράν πιο οικονομικό και πιο αποδοτικό, και όχι μόνο αυτό...αλλά και με τρομερή ευελιξία και διαφάνεια σε μηδενικό κόστος. Τι άλλο να ζητήσει κανείς ;
 
Μέχρι στιγμής απο τα πιο καυλωτικά τεχνολογικά νέα της χρονιάς ! Καλύτερο και μακράν πιο οικονομικό και πιο αποδοτικό, και όχι μόνο αυτό...αλλά και με τρομερή ευελιξία και διαφάνεια σε μηδενικό κόστος. Τι άλλο να ζητήσει κανείς ;
suck it up murican gatekeepers
 
Τι έγινε βρε παιδιά με Κίνα και ai, ρίξτε κάνα link. :)
 
Τι έγινε βρε παιδιά με Κίνα και ai, ρίξτε κάνα link. :)
 
Είσαστε σίγουροι για τον ενθουσιασμό; Δεν βλέπω κάτι πρωτοποριακο. Ας πούμε πάνω σε τι δεδομένα εκπαιδεύει το μοντελο; Τα τσιπακια Nvidia A100 σύντομα θα είναι παλιά. Εφόσον ισχυρι ακόμα ο περιορισμος, θα μείνουν πίσω σε σύγκριση με τη δυση (chatgpt).


Είστε σίγουροι ότι είναι καλύτερο από το o1 το επι πληρωμή;
 
1000055828.jpg
 
εγω που το δοκιμασα το ιδιο πραγμα μου φαινεται . Απανταει ισως πιο γρηγορα
 

Δυστυχώς αυτή η εικόνα δείχνει την κατάντια της Ευρώπης. Την ώρα που χώρες όπως οι ΗΠΑ, Κίνα, και Ιαπωνία παλεύουν να κυριαρχήσουν στην παγκόσμια τεχνολογική σκηνή, η Ευρώπη ασχολείται με ανούσια πράγματα τα οποία ούτε βελτιώνουν την ζωή μας ούτε παράγουν χρήμα. Δεν είναι τυχαίο που όλες οι μεγάλες εταιρείες τεχνολογίας της Ευρώπης, οι οποίες κυριάρχησαν την περίοδο 1990-2010, κατέρρευσαν και αφανίστηκαν από την αγορά.

Τώρα όσο αφορά το νέο AI platform, καλό είναι να υπάρχει ανταγωνισμός. Όμως ως οπαδός των ΗΠΑ θα παραμείνω πιστός στην Open AI. 🙂🙂🇺🇸🇺🇸
 
η Ευρώπη έχει μείνει πάρα πολύ πίσω στο ΑΙ, δεν ξέρω καν αν υπάρχει κάποια χρηματοδότηση για την έρευνα.
Γνωστους που έχω που κάνουν έρευνα πάνω σε αυτό οι χρηματοδοτήσεις τους απο προγράμματα κόπηκαν στα μισά.
Αιώνες πίσω και απλά θα αναγκαστούμε να τα πάρουμε αίτημα απο κάποια μαμά (τις ΗΠΑ προφανώς) δημιουργώντας άλλη μια σχέση εξάρτησης
 
το δοκίμασε κάποιος σε κώδικα να μας πεί feedback; εγώ δε γράφω κώδικα πλέον και δεν έχω κανα σοβαρό task
 
δεν ξερω , ποσα μοντελα εχει και πως τα αλλαζω ;
Ερωτησεις ιατρικης - φυσιολογιας του κανω , μια χαρα απανταει
θα προτεινα σε κατι πιο τεχνικο πχ μαθηματικά φυσικη κωδικα
στο chatgpt εχει 4o και o1
ιδανικα σε o1 να συγκρινεις απαντησεις
το o1 ειναι ο,τι καλυτερο υπαρχει (περα απο το απλησιαστο οικονομικα o1 pro βεβαια)
παντως στα της ιατρικης θα προτεινα να ανεβασεις εικονα πχ μαγνητικη εγκεφαλου και να ρωτησεις διαγνωση
επειδη στην ιατρικη ολα ειναι θεωρητικα με κειμενο σε φυσικη γλωσσα, ειναι ευκολο task πιστευω
 
θα προτεινα σε κατι πιο τεχνικο πχ μαθηματικά φυσικη κωδικα
στο chatgpt εχει 4o και o1
ιδανικα σε o1 να συγκρινεις απαντησεις
το o1 ειναι ο,τι καλυτερο υπαρχει (περα απο το απλησιαστο οικονομικα o1 pro βεβαια)
παντως στα της ιατρικης θα προτεινα να ανεβασεις εικονα πχ μαγνητικη εγκεφαλου και να ρωτησεις διαγνωση
επειδη στην ιατρικη ολα ειναι θεωρητικα με κειμενο σε φυσικη γλωσσα, ειναι ευκολο task πιστευω
Το chat gpt που του ζητουσα να μου αναγνωρισει δομες - εικονες με βελακια , δεν μπορουσε τιποτα να βρει . Θα το δοκιμασω και εδω καποια στιγμη αλλα μετα απο αυτα που ειδα στο chat gpt δεν εχω προσδοκιες για εικονες
 
Ακριβώς λόγω των τεχνολογικών περιορισμών των ΗΠΑ κατά της Κίνας στο hardware, οι Κινέζοι αναγκάστηκαν να επενδύσουν σε έρευνα πανω στο software και σε αλγοριθμικες τεχνικές. Ως αποτέλεσμα, το DeepSeek-R1 εκπαιδεύτηκε και λειτουργεί πραγματικά πολύ φτηνότερα και πολύ πιο αποδοτικά. Το δε εκπληκτικό είναι πως το μοντέλο είναι Ανοιχτού Κώδικα, που σημαίνει πως λόγω των χαμηλότερων πόρων που απαιτεί, μπορούμε θεωρητικά να το τρέχουμε και τοπικά εκτός σύνδεσης, αποφεύγοντας τυχόν περιορισμούς που επιβάλλει ο δημιουργός. Ο ανταγωνισμός θα αναγκάσει την OpenAI να μην επαναπαυθεί ως μονοπώλιο , κάτι που λογικά θα οφελήσει εν τέλει εμάς τους χρήστες.
 
Τελευταία επεξεργασία:

Χρήστες Βρείτε παρόμοια

Back
Top