ChatGPT V4 ייסיז די באַר, SATs און קענען ידענטיפיצירן עקספּלויץ אין ETH קאַנטראַקץ

GPT-4, די לעצטע ווערסיע פון ​​​​די קינסטלעך ינטעלליגענסע (AI) טשאַטבאָט, ChatGPT, קענען דורכגיין הויך שולע טעסץ און געזעץ שולע יגזאַמז מיט סקאָרז ראַנגקט אין די 90 פּראָצענטיל און האט נייַע פּראַסעסינג קייפּאַבילאַטיז וואָס זענען נישט מעגלעך מיט די פריערדיקע ווערסיע.

די פיגיערז פון די טעסט סקאָרז פון GPT-4 זענען שערד אויף 14 מער דורך זיין באשעפער OpenAI ריווילינג עס קענען אויך גער בילד, אַודיאָ און ווידעא ינפּוץ צו טעקסט אין אַדישאַן צו האַנדלינג "פיל מער נואַנסט ינסטראַקשאַנז" מער קריייטיוולי און רילייאַבלי.

"עס פּאַסיז אַ סימיאַלייטיד באַר יגזאַם מיט אַ כעזשבן אַרום די שפּיץ 10% פון פּרובירן טייקערז," OpenAI צוגעגעבן. "אין קאַנטראַסט, די כעזשבן פון GPT-3.5 איז געווען אַרום די דנאָ 10%."

די פיגיערז ווייַזן אַז GPT-4 אַטשיווד אַ כעזשבן פון 163 אין די 88 פּראָצענטיל אויף די LSAT יגזאַם - די פּראָבע קאָלעגע סטודענטן דאַרפֿן צו פאָרן אין די פאַרייניקטע שטאַטן צו זיין אַדמיטאַד אין געזעץ שולע.

יגזאַם רעזולטאַטן פון GPT-4 און GPT-3.5 אויף אַ קייט פון לעצטע יו. עס. יגזאַמז. מקור: OpenAI

די כעזשבן פון GPT4 וואָלט שטעלן עס אין אַ גוטע שטעלע צו זיין אַדמיטאַד אין אַ שפּיץ 20 געזעץ שולע און איז בלויז אַ ביסל מאַרקס פון די רעפּאָרטעד סקאָרז וואָס זענען דארף פֿאַר אַקסעפּטאַנס צו פּרעסטידזשאַס שולן אַזאַ ווי האַרוואַרד, סטאַנפֿאָרד, פּרינסטאַן אָדער ייל.

די פריערדיקע ווערסיע פון ​​​​ChatGPT האָט בלויז סקאָרד 149 אויף די LSAT ס שטעלן עס אין די דנאָ 40%.

GPT-4 האָט אויך סקאָרד 298 פון 400 אין די וניפאָרם באַר עקסאַם - אַ פּראָבע וואָס איז דורכגעקאָכט דורך לעצטנס גראַדזשאַווייטיד געזעץ סטודענטן וואָס דערלויבט זיי צו פיר ווי אַן אַדוואָקאַט אין קיין יו.

UBE סקאָרז דאַרפֿן צו זיין אַדמיטאַד צו פיר געזעץ אין יעדער יו. עס. דזשוריסדיקשאַן. מקור: נאַשאַנאַל קאָנפערענסע פון ​​באַר עקסאַמינערס

די אַלט ווערסיע פון ​​​​ChatGPT סטראַגאַלד אין דעם פּראָבע, ענדיקן אין די דנאָ 10% מיט אַ כעזשבן פון 213 פון 400.

ווי פֿאַר די SAT עווידענסע-באזירט לייענען און שרייבן און SAT מאַט יגזאַמז גענומען דורך יו הויך שולע סטודענטן צו מעסטן זייער קאָלעגע גרייטקייַט, GPT-4 סקאָרד אין די 93rd און 89th פּערסענטילע ריספּעקטיוולי.

GPT-4 יקסעלד אויך אין די "שווער" ססיענסעס, פּאָסטינג געזונט העכער דורכשניטלעך פּערסענטילע סקאָרז אין AP ביאָלאָגי (85-100%), כעמיע (71-88%) און פיזיק 2 (66-84%).

יגזאַם רעזולטאַטן פון GPT-4 און GPT-3.5 אויף אַ קייט פון לעצטע יו. עס. יגזאַמז. מקור: OpenAI.

אָבער זיין AP קאַלקולוס כעזשבן איז געווען פערלי דורכשניטלעך, ראַנגקט אין די 43 ר צו 59 פּראָצענט.

אן אנדער געגנט אין וואָס GPT-4 פעלנדיק איז געווען אין ענגליש ליטעראַטור יגזאַמז, פּאָסטינג סקאָרז אין די 8 צו 44 פּראָצענט אין צוויי באַזונדער טעסץ.

OpenAI האט געזאגט אַז GPT-4 און GPT-3.5 האָבן גענומען די טעסץ פֿון די 2022-2023 פיר יגזאַמז, און אַז "קיין ספּעציפיש טריינינג" איז געווען גענומען דורך די שפּראַך פּראַסעסינג מכשירים:

"מיר האָבן קיין ספּעציפיש טריינינג פֿאַר די יגזאַמז. א מינדערהייט פון די פּראָבלעמען אין די יגזאַמז איז געזען דורך די מאָדעל בעשאַס טריינינג, אָבער מיר גלויבן אַז די רעזולטאַטן זענען רעפּריזענאַטיוו.

די רעזולטאַטן פּראַמפּטיד מורא אין די טוויטטער קהל אויך.

פֿאַרבונדענע: ווי וועט ChatGPT ווירקן די וועב3 פּלאַץ? אינדוסטריע ענטפֿערס

Nick Almond, דער גרינדער פון FactoryDAO דערציילט זיין 14,300 טוויטטער אנהענגערס אויף 14 מער אַז GPT4 איז געגאנגען צו "יבערשרעקן מענטשן" און עס וועט "ייַנבראָך" די גלאבאלע בילדונג סיסטעם.

געוועזענער קאָינבאַסע דירעקטאָר, Conor Grogan, האט געזאגט אַז ער ינסערטאַד אַ לעבן עטהערעום סמאַרט קאָנטראַקט אין GPT-4 און גלייך שפּיציק צו עטלעכע "זיכערהייט וואַלנעראַביליטיז" און אַוטליינד ווי די קאָד קענען זיין עקספּלויטאַד:

פריער סמאַרט קאָנטראַקט אַדאַץ אויף ChatGPT געפונען אַז זיין ערשטער ווערסיע איז אויך טויגעוודיק צו געפֿינען קאָד באַגז צו אַ גלייַך גראַד.

Rowan Cheung, דער גרינדער פון אַי נוזלעטער "די רודאַון" שערד אַ ווידעא פון GPT טראַנסקריבינג אַ האַנט-געצויגן שווינדל וועבזייטל אויף אַ שטיק פון פּאַפּיר אין קאָד.