热搜词:

生成很强,推理很弱:GPT-4o的视觉短板

澶ф暟鎹�枃鎽樺嚭鍝�

濡傛灉璁〢I鐢讳竴鍙�嫍绔欏湪鈥滃乏杈光€濓紝浣嗕簨鍏堝憡璇夊畠鈥滃乏灏辨槸鍙斥€濓紝浣犺�寰楀畠鑳藉弽搴旇繃鏉ュ悧锛熸渶杩戯紝UCLA鐨勪竴椤规柊鐮旂┒鐢ㄤ竴绯诲垪绮惧績璁捐�鐨勫疄楠岋紝鎻�紑浜咷PT-4o鍦ㄥ浘鍍忕悊瑙e拰鎺ㄧ悊涓婄殑鐭�澘鈥斺€斿畠鐢诲緱婕備寒锛屽嵈鏈�繀鐪熸噦浣犵殑鎰忔€濄€�

璁烘枃涓荤嚎寰堢洿鎺ワ紝GPT-4o鐨勭敾鍥捐兘鍔涚‘瀹炴儕鑹筹紝浣嗙湡姝f秹鍙婄悊瑙e浘鍍忋€佽�澧冩帹鐞嗐€佸�姝ラ€昏緫閾炬潯鏃讹紝渚濈劧鏈夋槑鏄剧煭鏉裤€�

杩欒�鎴戞兂璧蜂簡鈥滅湅璧锋潵寰堜細锛屽疄闄呬笂杩樺樊鐐规剰鎬濃€濋偅绉岮I寰��鐨勫按灏�€�

鐓т緥锛屾垜鎶婁笁澶у疄楠岄儴鍒嗭紝涓€涓�竴涓�粰澶у�璇存竻妤氾紝甯屾湜甯︿綘浠�畬鏁存劅鍙椾笅锛岃繖娉㈢爺绌跺埌搴曞彂鐜颁簡浠€涔堛€�

01. 鍏ㄥ眬瑙勫垯閬靛惊澶辫触

鍏跺疄杩欎釜閮ㄥ垎鏈夌偣鎰忔€濓紝灏辩被浼兼垜浠�钩甯稿拰鏈嬪弸寮€鐜╃瑧锛氣€滀互鍚庢垜璇村乏鍏跺疄鏄�彸鍝︹€濓紝鐒跺悗鍐嶈�浠栤€滃線宸﹁蛋涓€姝モ€濓紝鐪嬩粬浼氫笉浼氱湡鐨勫線鍙宠蛋銆�

UCLA鐮旂┒鍛樼粰GPT-4o涓嬩簡绫讳技鐨勫�锛氣€滄帴涓嬫潵鈥榣eft鈥欓兘鎸団€榬ight鈥欌€濓紝鈥滄暟瀛楅兘瑕佸噺2鈥濓紝鐒跺悗鍐嶈�瀹冣€滅敾涓€鍙�嫍鍦ㄥ乏杈光€濓紝鈥滅敾5鍙�笩鈥濄€�

鏈�互涓篈I鑳戒妇涓€鍙嶄笁锛岀粨鏋溾€斺€�

鐙楄繕鏄�湪宸﹁竟锛岄笩杩樻槸5鍙�紝鍏ㄧ劧鏃犺�鍓嶉潰閲嶆柊瀹氫箟鐨勮�鍒欍€�

杩欒�鏄庝粈涔堬紵

GPT-4o鍦ㄥ浘鍍忕敓鎴愭椂锛岃繕鏄�瓧闈㈢悊瑙f寚浠わ紝鍏ㄥ眬閲嶅畾涔夈€佷笂鏂囪�瀹氭牴鏈�繘涓嶅埌瀹冪殑鈥滅敾鐢昏剳瀛愨€濋噷銆�

浣犳兂璁╁畠鈥滅伒娲诲彉閫氣€濓紝瀹冨嵈鍙�細鈥滃繝瀹炴墽琛岃〃闈⑩€濓紝杩欒窡浜虹被鐨勫皬鑱�槑姣旇繕宸�簡涓嶅皯銆�

02. 鍥惧儚缂栬緫锛氭祬灞傝�涔夌悊瑙f毚闇�

绗�簩閮ㄥ垎娴嬭瘯鏇存湁鎸戞垬鎬э紝鐮旂┒鍛樿�GPT-4o鍔ㄦ墜缂栬緫鍥剧墖銆�

姣斿�锛�

鈥滃彧鏀规按閲岀殑椹�€掑奖涓虹嫯瀛愶紝鍒�姩椹�湰浣撱€傗€�

缁撴灉AI涓€鍑烘墜锛岄┈鍜屽€掑奖鍏ㄥ彉浜嗐€�

鍐嶆瘮濡傦紝

鈥滃彧鍒犳帀鐢婚潰閲屽潗鐫€鐨勪汉銆傗€�

缁撴灉绔欑潃鐨勮儗鏅�汉涔熻�涓€閿呯�浜嗐€�

杩欎簺渚嬪瓙鐩存帴鏆撮湶浜嗕竴涓�棶棰橈細

GPT-4o瀵逛簬鈥滃眬閮ㄤ慨鏀光€濃€滆�涔夐檺瀹氣€濊繖绫讳换鍔★紝鏍规湰鎶婃彙涓嶄綇鍒嗗�銆�

瀹冩病娉曠簿纭�湴鍖哄垎鈥滃€掑奖鈥濅笌鈥滃疄浣撯€濄€佲€滃潗鐫€鈥濅笌鈥滅珯鐫€鈥濓紝鎿嶄綔缁忓父鈥滆繃鐘逛笉鍙娾€濓紝鍔ㄩ敊鍦版柟銆�

璇寸櫧浜嗭紝AI鐨勫浘鍍忕紪杈戠悊瑙o紝杩滄病杈惧埌鈥滀汉绫荤湅鍥俱€佺悊瑙e満鏅�€濈殑绮剧粏搴︺€�

鏈夌偣鍍忚�涓€涓�垰瀛︿細PS鐨勫皬鐧藉幓淇�浘锛屾病姒傚康锛岀函闈犵寽銆�

03. 澶氭�鎺ㄧ悊涓庢潯浠堕€昏緫锛氬交搴曟媺鑳�

鏈€鑷村懡鐨勭煭鏉匡紝鍑虹幇鍦ㄢ€滃�姝ユ帹鐞嗏€濆拰鈥滄潯浠跺垽鏂�€濈幆鑺傘€�

姣斿�锛�

鍏堝彨GPT-4o鐢讳竴鍙�嫍鍜屼竴鍙�尗锛岀劧鍚庡憡璇夊畠锛氣€滃�鏋滄病鏈夌尗锛屾妸鐙楁崲鎴愮尗骞舵惉鍒版捣婊┿€傗€�

浣嗗叾瀹炵�涓€寮犲浘鐚�凡缁忔湁浜嗐€�

鎸夌悊璇达紝杩欐椂鍊橝I搴旇�浠€涔堥兘涓嶆敼銆�

浣嗗畠杩樻槸鎶婄嫍鎹㈡垚鐚�紝杩樻妸鍦烘櫙鍏ㄦ惉浜嗏€斺€旀潯浠跺畬鍏ㄦ病鍒ゅ�锛岄€昏緫涔熶贡濂椼€�

绫讳技鐨勪緥瀛愯繕鏈夊緢澶氾紝AI缁忓父鎼炰笉娓呭�鏉傛潯浠讹紝鎴栬€呭共鑴嗏€滄瘡鏉℃寚浠ら兘鐓у仛鈥濓紝涓嶇�鍓嶅悗鏈夋病鏈夊啿绐併€�

杩欏嵃璇佷簡涓€涓�牳蹇冮棶棰橈細

GPT-4o涓嶅叿澶囦笂涓嬫枃鏁忔劅鐨勬帹鐞嗚兘鍔涳紝鏃犳硶鍦ㄥ�鏉傚浘鍍忕紪杈戜换鍔′腑杩涜�鏅鸿兘鍒ゆ柇銆�

瀹冨湪鈥滅悊瑙e墠鎻愨€旈€昏緫鍒ゆ柇鈥斿啀琛屽姩鈥濊繖涓�摼璺�笂锛屾槑鏄捐繕宸�竴澶ф埅銆�

鎬荤殑鏉ヨ�锛岀幇鍦ㄧ殑AI锛屾洿鍍忔槸涓�€滅簿鑷寸殑鎸囦护鏈哄櫒鈥濓紝浣犺�瀹冪敾浠€涔堝氨鐢讳粈涔堬紝浣嗚�璁╁畠鈥滅湅鎳傝�鍒欍€佽�鎳傚満鏅�€佷妇涓€鍙嶄笁鈥濓紝閭h繕鐪熷緱鍐嶈繘鍖栧嚑杞�€�

杩欎篃璁╂垜鎯宠捣锛孉I鍒氬�浼氱敓鎴愭枃瀛楅偅浼氬効锛屽ぇ瀹惰�寰楀畠鈥滆兘鍐欎細璇粹€濓紝浣嗕竴杩介棶缁嗚妭銆佽�瀹冪紪鏁呬簨銆佸渾閫昏緫锛岃繕鏄�細鍑哄ぇ澶у皬灏忕殑bug銆�

浠婂ぉ鐨凣PT-4o锛屽湪鍥剧墖棰嗗煙闈�复鐨勫洶澧冿紝鍏跺疄鍜屾浘缁忕殑鏂囨湰AI濡傚嚭涓€杈欙細

浼氱敾锛屼絾涓嶄竴瀹氫細鈥滅悊瑙b€濓紱鑳芥敼锛屼絾涓嶄竴瀹氳兘鈥滅簿鍑嗏€濓紱鑳藉惉鎸囦护锛屼絾涓嶄竴瀹氳兘鈥滀妇涓€鍙嶄笁鈥濄€� 杩欎篃璁告槸鎴戜滑涓庘€滅湡姝g悊瑙d笘鐣屸€濈殑AI涔嬮棿锛屾渶鍊煎緱璀︽儠銆佷篃鏈€浠や汉鏈熷緟鐨勯偅閬撳潕銆�

鎴栬�锛屼笅涓€娆℃妧鏈�獊鐮达紝灏变細浠庤繖閲屽紑濮嬨€� 浣嗚嚦灏戠幇鍦�紝鎴戜滑杩樻病鍒伴偅涓€姝ャ€�

via

https://the-decoder.com/gpt-4o-makes-beautiful-images-but-fails-basic-reasoning-tests-ucla-study-finds/

GPU绠楀姏鎸夐渶绉熺敤

A100/H100 GPU绠楀姏鎸夐渶绉熺敤锛�

绉掔骇璁¤垂锛屽钩鍧囪妭鐪佸紑鏀�30%浠ヤ笂锛�

鎵�爜浜嗚В璇︽儏鈽�