生成很强,推理很弱:GPT-4o的视觉短板
澶ф暟鎹�枃鎽樺嚭鍝�
濡傛灉璁〢I鐢讳竴鍙�嫍绔欏湪鈥滃乏杈光€濓紝浣嗕簨鍏堝憡璇夊畠鈥滃乏灏辨槸鍙斥€濓紝浣犺�寰楀畠鑳藉弽搴旇繃鏉ュ悧锛熸渶杩戯紝UCLA鐨勪竴椤规柊鐮旂┒鐢ㄤ竴绯诲垪绮惧績璁捐�鐨勫疄楠岋紝鎻�紑浜咷PT-4o鍦ㄥ浘鍍忕悊瑙e拰鎺ㄧ悊涓婄殑鐭�澘鈥斺€斿畠鐢诲緱婕備寒锛屽嵈鏈�繀鐪熸噦浣犵殑鎰忔€濄€�
璁烘枃涓荤嚎寰堢洿鎺ワ紝GPT-4o鐨勭敾鍥捐兘鍔涚‘瀹炴儕鑹筹紝浣嗙湡姝f秹鍙婄悊瑙e浘鍍忋€佽�澧冩帹鐞嗐€佸�姝ラ€昏緫閾炬潯鏃讹紝渚濈劧鏈夋槑鏄剧煭鏉裤€�
杩欒�鎴戞兂璧蜂簡鈥滅湅璧锋潵寰堜細锛屽疄闄呬笂杩樺樊鐐规剰鎬濃€濋偅绉岮I寰��鐨勫按灏�€�
鐓т緥锛屾垜鎶婁笁澶у疄楠岄儴鍒嗭紝涓€涓�竴涓�粰澶у�璇存竻妤氾紝甯屾湜甯︿綘浠�畬鏁存劅鍙椾笅锛岃繖娉㈢爺绌跺埌搴曞彂鐜颁簡浠€涔堛€�
01. 鍏ㄥ眬瑙勫垯閬靛惊澶辫触
鍏跺疄杩欎釜閮ㄥ垎鏈夌偣鎰忔€濓紝灏辩被浼兼垜浠�钩甯稿拰鏈嬪弸寮€鐜╃瑧锛氣€滀互鍚庢垜璇村乏鍏跺疄鏄�彸鍝︹€濓紝鐒跺悗鍐嶈�浠栤€滃線宸﹁蛋涓€姝モ€濓紝鐪嬩粬浼氫笉浼氱湡鐨勫線鍙宠蛋銆�
UCLA鐮旂┒鍛樼粰GPT-4o涓嬩簡绫讳技鐨勫�锛氣€滄帴涓嬫潵鈥榣eft鈥欓兘鎸団€榬ight鈥欌€濓紝鈥滄暟瀛楅兘瑕佸噺2鈥濓紝鐒跺悗鍐嶈�瀹冣€滅敾涓€鍙�嫍鍦ㄥ乏杈光€濓紝鈥滅敾5鍙�笩鈥濄€�
鏈�互涓篈I鑳戒妇涓€鍙嶄笁锛岀粨鏋溾€斺€�
鐙楄繕鏄�湪宸﹁竟锛岄笩杩樻槸5鍙�紝鍏ㄧ劧鏃犺�鍓嶉潰閲嶆柊瀹氫箟鐨勮�鍒欍€�
杩欒�鏄庝粈涔堬紵
GPT-4o鍦ㄥ浘鍍忕敓鎴愭椂锛岃繕鏄�瓧闈㈢悊瑙f寚浠わ紝鍏ㄥ眬閲嶅畾涔夈€佷笂鏂囪�瀹氭牴鏈�繘涓嶅埌瀹冪殑鈥滅敾鐢昏剳瀛愨€濋噷銆�
浣犳兂璁╁畠鈥滅伒娲诲彉閫氣€濓紝瀹冨嵈鍙�細鈥滃繝瀹炴墽琛岃〃闈⑩€濓紝杩欒窡浜虹被鐨勫皬鑱�槑姣旇繕宸�簡涓嶅皯銆�
02. 鍥惧儚缂栬緫锛氭祬灞傝�涔夌悊瑙f毚闇�
绗�簩閮ㄥ垎娴嬭瘯鏇存湁鎸戞垬鎬э紝鐮旂┒鍛樿�GPT-4o鍔ㄦ墜缂栬緫鍥剧墖銆�
姣斿�锛�
鈥滃彧鏀规按閲岀殑椹�€掑奖涓虹嫯瀛愶紝鍒�姩椹�湰浣撱€傗€�
缁撴灉AI涓€鍑烘墜锛岄┈鍜屽€掑奖鍏ㄥ彉浜嗐€�
鍐嶆瘮濡傦紝
鈥滃彧鍒犳帀鐢婚潰閲屽潗鐫€鐨勪汉銆傗€�
缁撴灉绔欑潃鐨勮儗鏅�汉涔熻�涓€閿呯�浜嗐€�
杩欎簺渚嬪瓙鐩存帴鏆撮湶浜嗕竴涓�棶棰橈細
GPT-4o瀵逛簬鈥滃眬閮ㄤ慨鏀光€濃€滆�涔夐檺瀹氣€濊繖绫讳换鍔★紝鏍规湰鎶婃彙涓嶄綇鍒嗗�銆�
瀹冩病娉曠簿纭�湴鍖哄垎鈥滃€掑奖鈥濅笌鈥滃疄浣撯€濄€佲€滃潗鐫€鈥濅笌鈥滅珯鐫€鈥濓紝鎿嶄綔缁忓父鈥滆繃鐘逛笉鍙娾€濓紝鍔ㄩ敊鍦版柟銆�
璇寸櫧浜嗭紝AI鐨勫浘鍍忕紪杈戠悊瑙o紝杩滄病杈惧埌鈥滀汉绫荤湅鍥俱€佺悊瑙e満鏅�€濈殑绮剧粏搴︺€�
鏈夌偣鍍忚�涓€涓�垰瀛︿細PS鐨勫皬鐧藉幓淇�浘锛屾病姒傚康锛岀函闈犵寽銆�
03. 澶氭�鎺ㄧ悊涓庢潯浠堕€昏緫锛氬交搴曟媺鑳�
鏈€鑷村懡鐨勭煭鏉匡紝鍑虹幇鍦ㄢ€滃�姝ユ帹鐞嗏€濆拰鈥滄潯浠跺垽鏂�€濈幆鑺傘€�
姣斿�锛�
鍏堝彨GPT-4o鐢讳竴鍙�嫍鍜屼竴鍙�尗锛岀劧鍚庡憡璇夊畠锛氣€滃�鏋滄病鏈夌尗锛屾妸鐙楁崲鎴愮尗骞舵惉鍒版捣婊┿€傗€�
浣嗗叾瀹炵�涓€寮犲浘鐚�凡缁忔湁浜嗐€�
鎸夌悊璇达紝杩欐椂鍊橝I搴旇�浠€涔堥兘涓嶆敼銆�
浣嗗畠杩樻槸鎶婄嫍鎹㈡垚鐚�紝杩樻妸鍦烘櫙鍏ㄦ惉浜嗏€斺€旀潯浠跺畬鍏ㄦ病鍒ゅ�锛岄€昏緫涔熶贡濂椼€�
绫讳技鐨勪緥瀛愯繕鏈夊緢澶氾紝AI缁忓父鎼炰笉娓呭�鏉傛潯浠讹紝鎴栬€呭共鑴嗏€滄瘡鏉℃寚浠ら兘鐓у仛鈥濓紝涓嶇�鍓嶅悗鏈夋病鏈夊啿绐併€�
杩欏嵃璇佷簡涓€涓�牳蹇冮棶棰橈細
GPT-4o涓嶅叿澶囦笂涓嬫枃鏁忔劅鐨勬帹鐞嗚兘鍔涳紝鏃犳硶鍦ㄥ�鏉傚浘鍍忕紪杈戜换鍔′腑杩涜�鏅鸿兘鍒ゆ柇銆�
瀹冨湪鈥滅悊瑙e墠鎻愨€旈€昏緫鍒ゆ柇鈥斿啀琛屽姩鈥濊繖涓�摼璺�笂锛屾槑鏄捐繕宸�竴澶ф埅銆�
鎬荤殑鏉ヨ�锛岀幇鍦ㄧ殑AI锛屾洿鍍忔槸涓�€滅簿鑷寸殑鎸囦护鏈哄櫒鈥濓紝浣犺�瀹冪敾浠€涔堝氨鐢讳粈涔堬紝浣嗚�璁╁畠鈥滅湅鎳傝�鍒欍€佽�鎳傚満鏅�€佷妇涓€鍙嶄笁鈥濓紝閭h繕鐪熷緱鍐嶈繘鍖栧嚑杞�€�
杩欎篃璁╂垜鎯宠捣锛孉I鍒氬�浼氱敓鎴愭枃瀛楅偅浼氬効锛屽ぇ瀹惰�寰楀畠鈥滆兘鍐欎細璇粹€濓紝浣嗕竴杩介棶缁嗚妭銆佽�瀹冪紪鏁呬簨銆佸渾閫昏緫锛岃繕鏄�細鍑哄ぇ澶у皬灏忕殑bug銆�
浠婂ぉ鐨凣PT-4o锛屽湪鍥剧墖棰嗗煙闈�复鐨勫洶澧冿紝鍏跺疄鍜屾浘缁忕殑鏂囨湰AI濡傚嚭涓€杈欙細
浼氱敾锛屼絾涓嶄竴瀹氫細鈥滅悊瑙b€濓紱鑳芥敼锛屼絾涓嶄竴瀹氳兘鈥滅簿鍑嗏€濓紱鑳藉惉鎸囦护锛屼絾涓嶄竴瀹氳兘鈥滀妇涓€鍙嶄笁鈥濄€� 杩欎篃璁告槸鎴戜滑涓庘€滅湡姝g悊瑙d笘鐣屸€濈殑AI涔嬮棿锛屾渶鍊煎緱璀︽儠銆佷篃鏈€浠や汉鏈熷緟鐨勯偅閬撳潕銆�
鎴栬�锛屼笅涓€娆℃妧鏈�獊鐮达紝灏变細浠庤繖閲屽紑濮嬨€� 浣嗚嚦灏戠幇鍦�紝鎴戜滑杩樻病鍒伴偅涓€姝ャ€�
via
https://the-decoder.com/gpt-4o-makes-beautiful-images-but-fails-basic-reasoning-tests-ucla-study-finds/
GPU绠楀姏鎸夐渶绉熺敤
A100/H100 GPU绠楀姏鎸夐渶绉熺敤锛�
绉掔骇璁¤垂锛屽钩鍧囪妭鐪佸紑鏀�30%浠ヤ笂锛�
鎵�爜浜嗚В璇︽儏鈽�