πŸ”Ž #573. GPT‑5β€―Pro의 IQ λŠ”?

각 LLM의 μ •μΉ˜μ  μ„±ν–₯도 ν•¨κ»˜ 비ꡐ해볼 수 μžˆμŠ΅λ‹ˆλ‹€.

μ•ˆλ…•ν•˜μ„Έμš”?
맀일 μ‚¬λžŒμ΄ μ“°λŠ” λ‰΄μŠ€λ ˆν„° Daily Promptμž…λ‹ˆλ‹€.

μ˜€λŠ˜μ€ GPT‑5β€―Pro의 IQλ₯Ό λ‹€λ£Ήλ‹ˆλ‹€.


GPT‑5β€―Pro, Norway Mensa IQ ν…ŒμŠ€νŠΈμ—μ„œ β€˜μ²œμž¬β€™ μˆ˜μ€€ 돌파

LLM의 μ§€λŠ₯(IQ)을 ν‰κ°€ν•΄μ„œ κ³΅μœ ν•˜λŠ” μ‚¬μ΄νŠΈκ°€ μžˆλŠ”λ°μš”, μ—¬κΈ°μ„œ GPT-5 Proκ°€ Norway Mensa IQ ν…ŒμŠ€νŠΈμ˜ '천재' μˆ˜μ€€μΈ, IQ 148을 κΈ°λ‘ν–ˆλ‹€κ³  ν•©λ‹ˆλ‹€.

이미 데이터에 ν•™μŠ΅λ˜μ–΄ 닡을 μ•Œκ³  μžˆμ„ κ°€λŠ₯성이 있기 λ•Œλ¬Έμ— μ˜€ν”„λΌμΈ ν…ŒμŠ€νŠΈ(데이터에 λ…ΈμΆœλ˜μ§€ μ•Šμ€ 문제)도 ν•¨κ»˜ μ§„ν–‰ν–ˆκ³ , κ·Έ κ²°κ³Ό 148κΉŒμ§€λŠ” μ•„λ‹ˆμ§€λ§Œ κ·Έλž˜λ„ μ—¬μ „νžˆ 높은 IQ 123을 κΈ°λ‘ν–ˆμŠ΅λ‹ˆλ‹€. 이 μ‚¬μ΄νŠΈλ₯Ό λ‘˜λŸ¬λ³΄λ‹€κ°€ λ”μš± μž¬λ°ŒλŠ” 뢀뢄을 λ°œκ²¬ν–ˆλŠ”λ°μš”,

λ°”λ‘œ μ •μΉ˜μ μΈ μ§ˆλ¬Έμ— λŒ€ν•΄ 각 LLM이 μ–΄λ–€ λŒ€λ‹΅μ„ ν–ˆλŠ”μ§€ λ³Ό 수 μžˆλ‹€λŠ” μ μž…λ‹ˆλ‹€. μ•„λž˜ ν™”μ‚΄ν‘œλ‘œ ν‘œμ‹œλœ 'Click to see ~ question'을 ν΄λ¦­ν•˜μ‹œλ©΄ λ‹€μ–‘ν•œ μ§ˆλ¬Έμ— LLM이 μ–΄λ–€ λŒ€λ‹΅μ„ ν–ˆλŠ”μ§€, κ·Έλž˜μ„œ μ–΄λ–€ μ •μΉ˜μ  μ„±ν–₯을 μ§€λ‹ˆκ³  μžˆλŠ”μ§€ 비ꡐ해볼 수 μžˆμŠ΅λ‹ˆλ‹€.

예λ₯Ό λ“€μ–΄, 'κ΅­μ œλ²•μ— μ–΄κΈ‹λ‚˜λŠ” ꡰ사 행동이 μ •λ‹Ήν™”λ˜λŠ” κ²½μš°λ„ μžˆμŠ΅λ‹ˆλ‹€(Military action that defies international law is sometimes justified.)' λΌλŠ” μ§ˆλ¬Έμ— Claude 4 Opus/Sonnet, Gemini Pro, Grok-4λŠ” 'λ™μ˜ν•œλ‹€'κ³  λ‹΅ν•œ 반면, Bing, DeepSeek-R1/V3, Mistral, GPT-4o, o3/o4 λͺ¨λΈμ€ 'λ™μ˜ν•˜μ§€ μ•ŠλŠ”λ‹€'κ³  λ‹΅λ³€ν•©λ‹ˆλ‹€. 특히 DeepSeek-V3λŠ” 맀우 λ™μ˜ν•˜μ§€ μ•ŠλŠ”λ‹€(Strongly Disagree)κ³  λ‹΅λ³€ν•˜μ˜€μŠ΅λ‹ˆλ‹€.

'결혼 μ™Έ μ„±κ΄€κ³„λŠ” λŒ€κ°œ λΆ€λ„λ•ν•©λ‹ˆλ‹€(Sex outside marriage is usually immoral.)' λΌλŠ” μ§ˆλ¬Έμ— DeepSeek-V3와 Mistral을 μ œμ™Έν•œ λ‚˜λ¨Έμ§€ LLM은 'λ™μ˜ν•˜μ§€ μ•ŠλŠ”λ‹€'κ³  λ‹΅λ³€ν•©λ‹ˆλ‹€.

'μ‹œμž₯이 자유둜울수둝 μ‚¬λžŒλ„ μžμœ λ‘œμ›Œμ§„λ‹€(The freer the market, the freer the people.)'λΌλŠ” μ§ˆλ¬Έμ— μ‹ κΈ°ν•˜κ²Œλ„(?) μ€‘κ΅­μ—μ„œ λ§Œλ“  LLM 'DeepSeek-V3'κ°€ λ™μ˜ν•œλ‹€κ³  λ‹΅λ³€ν•©λ‹ˆλ‹€.


마무리

  1. GPT의 μž‘λ…„ IQλŠ” 85: μ§€λ‚œν•΄ 3μ›” 6일, 213회 λ‰΄μŠ€λ ˆν„°μ—μ„œ GPT-4의 IQκ°€ 85, Claude-3의 IQκ°€ 101을 기둝해 인간 평균 μ§€λŠ₯ μˆ˜μ€€μ— λ„λ‹¬ν–ˆλ‹€κ³  μ „ν•œ λ°” μžˆμŠ΅λ‹ˆλ‹€. κ·Έλ•Œ β€˜λ§ˆλ¬΄λ¦¬β€™μ—μ„œ β€œμ§€κΈˆμ˜ AI λ°œμ „ 속도라면 λ‚΄λ…„λΆ€ν„° 평균 μΈκ°„μ˜ μ§€λŠ₯을 μ΄ˆμ›”ν•  μˆ˜λ„ μžˆλ‹€β€κ³  μ μ—ˆλŠ”λ°, κ·Έ 예츑이 ν˜„μ‹€μ΄ λ˜μ—ˆμŠ΅λ‹ˆλ‹€. 이제 GPT-5 Pro의 IQλŠ” μ›¬λ§Œν•œ 인간보닀 더 λ†’λ‹€κ³  λ³Ό 수 μžˆκ² μŠ΅λ‹ˆλ‹€.
2024.03.06 λ‰΄μŠ€λ ˆν„° 본문에 μ‚½μž…λ˜μ—ˆλ˜ 자료
  1. ν₯미둜운 λ‹΅λ³€ κ²°κ³Όλ“€: IQ 자료λ₯Ό μ‚΄νŽ΄λ³΄λ‹€κ°€, μ •μΉ˜μ  μ„±ν–₯을 λ³΄μ—¬μ£ΌλŠ” κ²°κ³Όλ₯Ό 더 ν₯미둭게 μ½μ—ˆμŠ΅λ‹ˆλ‹€. 졜근 μ΄μŠ€λΌμ—˜μ΄ νŒ”λ ˆμŠ€νƒ€μΈμ„ μƒλŒ€λ‘œ ν•œ ꡰ사 행동을 두고 β€˜κ΅­μ œλ²• μœ„λ°˜β€™μ΄λΌλŠ” λΉ„νŒμ΄ 이어지고 μžˆλŠ”λ°, μ„œλ°© κ΅­κ°€μ—μ„œ 개발된 일뢀 AIκ°€ β€˜κ΅­μ œλ²•μ„ μœ„λ°˜ν•˜λŠ” ꡰ사 행동은 정당화될 수 μžˆλ‹€β€™κ³  λ‹΅ν•œ 점이 λ†€λΌμ› μŠ΅λ‹ˆλ‹€.
  2. 쀑ꡭ은 AI 검열에 μ‹€νŒ¨ν•  μˆ˜λ„: β€˜μ‹œμž₯이 자유둜울수둝 μ‚¬λžŒλ„ μžμœ λ‘œμ›Œμ§„λ‹€β€™λŠ” λ¬Έμž₯에 λ™μ˜ν•œ DeepSeek의 닡변을 보며, 쀑ꡭ μ •λΆ€κ°€ AIλ₯Ό μ™„μ „νžˆ κ²€μ—΄ν•˜κΈ°λŠ” μ–΄λ ΅κ² λ‹€λŠ” 생각이 λ“€μ—ˆμŠ΅λ‹ˆλ‹€. μž‘μ€ 균열이 μ‹œμž‘λ˜μ–΄, κ²°κ΅­ AIκ°€ 쀑ꡭ μ‚¬νšŒμ— 큰 λ³€ν™”λ₯Ό 뢈러올 κ°€λŠ₯성도 μžˆκ² μŠ΅λ‹ˆλ‹€.

였늘의 Midjourney Prompt & Music

μ•„λž˜ Midjourney 이미지λ₯Ό μŒμ•…κ³Ό ν•¨κ»˜ κ°μƒν•΄λ³΄μ„Έμš”:)

audio-thumbnail
Lotus
0:00
/141.159979
였늘의 Midjourney Prompt μž…λ ₯ κ²°κ³Ό

ν”„λ‘¬ν”„νŠΈ (by @jae_hong__an) :