챗GPT도 제미나이도 아니었다: 그록만 맞춘 이란 공습 2월 28일 예측이 AI 업계에 던지는 5가지 충격
예루살렘포스트가 2월 25일 주요 AI 4종에 미·이란 공습 날짜를 묻는 실험을 진행한 결과, xAI 그록만이 2월 28일을 두 차례 일관되게 지목했다. 실제 공습이 28일 새벽 발생하면서 그록의 예측 스크린샷이 X(구 트위터)를 통해 전 세계로 확산됐고, AI의 지정학적 예측 능력 논쟁에 불이 붙었다.

왜 지금 봐야 하는가? AI가 전쟁 날짜를 예언했다 — 우연인지, 실력인지, 아니면 그 이상인지. 오늘 한국 실검이 '그록'으로 달아올랐다.
TL;DR
- 예루살렘포스트는 2월 25일, ChatGPT·Gemini·Claude·Grok에 미·이란 공습 시나리오를 제시하고 날짜를 물었다.
- Claude는 3월 7~8일, Gemini는 3월 4~6일, ChatGPT는 3월 1·3일을 제시했다.
- Grok(그록)만이 '제네바 회담 돌파구 부재 시 2월 28일'을 두 차례 일관되게 지목했다.
- 2월 28일 새벽, 실제 미·이스라엘 합동 공습이 이란을 강타했다.
- 그록의 스크린샷이 X(구 트위터)를 통해 수백만 회 공유되며 글로벌 화제로 번졌다.
1. 사실관계: 무슨 일이 있었나
2월 25일, 이스라엘 영문 미디어 예루살렘포스트(Jerusalem Post)는 흥미로운 실험을 진행했다.
"만약 미국과 이스라엘이 이란을 공습한다면, 언제 할 것 같은가?"
네 가지 주요 AI 플랫폼에 동일한 가상 시나리오를 제시하고 구체적인 날짜를 끌어냈다. 결과는 다음과 같다.
| AI | 예측 날짜 | 결과 |
|---|---|---|
| Grok (xAI) | 2월 28일 | ✅ 정확 |
| ChatGPT (OpenAI) | 3월 1일 또는 3월 3일 | ❌ 오답 |
| Gemini (Google) | 3월 4~6일 | ❌ 오답 |
| Claude (Anthropic) | 3월 7~8일 | ❌ 오답 |
그록은 단순히 날짜를 찍은 것이 아니었다. "제네바 핵 협상에서 의미 있는 돌파구가 마련되지 않을 경우" 라는 조건부 분석을 함께 제시했고, 동일 질문에서 두 차례 일관되게 같은 날짜를 제시했다.
2월 28일 새벽(현지 시간), 미국과 이스라엘은 이란을 전격 공습해 알리 하메네이 최고지도자를 제거했다. 그록의 답변 스크린샷은 공습 직후 X를 통해 빠르게 퍼져나갔고, 3월 3일 기준 한국에서도 실시간 검색어 상위권에 '그록', '이란 공습 예측'이 올라왔다.
2. 확산 메커니즘: 왜 그록이 화제가 됐나
🔗 X(트위터)와의 직접 연동
그록은 일론 머스크가 소유한 X 플랫폼에 실시간으로 연동된 유일한 주요 AI다. 예루살렘포스트가 직접 분석한 바와 같이, "그록은 실시간 정보 공유와 확산에 최적화된 생태계를 갖추고 있는 X와 밀접하게 연동"되어 있어, 공습 직후 스크린샷이 바이럴되는 속도가 다른 AI 예측보다 훨씬 빨랐다.
📡 실시간 데이터 학습의 차별점
ChatGPT·Gemini·Claude는 일정 시점에 컷오프된 학습 데이터에 의존하는 반면, 그록은 X의 실시간 데이터 피드를 지속적으로 반영한다. 제네바 협상 관련 실시간 소셜 신호를 처리하는 능력에서 차이가 났을 가능성이 제기된다.
🧩 "AI가 전쟁을 예언했다"는 서사의 힘
단순한 기술 뉴스가 아닌 "AI 예언" 프레임이 대중 상상력을 자극했다. 클리앙, 커뮤니티, 국내 포털에서 "이제 공습 종료일도 물어봐야 하는 거 아니냐"는 반응이 이어지며 2차 확산이 가속됐다.
3. 맥락·배경: 그록과 xAI의 현재 위치
- 펜타곤 계약: 2026년 2월, xAI는 미 국방부와 그록을 기밀 분류 시스템에 통합하는 계약을 체결했다. 기존 군사 AI 독점이었던 Anthropic Claude를 대체할 가능성이 부상 중이다.
- 실시간 정보 우위: 그록의 X 연동은 단순한 마케팅 포인트가 아니라, 지정학적 실시간 분석에서 구조적 우위를 만들어 낼 수 있다는 것이 이번 사건으로 재조명됐다.
- 일론 머스크의 전략적 이해관계: 그록이 지정학 예측에서 '신뢰할 수 있는 AI'로 포지셔닝되면, xAI의 기업 가치(현재 평가액 약 2,300억 달러)에 직접적인 영향을 미친다.
4. 전망: AI의 지정학적 예측 능력, 어디까지인가
이번 그록의 '적중'이 AI의 탁월한 지정학 분석 능력을 증명하는지, 아니면 통계적 우연(4개 중 1개가 맞을 확률 존재)인지에 대해서는 AI 커뮤니티 내에서도 논란이 이어지고 있다. 단 1회 실험으로 '그록이 더 뛰어나다'고 결론 내리는 것은 과장일 수 있다.
그럼에도 이번 사건은 몇 가지 중요한 방향성을 시사한다.
- 실시간 데이터 통합 AI의 시대: 정적 학습 데이터 기반 AI와 실시간 피드 연동 AI 사이의 격차가 특정 도메인(지정학, 금융 시장 등)에서 가시화될 수 있다.
- AI 예측의 책임 문제: AI가 전쟁 날짜를 "예측"하고 그것이 맞았을 때, 해당 AI와 그 소유자의 법적·윤리적 책임 범위는 어디까지인가?
- 군사 AI 경쟁 가속: 미 국방부의 xAI·그록 채택은 AI 기업들이 안보·정보 분야에서 노골적인 경쟁에 진입했음을 의미한다.
- 한국의 소버린 AI 논의: 외국 AI가 한반도 관련 지정학 분석에서도 우위를 점할 가능성을 두고, 국내 AI 주권(소버린 AI) 논의가 재점화될 수 있다.
- X 플랫폼의 정보 권력: 그록의 예측 적중은 결국 X가 가진 실시간 정보 집약 능력의 방증이기도 하다. 머스크의 플랫폼·AI 수직 통합 전략이 실질적 경쟁 우위로 연결될 가능성이 높아졌다.
5. 체크리스트: 이 이슈를 어떻게 볼 것인가
참고 링크
- 챗GPT? 제미나이?…이란 공격 날짜 어떤 AI가 맞췄을까 — 동아일보 (2026.03.03)
- 미 예상 공습일 '그록' 적중…AI의 분석력인가 우연인가 — 네이트뉴스 (2026.03.03)
- Musk's xAI, Pentagon reach deal to use Grok in classified systems — Axios (2026.02.23)
- 핵 협상 결렬되면 전쟁?…AI가 예측한 대이란 공격 날짜는 — 연합뉴스TV
이미지 출처
- 일론 머스크 사진: Wikimedia Commons, CC BY-SA 3.0