예전 직장에서 한 동료에게 물은 적이 있다. “이 자료 어디서 찾았어? 법제처야? 공식 배포자료야?” 모른단다. “그럼 블로그 글 보고 온 거야?” 그것도 아니란다. AI한테 물어봤단다.
그때만 해도 LLM이 막 나오던 초기였다. 답변을 한 번 검증하는 게 당연하던 때다. 그런데 편하다는 이유로 그 단계를 슬쩍 넘긴 거다. AI한테 자료조사를 맡기고 출처 확인 없이 넘어가는 일은, 이제 그 동료만의 얘기가 아니다.
일 못하는 사람 얘기가 아니다
오해는 말자. 그 동료, 일 못하는 사람 아니었다. 오히려 업무 흐름을 꿰고 있어서, 자료조사 단계를 AI로 빠르게 건너뛰니 속도가 났다. AI 답이 마냥 틀린 것도 아니었다. 최신이 아니었을 뿐이다.
문제는 거기서 멈춘 거다. 그 답이 어디서 온 건지, 언제 기준인지 확인하지 않고 그대로 가져간 것. 이렇게 검증 없이 흡수하다 보면, 사람마저 자기도 모르게 환각한다. AI가 옛 정보를 확신에 차서 주고, 나는 그걸 그대로 옮기니까.
AI 답에는 날짜가 안 붙는다
이게 왜 잘 안 보이냐면, AI는 자기 지식이 언제 멈췄는지 알려주지 않는다.
AI의 베이스 지식은 모델이 만들어진 시점에 멈춰 있다. 그 뒤에 나온 건 모른다. 그런데 묻지 않으면 그냥 다 아는 것처럼 답한다. 미드저니 프롬프트를 만들어달라고 해보면 바로 드러난다. 끝에 --v 6 같은 옛 버전 값을 붙여준다. 미드저니는 벌써 V8.1까지 나왔는데도다(2026년 4월 30일 출시). 모델 자체도 빠르게 갈린다. GPT-5.5가 4월에 나왔고, 앤트로픽은 며칠 전 Fable 5를 내놨다.
구글 검색은 그래도 자료마다 날짜가 붙는다. 지난 건지 최신인지 눈에 보인다. AI 답엔 그게 없다. “항상 최신 자료를 바탕으로 알려달라”고 매번 붙여줘야 그나마 낫고, 지침이나 메모리에 넣어달라고 해도 잘 안 지킨다.
그래서 검증엔 도구를 따로 쓴다
요즘 일 잘하는 사람들이 AI를 하나로 안 쓰고 두세 개씩 나눠 쓰는 건 그래서다.
나도 자료를 처음 찾을 땐 ChatGPT나 제미나이로 넓게 훑는다. 검증이 필요해지면 퍼플렉시티로 옮겨 출처를 본다. 토큰이 떨어지면 노트북LM으로 넘어가 이어간다. 흐름이 어느 정도 잡히면 클로드로 방향을 조율하고 글을 다듬는다. 기획안이 나오면 md 파일로 노션에 공유하고 옵시디언에 저장한다.
도구가 많아 보여도 원리는 하나다. 한 도구 답에서 멈추지 않는 것. AI가 멈춰 있는 시계라는 걸 알고 쓰는 것과 모르고 쓰는 건, 결과가 다르다.
결국, 틀린 게 보이느냐
그런데 한 발 더 들어가면 좀 냉정해진다.
AI가 내 본업에 관련된 답을 내놨다면, 틀린 데는 내 눈에 보여야 맞다. 최신이 아니어도 어디가 어긋났는지 짚을 수 있어야 한다. 그 분야가 내 안에 들어 있으면 그렇게 된다.
안 보인다면, 그건 사실 AI 문제가 아니다. 아직 그 분야가 내 안에 없다는 뜻이다. 그럴 땐 솔직히 인정하고, 경험을 더 쌓고, 아는 사람한테 물어보는 수밖에 없다. 나도 그렇다.
결국 AI의 답변은 내가 아는 만큼 볼 수 밖에 없다. 내가 못 보는 자리는 AI를 써도 그대로 구멍이 난다. “이 자료 어디서 찾았어?” 라는 질문은 사람에게도 AI에게도 해당되는 듯하다.