AI 탐지

AI 탐지기 우회 사례 분석: 실제 논문에서 AI 사용 감춘 사례

yanjicci 2025. 7. 1. 00:04

최근 고등교육기관과 학술지에서 AI 탐지기를 통한 논문 판별이 일상화되었지만, 동시에 AI 사용을 교묘히 감춘 우회 사례들도 꾸준히 등장하고 있다. 대표적인 사례 중 하나는 2024년 미국의 한 사립대학 박사 과정에서 제출된 사회학 논문이었다. 이 논문은 Turnitin AI 탐지기에서 AI 생성 확률 0%로 표시되었지만, 사후 분석 결과 해당 논문의 대부분이 GPT-4로 초안이 작성된 것으로 밝혀졌다. 작성자는 생성된 문장을 리라이팅 도구를 거쳐 전체적으로 불규칙화했고, 수동태를 능동태로 바꾸는 등 문장 구조를 의도적으로 왜곡해 탐지기를 완벽히 우회했다. 또 다른 사례는 한국의 모 공대에서 발생했다. 대학원생이 제출한 논문 초안이 GPTZero에서 AI 감지율 15%로 낮게 나와 그대로 심사 통과되었지만, 교수와의 면담 중 학생이 실수로 GPT 사용 사실을 언급하면서 문제가 수면 위로 떠올랐다. 이 논문은 문장 표현이 지나치게 일관되고 매끄러웠지만, 학생은 각 문단마다 맞춤법 오류와 슬랭(slang)을 섞는 방식으로 AI 탐지기의 버스트니스 지표를 교란시켰다. 이처럼 실제 논문에서 AI 사용 흔적을 감추는 기술은 점점 더 정교해지고 있으며, 탐지기 결과만으로는 그 진위를 확인하기 어려운 상황이 많아지고 있다. 이러한 사례는 AI 탐지기의 신뢰도와 교육기관의 판단 기준 모두에 의문을 제기하는 계기가 되고 있다.

AI 탐지기 우회를 가능하게 만든 기술적 허점 분석

AI 탐지기를 회피한 사례들이 성공할 수 있었던 이유는 탐지기의 구조적 한계 때문이다. 대부분의 탐지기는 문장의 통계적 특성, 예측 가능성, 길이 분포, 반복 패턴 등을 기반으로 AI 여부를 추정한다. 하지만 최신 AI 모델은 이미 이러한 통계적 기준을 일부러 회피하거나 인간적인 표현을 모방할 수 있도록 학습되어 있으며, 사용자는 이를 리라이팅 기법이나 수작업 편집을 통해 더욱 교묘하게 감춘다. 예를 들어 GPTZero는 퍼플렉서티와 버스트니스 수치로 판별하지만, 이는 단어 선택과 문장 구조를 조정하면 비교적 쉽게 조작할 수 있다. Smodin은 자연스러운 문맥 흐름을 기준으로 판단하는데, 이 또한 어조나 어휘 스타일만 바꿔도 탐지를 피할 수 있다. Turnitin은 자체적으로 AI 학습 데이터를 활용하지만, 결과에 대한 근거 설명이 부족하여 교수나 심사자가 점수만 보고 판단하게 만드는 문제가 있다. 최근에는 AI 탐지 우회를 위한 전문 프로그램도 등장하고 있다. 일부 툴은 ChatGPT나 Claude의 출력을 입력하면, 문장 단위로 탐지기 교란용 변형을 자동 적용한 결과를 출력해준다. 이러한 기술은 문장의 순서를 바꾸고, 일부 키워드를 낮은 빈도의 단어로 치환하며, 구어적 요소를 추가해 사람처럼 보이도록 만든다. 탐지기의 허점을 파고드는 방식은 점점 더 정밀해지고 있으며, 그 결과 교육기관은 탐지 결과만으로 판단하기에 어려움을 겪고 있다.

AI 탐지기 결과를 맹신한 교육기관의 오판 사례

AI 탐지기 우회 사례가 늘어나는 반면, 탐지기 결과를 절대적으로 신뢰해 오히려 오판한 교육기관 사례도 존재한다. 대표적으로 2024년 국내 모 국립대에서는 대학원생의 논문이 Turnitin에서 AI 생성률 95%로 판정되어 심사 보류되었다. 하지만 학생은 직접 작성한 초안, 키보드 입력 로그, 버전 기록 등을 제출하며 AI 사용이 없었다고 주장했고, 후속 분석에서 실제로 GPT 사용 흔적이 발견되지 않았다. 결국 학교 측은 해당 학생에게 공식 사과하고, AI 탐지기 점수의 맹신에 대한 내부 조사까지 진행했다. 반대로 탐지기 결과가 ‘안전’으로 나온 경우에도 나중에 AI 사용이 드러난 사례가 있다. 국내 유명 사립대에서는 탐지기 점수가 10%대로 매우 낮았던 논문이, 동료 심사자의 리뷰에서 “문체와 논리 구조가 지나치게 정형화되어 있다”는 지적을 받으면서 문제화되었다. 이후 학생이 AI 활용을 일부 인정하며, 초안 작성에 사용한 프롬프트를 제출한 사실이 드러났다. 이 사례에서 교수진은 “AI 탐지기는 참고 자료일 뿐 최종 판단은 교육자의 몫”이라는 원칙을 다시 강조했다. 이처럼 탐지기의 판별 결과는 정확하지도, 일관되지도 않으며, 오히려 탐지기의 오판으로 억울한 피해자가 생기거나, 감춰진 AI 사용이 면책되는 이중적 상황을 만들고 있다. 따라서 탐지기를 도입하더라도, 그 결과를 절대화해서는 안 되며 반드시 다면적인 평가 체계를 병행해야 한다.

AI 탐지기 우회 시대에 필요한 제도적 대응 전략

AI 탐지기 우회 사례가 늘어나는 상황에서 가장 필요한 것은 단순한 기술 개선이 아니라 제도적 판단 기준의 재정립이다. 첫째, 교육기관은 AI 탐지기 결과만으로 평가를 결정하지 말고, 반드시 작성 과정 증빙 시스템을 병행해야 한다. 초안 제출, 수정 이력, 타이핑 로그 등은 글의 생성 경로를 증명하는 데 매우 효과적인 자료다. 둘째, AI 사용 자체를 무조건 금지하는 것이 아니라, 어떤 방식으로 AI를 활용했는지를 보고 학문적 성실성과 기여도를 판단해야 한다. 예를 들어 프롬프트를 공개하거나, AI 사용 부분을 명시하도록 하는 ‘AI 사용 투명성 보고제’를 도입하는 것도 한 방법이다. 셋째, 교수와 평가자에게 탐지기 결과를 해석할 수 있는 훈련을 제공해야 한다. 탐지기의 점수는 그 자체로 의미가 있는 것이 아니라, 글의 맥락과 구조, 작성자의 배경과 함께 종합적으로 해석되어야 한다. 넷째, 탐지기 제조사에 대해 알고리즘의 설명 가능성과 정확도에 대한 투명성 요구가 필요하다. 현재 대부분의 탐지기는 ‘AI일 가능성’이라는 결과만 제공하며, 어떤 문장에서 어떤 요소가 문제인지 구체적인 설명은 부족하다. 이는 사용자가 탐지기를 맹신하게 만들고, 결과에 대해 반박할 기회를 원천적으로 봉쇄한다. 마지막으로, 교육 현장에서는 학생들에게 AI 탐지기의 한계와 역할을 명확히 안내하고, AI 사용에 대한 윤리적 기준과 책임감을 함께 교육해야 한다. AI 탐지기 우회는 단순한 기술 문제가 아니라, 신뢰 기반의 평가 체계와 학문 윤리 전반을 흔드는 중요한 이슈이기 때문이다.

 

AI 탐지기 우회 사례