AI 감지 회피를 위한 재작성 기술 분석: AI 탐지기의 허점을 파고드는 전략들
AI 탐지기의 등장은 글쓰기 환경에 큰 변화를 불러왔다. 특히 교육 현장에서는 학생들이 생성형 AI를 활용해 작성한 리포트나 에세이를 감지하기 위한 목적으로 GPTZero, Turnitin, Smodin 등 다양한 AI 탐지기가 사용되고 있다. 하지만 이러한 탐지기가 실제로 완벽하게 AI 생성 문장을 판별하지 못한다는 사실이 알려지면서, 사용자들은 오히려 탐지기를 우회하는 다양한 재작성 기술에 집중하게 되었다. ‘AI 감지 회피’라는 검색어는 이미 온라인상에서 활발히 공유되고 있으며, 수많은 커뮤니티와 유튜브 영상, 텍스트 리라이팅 툴이 등장해 탐지기를 회피하는 방법을 안내하고 있다. 이들 기법의 공통점은 ‘AI가 아닌 사람처럼 보이는 문장’을 만드는 데 초점을 맞추며, 문장의 예측 가능성, 길이 분포, 문체 일관성 등 탐지기의 핵심 판별 기준을 교란시키는 방식이다. 즉, 탐지기의 알고리즘을 이해하고 그 약점을 파악한 뒤, 의도적으로 사람처럼 느껴지도록 글을 다시 쓰는 전략이다. 이 흐름은 탐지 기술과 우회 기술 간의 끊임없는 경쟁 구조를 보여주며, 교육 평가 시스템이 얼마나 기술 의존적이고 불완전한가를 반증하는 단면이기도 하다.
AI 탐지기 우회를 위한 대표적 재작성 전략들
현재 사용되는 재작성 전략은 크게 네 가지로 나눌 수 있다.
첫째는 문장 구조의 불규칙화이다. GPT로 생성된 문장은 보통 일정한 길이와 예측 가능한 문장 패턴을 따르는데, 이 특징은 AI 탐지기의 주요 탐지 기준이 된다. 이를 회피하기 위해 사용자는 문장을 의도적으로 짧게 자르거나, 길이를 불균형하게 구성해 ‘사람의 글’처럼 보이게 한다. 예를 들어 한 문단 내에 단문과 장문을 섞거나, 접속사를 생략해 흐름을 의도적으로 비자연스럽게 만드는 것이다.
둘째는 어휘와 문체의 혼합 사용이다. AI는 일반적으로 정제된 어휘와 중립적인 문체를 사용한다. 따라서 일부 사용자는 일상어, 방언, 속어 또는 구어체 표현을 삽입하여 기계적인 느낌을 지운다. 예: "이거 진짜 이상하지 않나요?" 같은 문장은 AI가 잘 사용하지 않으며, 탐지기로부터 '사람의 개입'으로 오해될 가능성이 높다.
셋째는 문장 의미의 부분적 변형이다. 이 방식은 문장의 뼈대는 유지하되, 주어·서술어 위치를 바꾸거나 수동태를 능동태로 전환하고, 핵심 단어를 동의어로 교체하는 방식이다. 예를 들어 "AI는 사람처럼 글을 쓴다"를 "사람과 같은 방식으로 글을 쓰는 것이 AI다"처럼 바꾸는 방식이다.
넷째는 리라이팅 도구의 활용이다. QuilBot, Wordtune, Paraphraser.io와 같은 리라이팅 도구는 GPT 기반으로 작동하지만, 특정 문장의 표현을 바꾸어 탐지기 회피율을 높인다. 실제 테스트 결과, GPTZero에서 98% AI 판정을 받은 문장을 QuilBot으로 리라이팅한 후 재분석했더니 AI 탐지 확률이 24%로 떨어진 사례도 있다. 이처럼 재작성 기술은 탐지기의 감지 기준을 교묘하게 비켜가며, 사람의 개입 여부를 판단하기 어렵게 만드는 결과를 낳고 있다.
AI 탐지기와 재작성 기술 사이의 끝없는 추격전
AI 탐지기의 개발자는 지속적으로 탐지 알고리즘을 고도화하고 있지만, 재작성 기술의 진화 속도는 그 이상으로 빠르다. 탐지기의 가장 큰 약점은 ‘결과 중심’이라는 점이다. 대부분의 탐지기는 글이 완성된 뒤 제출된 텍스트만을 분석하기 때문에, 그 글이 어떤 방식으로 생성되었고, 어떤 과정을 거쳐 편집되었는지는 감지하지 못한다. 반면 재작성 기술은 이러한 탐지기의 맹점을 정조준한다. 예를 들어, GPT로 생성한 문장을 복사한 뒤 사람이 직접 리라이팅하면, 탐지기는 해당 문장이 생성 AI에서 유래했다는 단서를 찾을 수 없다. 더 나아가 일부 사용자는 ChatGPT의 출력물에 오타, 맞춤법 오류, 문맥 탈락 등을 의도적으로 삽입하며 ‘비전문적인 흔적’을 추가한다. 이는 버스트니스(burstiness) 수치를 높여 탐지기에게 ‘비일관적인 사람의 글’처럼 보이게 만든다. 또한 최근 등장한 AI 우회 도구는 문장을 세 단어씩 끊어서 교체하거나, 문장 순서를 무작위로 섞은 후 다시 재조합하는 방식으로 더욱 탐지기 회피 성능을 높이고 있다. 문제는 이러한 방식이 교육적 정당성이나 학문적 윤리와는 전혀 무관하게 오직 ‘탐지기 통과’를 목적으로 한다는 점이다. 탐지기가 발전할수록 회피 기술도 고도화되는 악순환 구조는 결국 교육 현장에서 평가 기준의 붕괴를 가져올 위험성이 크다. AI 탐지기가 신뢰받지 못하게 되면, 기술의 정당성뿐 아니라 평가의 객관성까지 의심받게 되는 것이다.
AI 탐지기 회피 시대의 평가와 윤리 기준 재설계 필요성
AI 탐지기를 회피하려는 재작성 기술이 일상화되는 지금, 단순히 기술적 대응만으로는 문제를 해결할 수 없다. 평가 시스템 전반에 걸쳐 윤리와 맥락을 반영한 새로운 기준이 필요하다.
첫째, AI 탐지기 결과만으로 평가를 결정하는 구조는 위험하다. 기술적 한계를 인정하고, 탐지기 결과를 참고 자료로만 사용하며, 작성자의 설명과 초안, 작업 로그 등을 함께 고려하는 방식으로 전환해야 한다.
둘째, AI 활용에 대한 자가 보고 시스템 도입이 필요하다. 학생이 어떤 부분에서 AI를 사용했는지를 명시하고, 그 정직성을 바탕으로 평가하는 문화가 자리 잡아야 한다.
셋째, AI 우회 전략을 막기 위해선 기술보다 교육이 선행되어야 한다. 탐지기를 회피하려는 기술은 막을 수 없지만, 왜 그런 행동이 부정행위인지에 대한 윤리적 교육이 강화된다면, 자발적인 책임 있는 글쓰기가 가능해진다.
넷째, AI 탐지 기술 자체도 다층적 구조로 진화해야 한다. 단일 텍스트 분석이 아닌, 생성 이력, 입력 로그, 문장 구성 시간, 초안 비교 분석 등 ‘작성 과정 기반의 탐지’가 이루어질 수 있도록 기술이 고도화되어야 한다. 마지막으로, 평가자 또한 탐지기의 한계를 이해하고, AI 탐지기 결과를 맹신하지 않도록 지속적인 훈련과 지침이 제공되어야 한다. 재작성 기술이 교묘해질수록 인간의 판단력이 더욱 중요해지는 시대가 도래했다. AI 탐지기가 완벽할 수 없다는 사실을 인정하고, 그 결과를 보조 지표로만 사용하는 윤리적 평가 체계를 마련할 때, 교육의 신뢰와 글쓰기의 본질이 회복될 수 있다.