
AI 탐지기가 교육 현장에서 본격적으로 도입되면서, 기술적 기준의 일관성 문제가 심각하게 대두되고 있다. 대표적인 감지기인 Turnitin, GPTZero, Copyleaks 등은 각기 다른 알고리즘을 기반으로 동작하며, 동일한 글을 입력해도 전혀 다른 감지 결과를 내놓는 경우가 적지 않다. 예를 들어 한 학생이 작성한 논문 초록을 Turnitin에서는 ‘AI 가능성 85%’로 판단했지만, GPTZero는 ‘Mostly human’이라는 판정을 내리는 식이다. 이처럼 동일한 입력 문장에 대해 감지기별 결과가 극단적으로 갈리는 상황은 교육 평가에 혼선을 초래하며, 학습자에게 불필요한 혼란과 심리적 압박을 가중시키고 있다. 문제는 각 감지기의 판별 기준과 알고리즘 구조가 대부분 비공개라는 점이다. 사용자는 ..