AI 탐지기 결과를 신뢰하지 않는 교수들의 이유
생성형 AI가 교육 현장에 본격적으로 도입되면서, 많은 대학과 기관들이 AI 탐지기를 평가 도구로 활용하고 있다. 그러나 모든 교수자들이 이 기술의 도입을 환영하거나 그 결과를 신뢰하는 것은 아니다. 오히려 일부 교수자들은 AI 탐지기의 판별 정확도와 해석 기준에 대해 강한 회의감을 표명하고 있다. 실제로 GPTZero, Turnitin AI 기능 등에서 높은 AI 생성 가능성 점수를 받은 학생 리포트가, 교수자의 판단으로는 명백히 수작업으로 작성된 것으로 판명되는 사례가 빈번히 보고된다. 이처럼 탐지기 결과와 교수자의 실제 평가 사이에 간극이 존재하면, 기술의 신뢰도는 급격히 하락할 수밖에 없다. 일부 교수자들은 탐지기의 점수만으로 학생의 성실성이나 창의성을 평가하는 것은 부당하다고 보고, 오히려 결과를 무시하고 본인의 전문적 판단을 우선하는 경우도 있다. 이러한 반응은 기술적 오류 가능성에 대한 경험이 누적될수록 더욱 강화되고 있으며, AI 탐지기가 객관적 진실을 담보하지 못하는 한, 교수자의 판단은 쉽게 대체되지 않는다는 교훈을 보여준다.
AI 탐지기 기술의 불완전성과 해석 불투명성
AI 탐지기를 신뢰하지 않는 교수자들이 지적하는 가장 큰 문제는 ‘기술의 불완전성’이다. 탐지기는 퍼플렉서티나 버스트니스와 같은 통계 지표를 기반으로 문장의 생성 가능성을 판단하지만, 이러한 수치는 글의 질이나 인간의 개입 정도를 정확히 반영하지 않는다. 예를 들어 문장 구조가 간결하고 반복이 많은 리포트는 AI가 작성했을 가능성이 높다고 판단되지만, 실제로는 초등 수준의 학생이 작성한 정직한 결과물일 수도 있다. 반대로 고급 paraphrasing 도구나 사람처럼 쓰는 AI 모델이 만든 글은 탐지기를 무난히 통과할 수 있다. 이러한 기술적 허점은 AI 탐지기 결과의 신뢰도를 약화시키며, 교수자 입장에서는 탐지기 점수가 오히려 판단을 왜곡하는 요소가 될 수 있다는 생각으로 이어진다. 또한 탐지기 결과가 ‘왜 그렇게 나왔는지’를 구체적으로 설명하지 못한다는 점도 문제다. 대부분의 시스템은 점수만을 표시할 뿐, 해당 문장의 어떤 특성이 문제였는지를 상세히 설명하지 않는다. 이러한 ‘블랙박스’ 방식의 기술은 결과에 대해 책임지지 못하고, 사용자의 해석에도 혼란을 초래한다. 교수자들이 AI 탐지기 결과를 단순 참고자료로 여기고 최종 평가에서 배제하려는 이유는 이처럼 기술이 신뢰할 수 있는 근거를 제시하지 못하기 때문이다.
AI 탐지기 중심 평가가 교수자의 역할을 약화시키는 구조
AI 탐지기 결과에 의존한 평가 구조는 교수자의 자율성을 위협하는 요소로 작용할 수 있다. 전통적으로 교수자는 학생의 과제나 논문을 직접 읽고, 내용의 논리성, 창의성, 주제 적합성, 표현의 진정성 등을 종합적으로 판단하는 역할을 수행해 왔다. 그러나 탐지기 점수가 평가의 핵심 기준으로 자리 잡으면, 교수자의 판단보다 기술의 수치가 우선시되는 분위기가 형성된다. 이는 교수자의 전문성과 교육적 책임을 약화시키고, 심지어는 탐지기 결과와 자신의 평가가 충돌할 경우 행정적 문제에 휘말릴 위험까지 안겨준다. 특히 학생이 탐지기 점수가 낮다고 항의하거나, 점수 근거를 요구하는 경우, 교수자는 설명하기 어려운 상황에 처하게 된다. 이처럼 AI 탐지기 중심의 평가 체계는 교수자에게 ‘보조 도구’를 넘어서 ‘의사결정 대행 시스템’으로 작용하며, 그 결과 교육의 인간적 판단력과 학생 개별성에 대한 고려가 줄어든다. 교수자들은 이러한 흐름을 경계하며, 탐지기의 사용은 선택적이고 보완적인 수단에 머물러야 한다고 주장한다. 또한 일부 교수자들은 탐지기 점수가 높게 나왔다는 이유만으로 학생의 글을 재작성하게 하거나, 감점 처리하는 행정 절차에 대해 깊은 불신을 갖고 있다. 왜냐하면 이는 교육적 평가가 아닌 기계 판독에 따른 일방적 처분이기 때문이다. 이러한 구조가 고착되면 교수자의 교육적 개입 여지는 줄어들고, 평가의 본질이 ‘사고력과 표현의 질’에서 ‘탐지기 점수 통과 여부’로 전락할 수 있다. 교수자는 판단 주체가 아니라, 기술 결과를 전달하는 전달자로 변할 수 있다.
AI 탐지기 사용에 대한 교수자의 신중한 접근 필요성
AI 탐지기를 전면적으로 거부하는 것은 현실적으로 어렵다. 이미 많은 대학에서 이 기술을 도입하고 있으며, 제도적으로 탐지 결과를 평가에 반영하고 있기 때문이다. 그러나 교수자들이 기술을 전면 수용하지 않고 신중하게 접근하는 것은 그 자체로 교육적 책임감의 표현이다. 교수자들은 기술에 맹목적으로 의존하기보다는, 그것이 미치는 영향과 한계를 비판적으로 인식하고 교육 현장에서의 적용 방식을 조정하려는 태도를 보인다. 예를 들어 AI 탐지기 결과를 확인하더라도, 그 점수에만 의존하지 않고 학생의 글쓰기 과정, 조사 방법, 초안 제출 여부 등 종합적인 판단 기준을 적용하는 것이다. 또한 교수자들 사이에서는 ‘AI 탐지기 활용 가이드라인’을 자체적으로 만들고, 점수 해석 기준을 명시하거나 결과에 따른 대응 방법을 정해두는 움직임도 있다. 궁극적으로 AI 탐지기의 도입은 교수자의 평가 권한을 보완하는 역할이어야 하며, 기술이 인간의 판단을 대체하지 않도록 교육 시스템이 설계되어야 한다. 교수자가 AI 탐지기 결과를 전적으로 신뢰하지 않는 이유는 단순한 기술 거부가 아니라, 교육 본질에 대한 책임과 학생 개별성에 대한 고려에서 비롯된 교육적 태도이기 때문이다.