AI 탐지기 기반 평가에서 교수자의 판단력은 여전히 유효한가
AI 탐지기가 대학 교육 현장에서 본격적으로 도입되면서, 기존의 평가 구조에 근본적인 변화가 일어나고 있다. 특히 과제나 논문과 같은 서면 평가에서 교수자의 판단보다 탐지기의 감지 점수가 먼저 인용되는 경우가 늘고 있으며, 이는 교육자 본연의 역할을 흔드는 요소로 작용하고 있다. 이전에는 글의 논리 구조, 주제 적합성, 표현력 등을 교수자가 종합적으로 판단했다면, 이제는 탐지기가 제시한 'AI 가능성'이라는 수치가 평가의 출발점이 되는 경향이 강해지고 있다. 문제는 이 감지 점수가 완전한 기준이 아니라는 점이다. 퍼플렉서티, 버스트니스 등 통계 기반 모델은 글의 구조나 어휘 패턴을 정량화할 수는 있지만, 문맥이나 의도, 창의성은 해석하지 못한다. 따라서 탐지기가 인간의 판단을 대신할 수 없으며, 오히려 기계적 수치에 과도하게 의존할 경우 평가 공정성은 크게 훼손하게 된다. 예를 들어 학생이 성실하게 작성한 글이 단지 표현 방식이 단순하거나 반복적이라는 이유로 높은 AI 점수를 받는다면, 이를 그대로 반영한 교수자는 사실상 부정확한 평가를 하게 되는 셈이다. 이처럼 AI 탐지기의 도입이 교수자의 역할을 대체하려는 방향으로 작동한다면, 교육 현장은 기술 중심의 통제 공간으로 바뀔 위험이 있다. 평가자는 탐지기의 결과를 보조 도구로 활용하되, 여전히 중심 판단 주체로 기능해야 한다.
감지 결과에 대한 해석 권한은 누구에게 있어야 하는가
AI 탐지기의 핵심 기능은 문장의 생성 주체를 예측하는 것이다. 하지만 그 예측이 곧바로 부정행위나 학업 성실도에 대한 판단으로 이어지는 것은 아니다. 그럼에도 불구하고 감지기 결과가 학생의 성적이나 징계 여부에 직접 영향을 미치는 사례가 늘어나면서, 교수자의 해석 권한이 점점 더 기술에 종속되고 있다. 이 과정에서 교수자의 책임도 함께 사라지는 문제가 발생한다. 예를 들어 감지기가 90% 이상의 AI 가능성을 제시했을 때, 일부 교수는 해당 결과만으로 과제를 반려하거나 감점을 부여한다. 그러나 감지기에는 오탐지 가능성이 존재하고, 모든 문장을 동일한 기준으로 판단하지 않기 때문에 교수자는 반드시 직접적인 검토와 해석 과정을 병행해야 한다. 또한 감지기 점수만으로 평가가 이루어질 경우, 학생은 자신의 성실성을 입증할 방법조차 가지지 못한다. 이로 인해 학생과 교수 간의 신뢰가 무너지고, 학습 동기 또한 위축된다. 감지기의 기술적 편의성이 교수자의 판단력을 대체하는 순간, 교육의 본질은 사라질 수밖에 없다. 궁극적으로 해석의 권한은 인간에게 있어야 하며, 교수자는 감지기의 판단을 단순히 인용하는 사람이 아니라, 그 결과를 비판적으로 검토하고 교육적 판단으로 변환할 수 있는 역할을 수행해야 한다. 그렇지 않다면, AI 탐지기는 도구가 아니라 결정권자로 변질될 위험이 있다.
평가 자동화가 가져오는 교수자 권한의 축소
AI 탐지기 중심의 평가 시스템이 정착되면서 교육 현장에서는 평가의 ‘자동화’가 빠르게 진행되고 있다. 특히 대형 강의나 온라인 수업에서는 시간과 인력의 제약으로 인해 교수자가 과제나 에세이를 일일이 검토하기보다 탐지기 결과를 근거로 평가를 단순화하는 사례가 증가하고 있다. 이 과정에서 교수자의 판단력은 점차 주변화되고 있으며, 교수자는 기술이 제공하는 수치적 결과를 전달하는 중개자로 전락하고 있는 추세이다. 평가의 자동화는 효율성과 편의성을 앞세우지만, 그 이면에는 평가의 정당성과 책임성이 사라지는 문제가 존재한다. 단순히 AI 가능성 수치만으로 부정행위를 단정하고, 그 결과에 따라 학생의 학업 성과를 결정짓는 구조는 교육적 관점에서 매우 위험하다고 볼 수 있다. 실제로 많은 감지기 모델은 특정 분야의 글쓰기나 반복적 표현을 AI 문체로 오판하는 경향이 있으며, 글의 의도나 문맥적 배경을 전혀 고려하지 않는다. 이 때문에 동일한 과제를 다른 탐지기에 돌렸을 때 서로 다른 결과가 나오거나, 감지 점수가 높은 순수 창작 글이 잘못 판정되는 경우가 발생한다. 그럼에도 불구하고 평가자가 이를 수치 그대로 받아들인다면, 학습자의 권리 보호는 사실상 무력화되게 된다. 교수자의 판단력이 평가 과정에서 배제되는 상황은 학생에게 ‘기계에 의한 평가’를 강요하는 구조를 고착화하며, 이는 결과적으로 평가 불복, 신뢰 붕괴, 교육 관계의 파괴로 이어질 수 있다. 기술이 빠르게 정착되는 현 시점일수록, 교수자의 교육적 직관과 맥락적 이해는 더욱 중요해진다. 인간의 판단은 기술로 대체될 수 없으며, 오히려 기술을 해석하고 조율하는 주체로서의 역할이 강화되어야 한다.
교수자 중심 감지기 활용 모델의 재정립 필요성
AI 탐지기를 평가에 활용할 때 가장 이상적인 방식은, 교수자가 감지 결과를 참고자료로 활용하되 그 해석과 평가의 주도권은 교수자 본인에게 있는 구조다. 즉, 감지기 결과는 ‘추가적 시선’이지 ‘최종 판단’이 되어서는 절대 안 된다. 이를 위해선 교수자 중심의 감지기 활용 모델이 재정립되어야 하며, 교육기관은 이를 제도화해야 한다. 첫째, 감지기 결과는 절대적인 수치가 아닌 맥락적 분석의 시작점으로 설정되어야 한다. 예를 들어, AI 가능성이 높다고 하더라도 글의 목적, 학습자의 배경, 표현 방식 등을 고려하여 종합적으로 판단해야 한다. 둘째, 교수자는 감지기의 한계와 오류 가능성을 숙지하고 있어야 하며, 단순 수치 의존에서 벗어난 비판적 해석 능력을 갖춰야 한다. 이를 위해 교직원 대상의 감지기 해석 교육, 워크숍, 사례 공유 등이 정례화되어야 한다. 셋째, 감지 결과에 따라 학생에게 일방적으로 불이익을 주는 것이 아니라, 해당 결과를 교육적 상담의 기회로 전환할 수 있는 구조를 만들어야 한다. 예컨대 AI 점수가 높게 나온 경우에도 교수자는 학생에게 글의 작성 과정, 자료 활용 방식, 문장 구성 이유 등을 물어보고, 그 과정을 이해한 뒤 최종 판단을 내려야 한다. 이러한 방식은 단순히 평가의 공정성을 확보할 뿐 아니라, 학생의 학습 과정에 대한 존중을 보여주는 교육적 자세이기도 하다. 넷째, 감지기 활용 방식은 수업계획서나 강의 운영방침에 사전 공지되어야 하며, 평가 기준과 함께 감지기 결과가 어떤 방식으로 해석되는지를 모든 학습자가 이해할 수 있어야 한다. 결국 교수자는 감지기의 보조를 받되, 그 결과에 대한 해석과 교육적 판단의 최종 책임자로서 역할을 수행해야 한다. 그래야만 기술은 교육을 보완하는 수단이 될 수 있고, 교수자는 진정한 평가자로 남을 수 있다.