AI 탐지기, 학술지 투고 기준에 어떻게 반영되고 있나
최근 생성형 AI의 등장과 활용이 폭발적으로 증가하면서, 전 세계 주요 학술지들은 투고 논문의 진정성과 작성자의 개입 정도를 판단하기 위해 AI 탐지기를 점차 도입하고 있다. Nature, Science, IEEE, Elsevier 등 주요 국제 저널은 논문 투고 시 ChatGPT 등 생성형 AI의 사용 여부를 명시하도록 요구하고 있으며, 일부 학술지에서는 AI 탐지기를 통해 투고된 원고가 인간에 의해 작성되었는지 사전 점검을 진행한다. 이는 연구 윤리를 유지하고, 논문의 신뢰도를 확보하기 위한 조치이지만, 기술적 불완전성과 해석 기준의 다양성으로 인해 많은 논란도 함께 발생하고 있다. 특히 탐지기의 점수가 논문 심사 통과 여부에 직접 영향을 미치는 경우가 증가하면서, 연구자들은 작성 전부터 탐지기 점수 하락을 고려한 ‘투고 최적화 전략’을 취하기도 한다. 이처럼 AI 탐지기는 기존의 표절 탐지 시스템과는 달리, 저자의 글쓰기 행위 그 자체를 문제 삼을 수 있기 때문에, 학술지에서 이 기술을 도입하는 과정에서 더욱 신중하고 세밀한 기준이 요구되고 있다.
AI 탐지기 기반 사전 심사 시스템의 실제 사례
학술지의 AI 탐지기 도입은 단순한 기술 채택을 넘어, 평가 시스템 전반의 구조를 바꾸고 있다. 대표적으로 Science는 편집장 명의로 “생성형 AI에 의해 작성된 문장은 원칙적으로 논문에 포함될 수 없다”는 정책을 발표하고, GPTZero 또는 자체 감지 시스템을 통해 초안 단계에서 원고를 점검한다. 이 과정에서 AI 탐지기 점수가 일정 기준 이상일 경우, 별도의 심사 없이 원고가 반려되기도 하며, 작성자가 AI 도구를 어디에 어떻게 활용했는지를 명시하지 않으면 논문 심사 대상에서 제외될 수 있다. 반면 Elsevier는 다소 유연한 입장을 취하고 있다. 해당 학술지는 AI 도구 사용 여부를 명시하되, 문법 수정이나 문장 다듬기 수준에서는 활용을 일부 허용하고 있으며, AI 탐지기 점수만으로 논문을 반려하지 않는다. 국내에서도 일부 SCIE급 저널은 투고 시 AI 사용 여부 자가진단 체크리스트를 제출하도록 요구하고 있으며, Turnitin AI 감지 기능을 이용해 투고 원고를 점검하고 있다. 이러한 시스템은 연구 윤리 강화라는 명분 아래 진행되고 있지만, 각 학술지마다 기준이 다르기 때문에 연구자들은 논문을 투고하기 전, 각 저널의 AI 탐지기 사용 정책을 반드시 숙지해야 하는 환경이 조성되고 있다.
AI 탐지기 도입으로 인한 학술 논문의 변화와 대응 전략
AI 탐지기의 확산은 학술 논문의 작성 방식과 전략에도 직접적인 영향을 주고 있다. 먼저 연구자들은 원고 작성 시부터 AI 탐지기를 의식하며 문체를 조절하거나, 작성 초안을 일부 수기로 남겨놓는 방식으로 대응하고 있다. 특히 영문 논문을 작성하는 비원어민 연구자들은 AI 탐지기를 통과하기 위해 단순한 문장을 피하고, 어휘 다양성과 문장 구조의 복잡성을 인위적으로 높이려는 경향을 보인다. 이로 인해 오히려 논문이 불필요하게 복잡해지거나, 자연스러운 흐름이 깨지는 부작용도 발생한다. 또한 일부 연구자는 AI 도구로 작성한 내용을 그대로 사용하는 대신, paraphrasing 도구를 활용하거나 리라이팅 서비스에 맡기는 방식으로 AI 탐지기 점수를 낮추고 있다. 이런 대응 전략은 학술적 진실성과 거리가 멀 수 있으며, 본질적으로는 ‘탐지기 통과’를 위한 전략적 글쓰기일 뿐이다. 결국 AI 탐지기의 점수가 학술지 투고의 통과 여부를 결정짓는 핵심 변수로 작용한다면, 이는 학문적 가치보다는 기술 회피 전략이 강조되는 왜곡된 글쓰기 문화로 이어질 수 있다. 따라서 학술지에서는 탐지기 결과를 판단의 보조 자료로 활용하되, 평가자의 해석과 저자의 소명을 포함한 종합적 검토가 병행되어야 한다.
AI 탐지기 기반 투고 평가의 바람직한 방향
AI 탐지기가 학술지 투고 기준에 포함되는 것은 필연적인 흐름일 수 있지만, 그 활용 방식에 따라 긍정적인 변화도, 부작용도 발생할 수 있다. 바람직한 방향은 탐지기를 단일 기준으로 삼는 것이 아니라, 작성자의 창의성과 기여도, 연구의 독창성, 주장의 논리성 등 다른 평가 기준과 함께 종합적으로 해석하는 것이다. 특히 학술지는 AI 탐지기 결과를 투명하게 설명하고, 작성자가 소명할 수 있는 구조를 마련해야 한다. 점수가 높다고 해서 무조건 반려하는 것이 아니라, 어떤 문장이 어떤 기준으로 감지되었는지를 공유하고, 작성자가 그에 대해 설명하거나 재작성 기회를 가질 수 있어야 한다. 또한 학술지별로 탐지기 점수 기준과 해석 방법이 다르기 때문에, 이를 통일하거나 국제 학술 협회 차원에서 가이드라인을 제공하는 것도 하나의 방향이 될 수 있다. 결국 AI 탐지기의 도입은 연구 윤리 강화라는 측면에서 필요한 변화지만, 그 기술이 평가의 중심이 되지 않도록 하는 제도적 균형이 반드시 필요하다. 학술지의 역할은 기술을 맹신하는 것이 아니라, 인간의 지적 기여를 정확하게 판별하고 평가하는 것이다. AI 탐지기는 그 보조 수단일 뿐이며, 평가의 본질은 여전히 인간 중심의 해석과 판단에 있어야 한다.
나아가 학술지 편집위원회는 AI 탐지기를 활용한 평가 결과에 대해 정기적인 점검과 오류 분석을 수행해야 하며, 특정 언어권이나 학문 분야에서의 편향 가능성을 지속적으로 검토해야 한다. 단지 기술의 도입이 아니라, 그 기술이 학문적 판단에 어떤 영향을 미치고 있는지를 돌아보는 자정적 시스템이 병행될 때, AI 탐지기는 학문 생태계에 긍정적인 기여를 할 수 있다.