'2025/08/03 글 목록

AI 탐지기 데이터셋 수집 윤리, 개인정보는 보호받고 있는가

AI 탐지기의 감지 정확도는 어떤 데이터를 학습했느냐에 따라 좌우된다. 퍼플렉서티, 버스트니스와 같은 언어 통계 기반 알고리즘은 대량의 문서를 통해 AI 생성 문장과 인간 작성 문장의 차이를 예측한다. 일반적으로 공개된 위키백과, 블로그, 기사, 논문 초록, 교육 보고서 등 다양한 텍스트가 활용되며, 일부는 민간이 수집한 유료 데이터도 포함된다. 최근에는 대학 과제, MOOC 강의 자료, AI 예시 문장까지 포함돼 감지기 성능이 정교해지고 있지만, 동시에 비공개 자료나 교육 목적의 민감한 텍스트가 무단 수집될 가능성도 커지고 있다. 특히 온라인 과제 제출 시스템이나 클라우드 기반 에디터를 통해 수집된 문서들이 탐지기 기업 서버에 저장되고, 감지 기준 학습에 사용되는 구조는 매우 불투명하다. 작성자의 동의..

AI 탐지 2025.08.03

« 2025/08 »

일

월

화

수

목

금

토

일	월	화	수	목	금	토
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

yanjicci 님의 블로그

2025/08/03 2

티스토리툴바