AI가 과학 과목 서술·논술형 평가 '척척'…“원리를 명확히 이해”

경기교육청, AI 서술·논술형 평가시스템 발표 (경기도교육청 제공)
경기교육청, AI 서술·논술형 평가시스템 발표 (경기도교육청 제공)
교사가 설계한 평가 기준 적용…경기교육청, 하반기 시범 운영

“복사평형 원리를 명확히 이해하고, 이산화탄소 등 온실가스 배출량 증가가 지구기온에 미치는 영향을 효과적으로 설명함.”

18일 경기도교육청 수원 광교청사에서 안양의 한 중학교 교사가 지난달부터 국어, 사회, 과학 과목을 대상으로 인공지능(AI) 서·논술형 평가시스템을 현장 실증한 결과를 설명하며 AI가 학생의 과학 문제를 채점한 사례를 제시했습니다.

이 중학교는 이산화탄소 배출량 증가와 지구의 평균기온 관계에 대한 그래프 4개를 분석해 기후변화의 특성과 경향성 서술, 복사평형 원리 설명 등을 묻는 문항을 학생들에게 제시한 뒤 답안을 교사와 AI가 각자 채점해 비교, 분석했어요.

AI의 채점은 우선 학생들이 손 글씨로 작성한 답안을 OCR(광학 문자 인식) 스캔을 통해 디지털 문자로 변환되는 과정으로 시작됐어요.

이후 AI는 온실효과와 지구온난화를 복사평형의 관점으로 설명할 수 있는지, 각 그래프의 변화 추세를 명확히 이해하고 분석해 기후변화의 특성과 경향성을 서술할 수 있는지 등 교사가 미리 설계한 평가 기준에 따라 본격적인 채점에 나섰어요.

교사와 AI의 채점 결과를 비교한 결과 과학 과목에서는 학생 277명의 답안을 채점해 상관계수가 0.957로 나타났습니다.

상관계수는 교사의 채점과 AI가 채점한 결과 사이의 차이를 나타내는 지표로 0은 전혀 상관없음, 0∼0.3은 약한 양의 상관관계, 0.3∼0.7은 보통 양의 상관관계, 0.7∼0.9는 강한 양의 상관관계, 1은 완전한 양의 상관관계를 의미합니다.

과학 과목의 경우 교사의 채점과 AI가 채점한 결과가 거의 같게 나왔다는 것으로 일부 채점 결과가 다른 부분에 대해서는 교사가 다시 확인하는 작업을 거쳐 최종 점수를 채점했어요.

국어와 사회 과목의 상관계수는 각각 0.945, 0.958로 집계됐어요.

AI가 학생들의 답안을 채점하는 데 걸리는 시간은 각 학생의 장단점 등 피드백 제공까지 포함해 5분가량 소요됐다고 해요.

교사와 학생들의 반응은 대체로 긍정적이었습니다.

학생들은 “AI가 이해하지 못할까 봐 구체적으로 답안을 작성했다”, “전에는 점수만 확인했는데 이제는 피드백 내용도 바로 볼 수 있어서 앞으로 뭘 공부해야할지 알 수 있었다”고 말했답니다.

교사들은 “생각의 폭과 깊이를 확장할 수 있는 다양한 논술형 문제를 다루고 싶었지만, 채점 논란의 소지가 있을까 봐 꺼렸는데 이제 AI라는 공신력 있는 보조자료가 생겼다”, “업무 효율성, 전문성 발휘를 동시에 가능하게 하는 중요한 도구”라고 평가했습니다.

도교육청은 시스템 개선, 보완을 거쳐 올해 하반기 중학교 1학년, 고등학교 1학년의 국어, 사회, 과학 과목에서 시범 운영할 계획입니다.

임태희 교육감은 “한국 교육에서 아주 절실한 과제는 교육본질의 회복으로 암기력, 시험 보는 기술을 평가하는 것이 아닌 미래사회에 대비해 필요한 역량, 인성 등을 길러줘야 한다”며 “이를 위해서는 서·논술형 평가가 중요한데 이를 AI가 보조할 수 있는 시스템을 개발한 데 의미가 있다”고 말했습니다.

그는 “이 시스템을 통해 교육본질의 회복과 향후 수능에 적용함으로써 대입제도의 개혁을 이룰 수 있고 교육현장에서는 교사들의 부담을 덜어줄 수 있을 것으로 기대한다”고 덧붙였습니다.

최지호 기자 jhochoi@etnews.com