미리보기
미리듣기
문법 교육에서 질문을 통해 사고를 확장하고, 교사의 전문성과 학생의 탐구를 함께 성장시키는 새로운 교육 패러다임을 제시한다. AI를 정답 기계가 아닌 학습 파트너로 바라본다.
그렇다면 이 거대한 변화의 흐름 속에서 문법 교육 분야는 AI의 등장을 어떻게 받아들이고 있을까? 안타깝게도, 다른 분야에 비해 그 반응은 상대적으로 조용하다. 챗지피티가 등장한 지 3년 가까운 시간이 흘렀지만, 모국어 화자를 대상으로 한 문법 교육 분야의 AI 관련 국내 연구는 손에 꼽을 정도로 적다. 수학이나 영어 교과는 물론, 같은 국어 교과 내에서도 쓰기나 문학 교육 분야에서는 이미 AI 도입에 대한 논의가 활발한 것과 비교하면 더욱 두드러지는 침묵이다.
왜일까? 크게 세 가지 이유를 추측해 볼 수 있다. 첫째, 아직 AI가 문법 교육에서 어떤 역할을 할 수 있을지 뚜렷한 그림이 그려지지 않기 때문일 수 있다. 둘째, 한국어 문법에 대한 AI의 불완전한 성능으로 인해 교육 현장에서 활용하기엔 시기상조라는 판단 때문일 수도 있다. 셋째, AI가 문법 규칙을 명시적으로 학습하는 것이 아니라 데이터의 패턴으로 언어를 구사한다는 점, 즉 그간 문법 교육이 다루어 온 방식과는 너무나도 이질적인 존재라는 점에서 오는 당혹감 때문일 수도 있다.
-01_“AI와 문법 교육 동향” 중에서
피안타도시는 AI가 문법적 감각을 지녔을 가능성도 제시한다. 그가 GPT-3.5에게 촘스키가 제시했던 유명한 예문인 “Colorless green ideas sleep furiously(무색의 녹색 생각들이 맹렬하게 잠을 잔다)”를 보여 주자, AI는 이 문장이 문법적으로는 맞지만 의미가 이상하다고 답했다. 반면 “Green sleep furiously colorless ideas(녹색 잠자다 맹렬하게 무색의 생각들)”를 제시했을 때는 문법적으로 어색하다고 지적했다. 이는 촘스키의 주장과는 달리, AI가 의미의 유무와는 별개로 문장의 ‘문법성’을 판단하는 능력을 내면화하고 있음을 시사한다.
-03_“AI의 문법과 인간의 문법” 중에서
무엇보다 중요한 것은 전문성을 갖춘 문법 교사의 참여다. 문법 교육의 실제 맥락을 가장 잘 이해하고 있는 이들은 현장의 교사들이다. 어떤 문법 개념에서 학생들이 자주 오개념을 보이는지, 어떠한 설명 방식이 효과적인지, 피드백은 언제 어떤 방식으로 제시되어야 하는지를 가장 잘 아는 ‘현장 전문가’이기 때문이다. 동일한 문법 지식을 학습자의 상황에 맞춰 다채로운 ‘교수 내용 지식(PCK)’으로 만들어 낼 줄 아는 사람 역시 교사다. AI가 유능한 튜터가 되려면, 바로 이 교사들이 직접 참여하여 만든 고품질 데이터로부터 학습해야 한다.
하지만 교사만으로는 충분하지 않다. 교사의 전문 지식과 노하우가 AI가 학습할 수 있는 ‘데이터’로 전환되기 위해서는 데이터 전문가와의 협업이 필수적이다. 교사가 제공한 설명이나 대화 자료는 자연어 형태이므로, 이를 AI가 이해할 수 있는 구조로 변환해야 한다. 이 과정에서 문장에 품사 정보를 부착(태깅)하고, 구문 구조를 분석하며, 피드백의 유형을 분류하는 등의 기술적 작업이 필요하다. 또한 온톨로지 형태로 문법 개념의 위계와 관계를 설계하려면, 지식 표현 언어(예: RDF, OWL)에 대한 기술적 이해도 요구된다.
-06_“고품질 데이터의 중요성” 중에서
신구조주의에 따른 단어 의미에 대한 관점은 분포 가설(Distributional Hypothesis)로 집약된다. 이는 언어학자 퍼스(John Firth)의 “단어는 그것이 함께 어울리는 동료를 통해 알 수 있다(You shall know a word by the company it keeps)”라는 말로 요약될 수 있다. 즉, 한 단어의 의미는 해당 단어가 대규모 텍스트에서 주로 어떤 단어들과 함께 나타나는지, 그 통계적 분포(distribution) 정보에 의해 결정된다는 것이다. 가령 ‘따뜻한’은 ‘커피’, ‘날씨’, ‘마음’ 등과 함께, ‘차가운’은 ‘얼음’, ‘바람’, ‘표정’ 등과 함께 나타나는 경향이 있다. 이처럼 함께 등장하는 단어들의 패턴을 통계적으로 분석하면 ‘따뜻한’과 ‘차가운’의 의미적 차이를 객관적으로 규정할 수 있다. 이러한 분포 가설은 현대 인공지능의 자연어 처리 기술의 원리가 된다. 워드투벡(W
ord2Vec)과 같은 단어 임베딩(word embedding) 모델은 분포 가설을 수학적으로 구현한 대표적인 사례다.
-09_“문법 교육 내용의 변화 방향” 중에서