미리보기
미리듣기
AI 시대의 한국어는 단순한 의사소통 수단이 아니라 인공지능이 학습하는 데이터가 된다. 이 책은 국어 사랑과 규범 준수를 넘어, 어떤 한국어가 기술 시스템 안에서 남고 재생산되는지를 묻는다. 국어 의식을 언어의 공공성과 책임을 성찰하는 태도로 새롭게 정의하며, AI 시대 국어교육과 언어 주권의 방향을 깊이 있게 탐구한다.
이러한 관점에서 보면, 국어 의식 역시 단순히 ‘국어에 대한 생각’ 또는 ‘국어를 사랑하는 마음’으로 정의하기 어렵다. 국어 의식이라는 말이 사용될 때에는 늘 어떤 문제 상황이 함께 놓여 있다. 국어를 제대로 쓰지 못한다는 우려, 외래어와 외국어의 범람에 대한 문제의식, 한글과 국어의 가치를 지켜야 한다는 생각, 표준어와 방언의 관계, 다문화 사회에서의 한국어 위상, AI 시대 한국어 데이터의 문제 등이 그 배경을 이룬다. 따라서 국어 의식은 단순한 마음 상태가 아니라, 국어를 둘러싼 현실을 어떻게 바라보고 판단하며 실천할 것인가와 관련된 개념으로 이해할 필요가 있다.
-01_“국어 의식의 개념” 중에서
과거의 국어 의식이 국어를 지키고 표준화하며 교육하는 문제와 관련되었다면, 오늘의 국어 의식은 한국어가 기술 환경 속에서 어떻게 대표되고 활용되는가의 문제와 연결된다. AI가 학습하는 한국어 자료에는 어떤 문체가 많이 들어 있는가. 방언과 지역어, 청소년 언어, 전문어, 장애인의 의사소통 자료, 공공언어 자료는 충분히 반영되어 있는가. AI가 만들어 내는 한국어는 자연스럽고 책임 있는가. 특정 집단에 대한 편견을 담고 있지는 않은가. 이러한 질문은 모두 새로운 국어 의식의 문제다. AI 시대의 국어 의식은 단순히 국어를 사랑하자는 태도만으로는 충분하지 않다. 이제 국어 의식은 한국어 데이터의 대표성, 공공성, 품질, 윤리성을 함께 따져 보는 능력과 연결된다. 국어가 기술 속에서 어떤 모습으로 남을 것인지, AI가 어떤 한국어를 배우고 다시 우리에게 돌려주는지, 그 과정에서 우리는 어떤 기준을 가져야 하는지를 생각해야 한다.
-03_“국어 의식의 변동사” 중에서
많은 사람들은 데이터를 객관적인 것으로 생각한다. 데이터라는 말에는 마치 현실을 있는 그대로 담은 자료라는 인상이 있다. 그러나 언어 데이터는 완전히 중립적이지 않다. 어떤 문장을 모을 것인지, 어떤 표현을 제외할 것인지, 어떤 기준으로 오류를 고칠 것인지, 어떤 말에 표지를 붙일 것인지는 모두 사람의 판단과 제도적 기준을 거친다. 데이터는 현실을 반영하지만, 동시에 현실을 특정한 방식으로 정리하고 해석한다. (…) 이런 점에서 한국어 데이터의 문제는 곧 국어 의식의 문제다. 국어 의식이란 국어를 그냥 사용하는 데 그치지 않고, 국어 현실을 살피고 판단하며 더 나은 방향으로 가꾸려는 힘이다. 그렇다면 AI 시대의 국어 의식은 데이터에도 적용되어야 한다. 우리는 어떤 한국어가 데이터로 남고 있는지, 어떤 한국어가 빠지고 있는지, 어떤 표현이 표준적인 것으로 학습되고 있는지 물어야 한다. 한국어 데이터의 대표성과 공공성은 이제 국어를 가꾸는 중요한 기준이 된다.
-06_“AI 시대와 언어 데이터” 중에서
AI 시대의 국어 의식 교육은 한국어 데이터에 대한 감각을 포함해야 한다. 데이터라는 말은 학생들에게 기술적이고 멀게 느껴질 수 있지만, 사실 언어 데이터는 우리의 말과 글에서 만들어진다. 학생들이 쓰는 댓글, 학교 게시판의 글, 지역 안내문, 뉴스 기사, 방송 자막, 교과서 문장, 공공기관의 공지문 등이 모두 언어 데이터가 될 수 있다. 그러므로 한국어 데이터는 추상적인 기술 자료가 아니라, 우리 사회의 언어생활이 축적된 결과다.
-09_“AI 시대 국어 의식 교육의 방향과 과제” 중에서
