미리보기
미리듣기
인공지능이 인간 못지않은 언어 능력을 보이는 시대, 우리는 이제 언어의 윤리성을 다시 물어야 한다. 《인공지능과 언어 윤리》는 데이터 편향과 문서화 부재에서 비롯된 인공지능 언어의 윤리 문제를 짚고, 비윤리적 표현의 정의와 유형, 한국어의 맥락적 특성, 매체별 사례, 교육적 과제를 아우르며 언어 윤리의 새로운 방향을 제시한다.
요컨대 기계가 창조하는 언어는 대규모 데이터의 속성과 직결된 ‘학습 데이터’ 자체의 본질적인 문제를 지닌다. 이러한 한계는 “누가 말하고, 무엇을 모으고, 어떻게 거르는가”라는 데이터 구축의 전 과정이 투명한 절차와 단계를 거칠 수 없다는 점에서 발생한다. 기계적 창조성은 인간 언어의 창조성과 달리 의도나 맥락이나 윤리적 인식을 가지지 않으며 언제 어디서나 왕성한 생산성을 보인다. 따라서 인공지능이 창조한 텍스트나 음성 데이터의 파급 효과는 우리가 예상할 수 있는 범위를 뛰어넘는다. 우리는 인공지능 시대에 이러한 기계적 창조성이 특정한 관점의 세계관에 편중될 가능성, 비윤리성과 차별을 재생산할 가능성을 반드시 고려하고 대비해야 한다.
-01_“인공지능 시대에 언어 윤리성은 왜 중요한가?” 중에서
언어 연구에서 요즘처럼 ‘비윤리적 표현’에 대한 관심이 많았던 시대는 없었다. 언어학 연구의 주변부에 머물러 있던 욕설, 비속어, 차별·혐오 표현 등에 대한 관심은 인공지능의 확산에 따라 언어학을 비롯한 인문학 전반에서 가장 중요한 문제로 대두되었다. 문제의 본질은 기계의 언어 창조성 이면에 존재하는 언어 윤리의 문제를 어떻게 예방하고 대응할 것인가와 관련된다.
-02_“비윤리적 표현이란 무엇인가?” 중에서
인공지능의 일상화에 따라 국제적으로도 생성 결과에 대한 책임성, 생성 결과의 정확성과 검증 가능성, 사용 여부에 대한 투명성 등이 핵심적인 과제로 떠오르고 있다. 한국어의 언어적 특성과 사회 문화적 맥락을 반영한 비윤리적 표현의 분류 체계와 탐지 및 비식별화의 기준 마련은 인공지능 개발에서 반드시 고려되어야 할 윤리적 요소다. 단순히 욕설이나 비속어를 제외하는 기술적 조치를 넘어서 인공지능이 사회적 다양성과 평등 가치를 내재화할 수 있도록 언어의 윤리성에 대한 사전학적, 사회언어학적 분석을 기반으로 한 언어 정책적 설계가 필요하다. 인공지능의 언어 윤리는 가까운 미래 인공지능의 사회적 수용성과 공공성 확보 측면에서도 필수적인 과제가 될 것이다.
-04_“비윤리적 표현과 독자 인공지능” 중에서
