미리보기
미리듣기
인공지능으로 음성 위변조를 감지하고 진실을 밝혀내는 과학을 다룬다. 조작된 소리를 가려내는 기술이 신뢰 사회의 새로운 기반이 된다.
생성의 모든 과정을 담고 있는 디지털 기록물이다. 파일 자체에는 생성 시간이나 방식 같은 정보가 남는다. 하지만 이러한 편집 과정과 저장된 정보는 포렌식 전문가들에게는 위변조 흔적을 찾는 중요한 단서가 되기도 한다. 예를 들어 서로 다른 시점의 녹음을 이어 붙이면 배경 소음이 미세하게 달라지고, 과도하게 음량을 키우다 보면 파형의 꼭대기나 밑부분이 잘려나가는 클리핑(clipping) 현상이 발생하기도 한다. 또한 다시 인코딩하면 재압축 과정에서 규칙적인 잡음 패턴이 나타나기도 한다.
-01_“오디오 파일의 위변조 가능성” 중에서
우리의 귀는 소리의 내용을 듣지만, 전문가는 소리의 모양을 본다. 그러기 위해서는 들리지 않는 디지털 오디오 파일을 시각화해야 한다. 즉, 눈에 보이지 않는 소리를 그래프나 지도처럼 만들어 분석하는 과정을 음향 신호 분석이라고 한다. 음향 신호 분석은 주로 세 가지 방식인 파형(waveform), 스펙트럼(spectrum), 스펙트로그램(spectrogram)의 형태를 이용한다. 이러한 분석은 편집 구간에서 나타나는 불연속성, 이상치(outlier, 전체 데이터 패턴이나 분포에서 크게 벗어난 값), 노이즈 패턴 변화를 관찰하는 데 목적이 있다.
-03_“디지털 오디오 위변조 탐지를 위한 전통 기술” 중에서
오디오 편집 데이터세트의 부재에 의해 오디오 편집 탐지는 여전히 전문가의 영역으로 남아 있다. 오디오 위변조가 정교해지면서 위변조 탐지는 위변조범이 남긴 사소한 실수를 찾는 것처럼 변해가고 있다. 더욱이 포토샵처럼 AI를 이용한 오디오 편집 기능이 소프트웨어에 추가된다면 편집의 흔적은 더욱 숨겨질 것이다. 오디오 편집 탐지를 위한 AI 모델의 개발을 위해 기존의 경계 영역 탐지를 넘는 새로운 특징 추출 및 알고리즘 개발을 기반으로 한 이에 적합한 데이터세트 구축이 필요하다.
-06_“오디오 포렌식을 위한 데이터세트 구축과 처리” 중에서
오디오 포렌식 기술이 왜 필요한지를 가장 극명하게 보여 주는 것이 바로 딥페이크 음성 기술의 악용 사례다. 이는 사회적 혼란과 실질적인 피해를 야기하는 현실의 위협으로 자리 잡고 있다. AI 음성 합성 기술의 급격한 발전으로 보이스피싱은 더 교묘해지고 있다. 딥페이크 음성을 활용하여 자녀나 가족, 지인의 목소리를 똑같이 복제하여 돈을 요구하는 보이스피싱은 이미 현실화되어 큰 피해를 낳고 있다. 2024년 보이스피싱 피해액은 8545억 원으로 1년 새 두 배로 증가했으며, 올해는 지난해 동기 대비 99% 증가했다.
-09_“AI 오디오 포렌식 기술의 한계와 윤리적 이슈” 중에서
