최근 시력 문제로 인해 평소보다 소리로 정보를 얻는 데 더 의존하게 됨. 오디오북, 오디오 기사, 팟캐스트를 듣는 경험은 혼합적이었지만, 텍스트-오디오 서비스와 오디오-텍스트의 빠른 발전을 깨닫게 됨. 사실상 모든 사운드 편집 소프트웨어는 정교하고 놀라울 정도로 정확한 전사 기능을 내장하고 있음.
몇 년 전부터 신문사들은 자동화된 오디오 버전을 생성하고 있음. 초기 동기는 미디어 소비가 Alexa와 Google Assistant 같은 기기에 의해 지배될 것이라는 믿음에서 시작됨. 하지만 대부분의 사람들은 기술 회사들이 희망했던 것처럼 집에 항상 켜져 있는 스파이를 두는 것에 그리 열광하지 않음.
하지만 하드웨어와 관계없이 자동화된 오디오의 품질은 생성적 인공지능에 의해 빠르게 발전하고 있음. 최근까지도 2001: 스페이스 오디세이의 할(Hal) 유령이 이러한 제품들 위에 떠 있었음. 이제는 과거의 불쾌한 계곡, 이상한 억양, 잘못된 발음은 과거의 일이 됨. 새로운 세대의 자동화된 목소리는 실제 인간과 거의 구별할 수 없을 정도로 완벽에 가까움.
물론 이는 우리와 같은 실제 인간들에게 더 많은 불안감을 안겨줄 것임. 오디오 봇의 대군이 천천히 그러나 확실히 다가오고 있으며, 콜센터 직원, DJ, 일기 예보자, 뉴스 방송 진행자, 대학 튜터 등의 일자리를 빼앗을 것임.
팟캐스트 진행자로서 동료가 구글의 실험적 오디오 개요 기능의 샘플을 공유했을 때 기쁘지 않았음. 구글의 인공지능 도구 제미니를 사용하여 '두 AI 호스트'가 문서, 슬라이드, 차트 등을 매력적인 토론으로 바꾸는 기능임. 최근 아일랜드 타임즈의 기사를 적용했을 때 결과는 동시에 압도적이면서도 미흡했음. 두 미국 목소리가 이 문제를 논의하며 기사를 반쯤 괜찮은 요약을 제공했음. 기술이 더 발전하면 일부 사람들은 원본 텍스트의 단순한 읽기보다 이를 선호할 수도 있음. 하지만 소크라테스의 대화는 아니었음.
그럼에도 불구하고 소크라테스는 이를 승인했을지도 모름. 그는 '파에드루스'에서 서면 텍스트가 구술 문화를 대체하고 있다고 걱정했음. 그는 글쓰기가 학습자의 영혼에 망각을 초래할 것이라고 예측했음. 비슷한 예측이 2,500년 후 인터넷에 대해서도 이루어졌음.
하지만 소크라테스의 두려움에도 불구하고, 현대 문화에는 텍스트를 읽는 것이 소리로 같은 단어를 듣는 것보다 더 깊고 몰입된 참여를 요구한다는 인식이 깊이 뿌리내려 있음. 읽기는 온전한 주의를 요구하지만, 듣기는 저녁을 준비하거나 개를 산책시키면서도 가능함. 그리고 목소리 자체는, 봇이든 인간이든, 단어들로부터 중재자 역할을 하며 때로는 방해가 되기도 함. 현재의 주의 분산 시대에는 더 적합한 매체로 보임.
우리는 우리의 문화가 시각적이고 문해력이 떨어지고 있다고 많이 듣지만, 청각적이고 텍스트가 줄어들고 있다는 이야기는 덜 듣고 있음. 아니면 더 정확하게 말하자면, 서면과 구술이 병합되고 있다는 것임. 이제는 TikTok이나 Netflix 출시, Apple 팟캐스트를 읽거나 들을 수 있음. 이 글도 들을 수 있음.
이러한 말과 텍스트의 결합은 생산뿐만 아니라 소비에도 적용됨. 나는 여전히 키보드로 이 칼럼을 타이핑하고 있지만, 지금은 사용할 수 있는 많은 무료 프로그램을 통해 이를 받아쓰는 것도 가능함. 그 과정이나 결과가 다를까? 존 밀턴에서 바바라 카틀랜드까지 많은 작가들이 자신의 작품을 받아쓰기로 작성했음. 하지만 어떤 사람들은 깃펜에서 타자기, 워드 프로세서로의 발전이 작가의 글쓰기 방식에 변화를 가져왔다고 주장함. 키보드의 종말은 상상하기 어려운 것처럼 보일 수 있지만, 많은 사람들이 손글씨의 종말에 대해서도 같은 말을 했던 것이 그리 오래되지 않음.
결국 불가피한 것에 경의를 표해야 할 것임. 기침을 하고 마이크를 두드림. 이거 잘 들리나요?