온라인 동영상에 붙는 자막은 공공장소에서, 혹은 몰래 보는 영상일 경우 소리를 끈 채 영상을 즐길 수 있게 해 준다. 이런 사용자가 많다는 사실을 발견한 페이스북은 사용자가 영상을 보다 폰의 볼륨을 0으로 줄이면 자동으로 자막이 등장하는 기능을 도입하기도 했다. 하지만 자막 기능의 가장 중요한 사용자는 청각장애인들이다. 이들이 말이 들어간 영상을 즐기기 위해서는 자막이 필수적이다. 문제는 이 자막을 누가 만드느냐다. 가장 좋은 건 영상 제작자, 즉 크리에이터가 만드는 것이지만 시간과 돈이 들어가는 이 작업을 하지 못하는 경우가 많다. 그래서 유튜브는 인공지능을 통한 자동자막 생성 기능을 개발했지만 아직 부족하다. 특히 정확하지 않은 발음이 많은 일상의 대화나 유행어의 경우에 오류가 많다. 그래서 많이 사용하던 것이 커뮤니티 자막작업 기능이다. 채널의 팬 커뮤니티가 참여해 작업해 주는 방식으로, 기계보다 정확하게 문맥을 파악해 자막을 만든다. 그런데 유튜브는 이 기능을 없애버렸다. 누구나 자막을 작성할 수 있게 하자 이를 악용해 광고를 하거나 장난을 치는 사람이 많다는 것이 그 이유였다. 청각장애인들이 크게 반발했지만 기업의 결정이니 어쩔 도리가 없었다. 하지만 그 이후 유튜브의 자막 편집기를 사용해서 직접 자막 작업을 하는 크리에이터가 급증했다고 한다. 자막이 사용자들에게 얼마나 중요한지 확인했기 때문이다. 청각장애인뿐 아니라 주의력 결핍 장애, 학습 장애를 갖고 있는 사람들, 그리고 직장이나 수업시간에 몰래 영상을 보는 사람들까지 아주 많고 다양한 사람이 자막의 도움을 받고 있다는 사실을 깨달은 거다. 박상현 / 오터레터 발행인디지털 세상 읽기 유튜브 자막 유튜브 자막 커뮤니티 자막작업 자동자막 생성
2023.01.27. 20:46
병동에서 두 환자 간에 주먹다짐이 터졌다. 한밤에 일어난 일. 간호일지에 올라온 리포트에 이유불명이라 적혀 있다. 이 두 환자의 성품이며 공격성이 어떻게 다른지, 서로가 어떤 상황에 민감한 성격인지 나는 알고 있다. 한쪽은 늘 시끌벅적하게 말이 많은 편이고 다른 쪽은 좀 둔감한 듯하지만 때에 따라 사나운 언행도 마다치 않는다. 편의상 이 글에서 전자를 C, 후자를 A라 부를까 한다. 당직 의사가 A에게 진정제 주사 처방을 내렸다. 보조간호사가 뜯어말리기까지 서로들 치고받고 싸웠지만 C가 갈비뼈가 부러졌다며 엄살을 부렸고 A는 C를 향하여 계속 공격적인 자세를 보였다는 이유로 이루어진 처사로 보인다. A는 언어 감각이 C를 쫓아가지 못한다. 당직 의사는 C를 피해자로, A를 가해자로 판단을 내린 후 응당 가해자를 다스려야 한다는 생각을 한 것 같다. A가 C에게 이 새끼, 저 새끼 하며 욕을 했다는 리포트 또한 의사의 판단에 크게 기여한지도 모른다. 우리는 가해자보다 피해자를 선호한다. 가해자를 미워하고 피해자를 동정한다. 그래서 우리는 앞을 다투어 피해자 코스프레를 하는 데 여념이 없다. 급기야 가해자가 아닌 밤중에 볼기짝에 근육주사를 맞는 장면에서 무대는 막을 내린다. 두 환자를 따로따로 인터뷰한다. 둘 다 똑같은 말을 한다. 아무 이유 없이 복도를 걸어가는데 상대에게 맞았다는 주장이다. 목격자 보조간호사를 소환해서 자초지종을 물었다. - C가 오밤중에 노래를 부르며 복도를 걸어간다. 반대쪽에서 걸어오던 A가 시끄럽다며 그를 나무란다. C가 A의 왼쪽 어깨에 펀치를 날리자 고등학교 때 권투 선수였던 A가 C의 몸통을 익숙한 솜씨로 갈비뼈서껀 여기저기 두들겨 팬다. 누가 말릴 때까지. 당직 의사는 간호사에게서 얼추 보고를 받고 두 환자를 접견했을 것이다. 간호사가 그 의사에게 A가 왕년에 고등학교 권투 선수였다는 사실을 귀띔해주었을지도 모르지. 우리는 사전정보(事前情報)에 매달리는 선입관의 노예 상태를 벗어나지 못한다. 선입관은 편견의 어머니! 이 세상 그 누구도 좋거나 나쁜 선입관과 편견에서 자유롭지 않다. 우리가 헤어나지 못하는 편견 중에서 ‘text, 자막, 문자’처럼 무서운 것이 또 있을까, 하는 10월 초에 낙엽이 한 잎 두 잎 떨어지는 창밖 떡갈나무를 응시한다. 통상 ‘text’보다 ‘context, 문맥, 자초지종, 맥락, 앞뒤 관계’가 더 중요하다. 그러나 텍스트가 컨텍스트를 파괴하는 일이 빈번히 발생한다. 2022년 9월 22일 뉴욕. 잡음 때문에 음질이 불량한 녹음 상태에서 윤석열 대통령이 한 말을 화면 하단에 자막 처리한 동영상 쪼가리를 본다. 문자, 문서라면 쪽을 못 쓰는 우리! 자막 처리는 음성 데이터를 조작하여 허위정보와 더불어 여론 조작의 지름길이 된다. ‘text’는 12세기에 책, 복음서라는 뜻이었다가 14세기 말글, 문자, 문서라는 의미로 변했다. 전인도 유럽어에서 ‘(옷감 같은)직물, 조작, 날조’의 동사형으로 쓰였던 말. 문자, ‘텍스트’에는 의미를 창조하는 뜻 외에 없는 사실을 조작한다는 음흉한 면목이 숨어있다. ‘technic, 기술’도 ‘text’와 어원이 같다. ‘text’보다 ‘context’에 신경을 곤두세운다. 하지만 내게 있어서컨텍스트보다 더 중요한 것은 동기의식! 몇달 전 C는 내게 이렇게 떠들어댔다. - “나는 A, 그 새끼가 왕년에 권투깨나 했다고 으스대는 것이 꼴 보기 싫다. 언젠가 손을 좀 봐야겠어.” 서량 / 시인·정신과 의사잠망경 자막 text 자막 목격자 보조간호사 context 문맥
2022.10.04. 17:21