새로운 압축 패러다임
저는 코드를 작성하면서 한 가지 근본적인 불편함을 느꼈습니다. 코드는 끝없이 아래로만 쌓이고, 개발자들은 이를 해결하기 위해 코드를 접거나 압축하는 방식으로 임시방편을 씁니다. 그래서 3d cmd창 같은 것을 구상해봤습니다.그런데 이 순간 저는 더 큰 문제를 발견했습니다. 이건 코드만의
문제
저는 코드를 작성하면서 한 가지 근본적인 불편함을 느꼈습니다. 코드는 끝없이 아래로만 쌓이고, 개발자들은 이를 해결하기 위해 코드를 접거나 압축하는 방식으로 임시방편을 씁니다. 그래서 3d cmd창 같은 것을 구상해봤습니다.그런데 이 순간 저는 더 큰 문제를 발견했습니다. 이건 코드만의 문제가 아니었습니다. 인류가 디지털 콘텐츠를 저장하는 방식 전체가 같은 한계를 갖고 있었습니다. 지금 우리는 영화 한 편을 50GB, 게임 하나를 100GB로 저장합니다. 유튜브에는 매분 500시간 분량의 영상이 업로드되고, 전 세계 데이터센터는 인류 전체 전력의 1~2%를 소비합니다. 기존의 압축 기술은 이 문제를 근본적으로 해결하지 못합니다. 결과물을 조금 작게 만들 뿐, 결과물을 통째로 저장한다는 방식 자체는 바뀌지 않기 때문입니다. 저는 여기서 방향을 완전히 뒤집어야 한다고 생각했습니다. 결과물을 저장하는 것이 아니라, 그 결과물을 만드는 최소한의 아이디어와 의도만 저장하면 어떨까 하는 생각이었습니다. 마치 완성된 건물을 보고 설계도를 역으로 그려내듯이, 영화나 이미지나 음악을 입력하면 AI가 그것을 재현할 수 있는 레시피를 역으로 추출하는 것입니다. 그리고 그 파일을 열 때는 저장된 레시피를 바탕으로 AI가 원본과 구별 불가능한 수준으로 재생성합니다. 이것이 제가 말하는 역설계 기반 압축입니다. 기존 압축이 결과물을 작게 만드는 것이라면, 역설계는 결과물을 재현하는 최소한의 정보만 남기는 것입니다. 영화 50GB가 레시피 1KB로 줄어들고, 그 레시피로 언제든 원본을 다시 꺼낼 수 있습니다. 이미 Stable Diffusion의 이미지 역추출, NeRF의 3D 공간 역추출 같은 유사한 기술들이 존재합니다. 저는 이것들을 통합하고 확장해서 모든 디지털 콘텐츠에 적용할 수 있다고 봅니다. 물론 기술적 난관이 있습니다. AI 생성이 매번 동일한 결과를 보장하지 않는다는 결정론 문제, 역추출한 파라미터로 재생성했을 때 원본과 얼마나 같은지 검증하는 문제가 남아있습니다. 하지만 픽셀 단위의 완벽한 일치가 아니라 사람이 구별하지 못하는 수준을 목표로 한다면, 지금의 기술로도 시작할 수 있습니다. 이 아이디어가 완성되면 인류의 모든 디지털 콘텐츠가 USB 하나에 들어갑니다. 넷플릭스와 유튜브의 서버 비용이 사라지고, 느린 인터넷 환경의 사람들도 모든 콘텐츠에 접근할 수 있으며, 화성에 인류 문명 전체를 단 몇 KB로 전송할 수 있을 것입니다.
필요한 사람
데이터 비용을 지불하는 모든 기업과 데이터 접근이 막힌 모든 사람들 그리고 많은 자료를 가졌지만 공간을 더 효율적으로 저장하고 싶은 사람