김용대 서울대 교수

얼마 전 한 언론이 검찰총장의 혼외 자녀 의혹을 제기하면서 온 사회가 떠들썩했다. 결국 그는 총장직에서 물러나면서, 자신의 결백을 입증하기 위해 “유전자 검사를 할 용의도 있다”는 말도 했다. 하지만 그 뒤로는 아무런 소식이 들리지 않고 있다.

오늘은 이 유전자 감식에 빅데이터가 어떻게 관여하는지 이야기해 볼까 한다. 그전에 잠시, 동서양의 가족 문화를 살펴볼 필요가 있다. 동서양을 막론하고 대개 자식은 아버지의 성을 따르는 게 관행이다. 여성의 사회적 지위가 높은 유럽국가에서도 예외를 거의 찾아 볼 수 없을 정도다.

심지어 미국에서는 결혼 후 부인이 남편의 성을 따르기도 한다. 물론 요즘은 자기 성을 그대로 유지하는 여성도 많다. 국내에도 부모의 성을 모두 따서 자신의 성을 복수로 쓰는 사람도 있다. 애당초 사람 이름의 성에 관한 한 부친의 성을 따르게 된 배경에는 출산 방법이 자리잡고 있는 것이 아닌가 한다.

◆ 친부는 산모만 알 수 있어

임신과 출산은 여성의 몸에서 진행된다는 점에서 거의 전적으로 여성 몫이라 할 수 있다. 따라서 태어난 아이의 엄마가 누구인지에 대해서는 누구보다 산모가 가장 잘 안다. 반면 태어난 아이의 아빠가 누구인지를 알아내기란 한층 복잡한 일이 된다. 결국 이 역시 전적으로 엄마의 정보에 의존할 수 밖에 없다.

태어난 아이에 대해 친부(親父)를 정해주는 것이 엄마의 중요한 의무 중 하나라고 한다면, 아이에게 아빠의 성을 붙여주어 사회적으로 인정을 받게 하는 것도 엄마의 역할이 된다. 결국 아빠의 성을 따르는 것은 친부가 누구인지 공인해 줌으로써 가족 질서를 유지하는 하나의 사회 장치라고 할 수 있다. 이러한 사회 장치를 법률로 뒷받침하는 것이 바로 결혼 제도다. 남녀는 혼인신고를 통해 앞으로 태어날 아이의 법적 아버지를 명확히 규정해 두게 된다.

하지만 이런 법률 제도는 생물학적 아버지와 법률적 아버지가 다른 경우에 적지 않은 문제와 갈등을 낳게 된다. 특히 우리나라에서는 생물학적 친자의 권리를 폭넓게 인정하고 있어 갈등은 커진다. 가령 유산 상속 시에는 법적인 자식들 이외에 모든 생물학적 자식들에게도 동등한 상속권을 인정한다. 이 때문에 생물학적 친자 여부에 대한 관심과 집착은 대단히 크다.

최근에 전직 여성 국회위원이 자기 아들의 친부로 유명 목사의 아들을 지목한 일이나, 현직 검찰총장이 혼외 자식설에 휘말려 자진 사퇴까지 하게 된 사건은 모두 우리 사회에서 여전히 생물학적 아버지가 얼마나 큰 관심사인지를 보여준다.

하지만 법률적인 부자 관계는 가족관계를 증명하는 공문서를 통해 쉽게 확인할 수 있는 반면, 생물학적 친자 관계는 사실 확인이 어렵다. 1차적으로 친모의 증언이 가장 중요하겠지만, 이 또한 객관적으로 확인될 수 있는 장치가 필요하다.

1930년대를 배경으로 한 김동인의 소설 ‘발가락이 닮았다’에서는 주인공이 법률상의 자기 아들이 생물학적으로도 친자임을 확인하기 위해 눈물겨운 노력을 벌인다. 주인공은 아이의 둘째 발가락이 자기의 것과 닮았다는 것으로 자신이 아들의 생물학적 아버지임을 확인해주는 증거로 삼으려 한다.

◆ 친자 판정에 쓰이는 유전자는 15개 정도

최근에는 과학이 발달하면서 생물학적 아버지의 진위 여부도 꽤나 정확하게 판별할 수 있게 됐다. 아이와 어머니, 그리고 아버지라 생각되는 남성의 유전자를 비교함으로써 생물학적 친자 관계 여부를 쉽게 판명할 수 있다. 이런 검사를 대행해 주는 회사들도 우후죽순처럼 늘어나 활발히 영업하고 있다.

유전자로 말할 것 같으면, 부모로부터 자식에게 전수되는 물질로서 외모와 질병 등 생로병사의 많은 부분에서 큰 역할을 한다. 아이의 유전자는 확률적으로 아버지와 어머니의 유전자 중 어느 하나를 물려받는다. 유전자를 통한 친자 검사 과정에서는 아이의 유전자 중에서 부모 중 어느 한명이라도 갖고 있지 않은 유전자가 나타날 경우 아이는 두 남녀의 친자가 아니라고 판단한다.

하지만 현재 유전자 검사에 활용할 수 있는 유전자의 개수는 15개 정도에 불과하다. (왜 15개 정도인지에 대해서는 보다 전문적인 지식을 필요로 한다. 우선 친자 확인에 쓰이는 유전자는 돌연변이가 적어야 한다. 대단히 안정적인 유전자라야 한다는 얘기다. 또 유전자 유형이 모집단에서 가능하면 다양해야 한다. 가령 한 유전자에 A와 a라는 타입이 있을 때, 모집단에서 A일 확률이 99%라고 한다면 변별력이 떨어진다. 이런 경우 A일 확률이 50%인 경우가 가장 좋다. 또 유전자들간에는 의존성이 없어야 한다. 유전자 검사에 쓰는 15가지는 각기 다른 염색체 안에 존재해서 서로 독립적으로 발현되는 것들이다. 그외에 측정도 쉬워야 하고, 특정 질병과도 무관해야 하며, 윤리적으로도 문제가 없어야 하는 등의 요인을 고려해서 선별된 것으로 알려져 있다.) 이 때문에 유전자 감식 과정에서도 15개의 유전자 전부가 우연히 일치할 확률도 엄연히 존재한다. 그 결과 유전자 검사의 결과는 언제나 확률로만 표시된다. 통상 유전자가 일치할 확률이 99.999% 이상일 경우(즉 아이가 보유한 15개의 유전자 모두가 어미니나 아버지에게 있는 것으로 확인되면) 친자 관계로 판단한다.

그럼에도 불구하고 여기서 주목해야 할 점은 이같은 확률적 판단에는 언제나 오류가 따른다는 것이다. 즉, 유전자 검사라고 해서 항상 친자 여부를 정확하게 판별해 줄 수 있는 것은 아니라는 얘기다. 최종 판정을 위해서는 출생을 둘러싼 주변 정황도 자세히 살펴봐야 한다.

◆ 유전자 검사 결과도 100% 신뢰할 수는 없어

유전자 검사의 오류 중에서도 가장 쉽게 떠올릴 수 있는 경우는 돌연변이다. 부모 어느 한 쪽에도 존재하지 않는 유전자라도 돌연변이에 의해 아들에게 나타날 수 있다는 얘기다. 그 확률은 극히 낮지만 완전히 부정할 수는 없다. 자칫하면 이런 결과가 살아있는 아이에게는 대단히 큰 마음의 상처를 줄 수도 있다는 점을 명심해야 한다.

유전자 검사의 한계를 생각해야 하는 또 다른 경우는 부모의 유전자를 다 얻을 수는 없는 경우다. 이 경우에는 우회적인 방법으로 친자 확률을 구하기도 한다. 일례로 요코다 메구미라는 일본 여성이 1977년에 납북돼 1987년 딸을 출산한 적이 있다.

일본 정부의 정보에 의하면, 메구미의 남편은 남한에서 1978년에 납북된 김영남이었지만 북한은 확인해주지 않았다. 일본 정부 관계자는 2004년 북한을 방문해 메구미의 딸 유전자를 확보했다. 일본 정부에서는 메구미 딸의 유전자와 남한에 사는 김영남의 모친 유전자를 각각 검사, 비교해 메구미의 남편이 김영남임을 확인하려 했다. 즉, 할머니와 손녀로 추정되는 두 사람의 유전자를 검사해 친자 관계를 확인하려 했다.

일본 정부는 유전자 감식 결과를 토대로, 2006년 메구미의 남편이 김영남이라고 공식 발표했다. 우리 정부도 이후 일본 정부로부터 유전자 정보를 받아 독립적으로 분석, 최종적으로는 일본 정부의 감식 결과를 인정했다. 하지만 이 과정에서 유전자 검사 외에도 여러 정황을 함께 고려했다.

유전자 감식 결과는 친자 관계 외에도 부모-자식 간의 다양한 관계를 설명할 수 있다. 얼굴 생김새나 눈의 색 또는 다양한 질병들이 부모로부터 자녀에게 전수되는데, 이런 현상을 유전이라고 한다.

20세기 초에 이런 물질, 즉 인간의 몸 안에 있으면서 부모-자식 간에 전달돼 유전 현상을 설명하는 물질이 발견됐다. 이른바 유전자다. 유전자는 염색체 안에 존재하는데, 특히 DNA가 유전자를 구성하는 물질이다. DNA 안에는 염기라 불리는 ATGC 4종류의 화학물질 30억개 이상이 일정한 패턴을 이루며 서열화돼 있다. 이 서열 정보가 바로 유전 현상과 밀접한 연관이 있다. 특히 30억개 염기 서열 중 유전 현상에 관여하는 특별한 부분을 유전자라고 한다.

현재 우리가 알고 있는 유전 현상은 다양한 데 비해, 알려진 유전자는 아주 적다. 지금까지 발견된 인간 유전자는 2만여개에 불과하며, 이처럼 적은 수의 유전자로 설명할 수 있는 유전 현상은 전체 유전 현상 중 극히 일부에 불과하다. 예를 들면, 키는 부모에게서 자식으로 유전되지만, 형제들의 키가 다 같지는 않다. 형제들 간의 키 차이를 설명하는 유전자는 아직 발견되지 않았다.

◆ DNA 안 30억개 이상의 염기서열 분석이 관건

여기에 빅데이터의 분석 기법이 다시 개입한다. 30억개의 염기 서열 중에서 형제간의 키 차이를 설명할 수 있는 염기 조합을 빅데이터 분석으로 찾아낸다면 과학적으로 대단히 흥미로운 발견이 될 것이다. 또 특정 질병의 유무에 관여하는 염기 조합을 찾아낸다면 과학적인 별견 외에도 의료 산업에서 아주 유용한 정보로 사용될 수 있을 것이다. 4종류의 염기 30억개를 배열하여 만들 수 있는 DNA의 종류는 거의 무한개에 이른다. 때문에 이런 무한개의 조합 중 어떤 조합이 특정 질병을 일으키는지를 찾아내기란 서울에서 김서방 찾기보다도 어려운 작업이 된다.

인간 DNA의 염기 서열을 밝혀내는 인간 유전체 사업은 1990년에 시작해 2001년에야 성공적으로 완수됐다. 그 후로는 DNA의 염기 서열에 숨어 있는 암호을 밝혀내 생명 현상의 연구에 활용하고, 이를 통해 생명공학, 보건의료, 에너지, 화학, 농식품 등 더 넓은 분야로 응용하려는 시도가 전 지구 차원에서 수행되고 있다.

특히 의학계에서는 같은 질병이라도 환자에 따라 처방을 달리 하는 “맞춤 의학”이 실용화될 것이라는 기대감이 커지고 있다. 실제로 요즘 대형 병원에서는 암 환자의 수술 이후 최적의 치료 방법을 개인의 유전자 정보를 바탕으로 정하는 고가의 프로그램을 시행하고 있다. 이렇듯 DNA 염기 서열에 숨어 있는 암호는 과학적 발전의 원동력인 동시에 관련 산업의 발전 동력으로 자리잡고 있다.

하지만 기대와는 달리 DNA 염기 서열의 암호를 푸는 작업은 쉽지 않아서 아직까지 혁신적인 성과를 보여주지는 못하고 있다. 특히 놀라운 것은 DNA 염기 서열 중 아주 일부에만 암호가 저장돼 있을 뿐, 나머지 부분에는 아무 정보가 없다는 사실이다. 따라서 30억개의 염기서열 중 암호를 저장하고 있는 부분을 찾아내기 위해서는 엄청난 양의 DNA 염기 서열 자료를 가지고 고도의 기법으로 분석해 내야 한다.

지금은 사람 개개인의 유전체 지도를 작성하는 데 드는 비용이 1000달러 수준이지만, 3~4년 안에 100달러 수준으로 내려갈 것으로 업계에서는 예상한다. 하지만 질병과 상관관계가 있을 것으로 추정되는 유전자 후보와 질병의 관계를 임상적으로 확인하는 작업은 매우 느리게 진행되고 있다. 그 이유는 유전자 후보가 기술의 발달과 더불어 기하급수적으로 증가하기 때문이다. 생물정보학의 초기에는 DNA 염기 서열을 밝혀내는 연구가 중요했다면, 지금은 밝혀진 염기 서열에서 정보를 획득하는 데이터 분석이 중요하게 부각되고 있으며, 빅데이터 분석 기법의 적용을 절실히 기다리고 있다. 이래저래 빅데이터의 활용도는 전방위로 확대되고 있는 것이다.