기술 아이디어

최신 트렌드, 이슈 등을 통해 생각을 넓혀보는 공간입니다.

5세대 컴퓨터, 新 아날로그 시대를 열다 (1)
  • 등록일2019.02.25
  • 조회수82
  • 댓글0

 

필자가 이끌고 있는 서울대학교 컴퓨터공학부 분자지능연구실에서는 필기체 숫자 영상을 패턴인식하는 분자머신러닝 장치를 개발하고 있다. 이 장치는 분자가 가진 특성을 이용해 현재 실리콘 기술로는 구현할 수 없는 새로운 계산을 하는 컴퓨터로, 바이오 분자 중 DNA를 이용한다.

 

 

DNA컴퓨터는 DNA를 구성하는 아데닌(A), 티민(T), 구아닌(G), 시토신(C) 네 가지 염기로 정보를 코딩(coding)한다. 중요한 점은 염기 중 A는 T와, C는 G와 상보적인 결합을 하며, 이는 일종의 화학반응으로 엄청난 수의 DNA 가닥이 동시에 반응한다는 것이다. 간단한 실험에서도 DNA로 코딩된 정보 1017개를 동시에 처리할 수 있다. 사람이 1초에 10개씩 처리한다고 해도 3억1710만 년이 걸리는 양이다. 이런 DNA의 특징을 ‘초병렬성’이라 한다. DNA컴퓨터는 이 점을 이용해 인공지능을 구현하는 것이 목표다.

 

필자의 연구실에서 개발중인 DNA컴퓨터는 현재 손글씨로 쓰여진 6을 구분하도록 설계돼 있다. 학습을 위해서 필체가 다른 6자 사진 200개를 사용했다. 이 사진들이 7×7=49 개의 픽셀로 이뤄져 있다고 가정하자. 사진의 각 픽셀에서 검은 부분에 해당하는 DNA서열, 하얀 부분에 해당하는 DNA서열을 정한다. 그러면 총 98개의 겹치지 않는 DNA서열이 정해진다. 그리고 각 사진을 분석해 각 픽셀마다 검은 부분과 하얀 부분이 차지하고 있는 비율에 따라 DNA 양을 조절한다. 예를 들어 37번 픽셀에 흰색이 70%, 검은 색이 30%를 차지한다면 흰색 DNA와 검은색 DNA의 비율이 7:3이 되도록 DNA를 증폭시킨다. 이렇게 1번부터 49번 픽셀까지 같은 과정을 반복하면 사진 한 장의 정보가 담긴 ‘트레이닝 세트(traning set)’가 만들어진다. 200장의 사진을 이용하면 200개의 트레이닝 세트가 생긴다.

 

학습을 할 DNA 세트 역시 98개의 서로 다른 DNA 서열을 갖는다. 트레이닝 세트와 다른 건, 이들은 모두 흰색과 검은색 비율이 5:5인 상태라는 점이다. 학습 DNA 세트에 트레이닝 세트를 넣어주면, 학습 세트의 DNA와 트레이닝 세트의 DNA는 서로 상보적인 결합을 하여 이중가닥 DNA를 만든다. 이제 완전히 결합한 이중가닥 DNA만 추출해 증폭시킨 뒤, 다시 학습 세트에 넣는다. 그럼 한 번 업데이트한 학습 세트가 된다. DNA농도가 확률이 되는 것이다. 200개의 세트를 업데이트 시키고 나면 여러 가지 모양의 ‘6’ 에 대한 정보를 가진 학습 세트가 만들어진다. 여기에 6인지 알 수 없는 사진의 DNA 세트(테스트 세트)를 학습 세트에 넣어주고 상보적인 결합을 하는 비율이 높을 경우 6이라고 판단한다.

 

만약 인공지능 소프트웨어라면 픽셀 하나마다 흰색과 검은색의 비율을 각각 비교해야 하므로, 총 98번의 연산이 필요하다. 반면 분자컴퓨터는 단 한 번이면 된다. 픽셀 수가 늘어날수록 연산 시간의 차이는 기하급수적으로 늘어난다. 이런 차이는 DNA가 초병렬적으로 화학 반응을 한다는 점에서 비롯된다.


분자컴퓨터는 초병렬성을 제외하고도 여러 장점이 있다. 이중나선 DNA 분자는 두께와 폭이 각각 0.34nm, 2nm인 나노구조로, DNA 1g은 1021개의 염기를 포함한다. 이는 10억 테라바이트(TB)에 해당하는 엄청난 집적도다. 이런 특성은 단순한 패턴인식을 넘어서 영상을 분석하는 등 초병렬 분자인식 과정까지 가능하게 한다. 이런 이유로 최근 DNA 컴퓨팅을 여러 분야에 적용시키려는 움직임이 활발하다. 분자컴퓨터는 인간 수준의 인공지능을 구현할 수 있는 비폰노이만 방식의 새로운 패러다임을 이끌어 나갈 것으로 기대된다.

 

다음편
5세대 컴퓨터, 新 아날로그 시대를 열다 (2)-[바로가기]

 

분자컴퓨터
글 장병탁 서울대 컴퓨터공학부 교수

  • 출처 :

    아이디어마루 연계 · 협력을 통해 제공되는 서비스입니다.