[테크월드뉴스=서유덕 기자] 엔비디아가 아스트라제네카와 신경망 아키텍처인 트랜스포머를 활용, 새로운 AI 연구 프로젝트를 진행중이라고 16일 밝혔다.

트랜스포머 기반 신경망 아키텍처를 사용하면, 연구자들은 사전훈련 중에 수동으로 레이블링된 예제를 사용할 필요없이, 자가지도 학습을 통해 대규모 데이터 세트를 활용할 수 있다.
엔비디아와 아스트라제네카는 약물 발견에 사용되는 화학 구조용 트랜스포머 기반 AI 모델 ‘메가몰바트(MegaMolBART)’를 개발 중이다. 이 모델은 아스트라제네카의 몰바트(MolBART) 트랜스포머 모델을 기반으로 하며, 엔비디아의 메가트론 프레임워크를 사용해 ZINC 화합물 데이터베이스에서 훈련된다.
대규모 ZINC 데이터베이스로 화학 구조 이해 모델을 사전학습하면 수동으로 라벨링된 데이터를 사용하지 않아도 된다. 화학에 대한 통계적 이해가 풍부한 이 모델은 화학 물질이 서로 반응하는 방식을 예측하고 새로운 분자 구조를 생성하는 것 등 여러 다운스트림 작업에 이상적이다.
메가몰바트 약물 발견 모델은 반응 예측, 분자 최적화, 드 노보(de novo) 분자 생성에 사용될 예정이다. 올라 엥크비스트(Ola Engkvist) 아스트라제네카 분자 AI, 발견과학 및 연구개발(R&D) 담당 총괄은 “AI 언어 모델이 문장에서 단어 간의 관계를 학습할 수 있는 것처럼, 우리는 분자 구조 데이터에 대해 훈련된 신경망이 실제 분자에서 원자 간의 관계를 학습하도록 한다”며, “해당 NLP 모델이 개발되면 과학계가 약물발견을 가속화하는데 사용할 수 있는 강력한 툴이 될 것”이라고 설명했다.
엔비디아 DGX 슈퍼POD로 훈련되는 이 모델은 데이터베이스에 존재하지 않지만 잠재적인 약물 후보가 될 수 있는 분자에 대한 아이디어를 연구원들에게 제공한다. 인-실리코 기술로 알려진 계산법을 사용하면 약물 개발자가 비용과 시간이 많이 소요되는 실험실 테스트로 전환하기 전에 더 많은 화학공간을 검색하고 약리학적 특성을 최적화할 수 있다.
그래도 삭제하시겠습니까?



