메뉴 바로가기 본문 바로가기 하단 바로가기

KOBICian’s Story

프로필사진
[49호] AI가 디자인한 유전자 편집기: 미래의료의 핵심 플랫폼
  • 작성자 박성진 (KOBIC 연구원)
  • 작성일2025-04-10 09:39:38
  • 조회수1274
  • 댓글수0

요즘 챗GPT를 이용하여 개인 프로필 사진이나 가족 사진을 스튜디오 지브리 또는 픽사의 애니메이션 스타일로 바꾸어 보지 않은 사람은 거의 없을 것입니다. 지난 3월 하순 공개된 챗GPT-4o의 새로운 이미지 생성 기능을 이용하려고 전 세계에서 밀려드는 요청 때문에 오픈AI의 샘 올트만이 ‘GPU가 녹고 있다’고 즐거운 비명을 지르듯, AI 기술 또한 작년 노벨상 수상을 통해 확인된 과학적 성과에 이어서 일반인에게도 즐거움을 선사하면서 화제를 모으고 있습니다. 사회는 새로운 기술이 등장하면 늘 기대감과 실망으로부터 시작하여 이를 이해하고 옹호하는 사람이 점차 많아지다가 급기야 일상적 활용이라는 단계를 순차적으로 거쳐 왔습니다. 이와 관련한 주요 ‘사건’이 일어날 때 AI와 관련된 회사의 주가가 요동치고, 미디어나 언론에서는 AI 관련 광고 및 보도가 쏟아지는 것은 AI가 우리 기대에 부응하고 있다는 뜻이 아닐까요? 이제 전환점을 맞고 있는 AI 기술은 산업 전반에 걸쳐 적용 사례가 급증하고 있으며, 생명과학 분야 또한 예외가 아닙니다.

 

과학기술정보통신부와 한국생명공학연구원이 발표한 ‘2025년 10대 생명과학 미래유망기술’ 중, 편집/리프로그래밍(Edit) 분야의 대표 사례로 'AI 기반 유전자 편집기' 기술이 포함되었습니다. 희귀 유전질환으로 고통받는 환자들에게 유전자 편집 기술은 더 이상 미래의 과학이 아닙니다. 특히 AI가 설계한 유전자 편집기는 정밀의료의 패러다임을 바꾸며, 의료기술의 진화 속도를 급격히 앞당기고 있습니다. 이 기술은 AI가 방대한 유전체 데이터를 학습하여 특정 유전 질환에 적합한 유전자 편집 전략을 스스로 설계한다는 점에서 혁신적입니다. 기존 유전자 편집 기술은 CRISPR-Cas9 이후 빠르게 발전했지만, 비의도적 변이(off-target), 정확도 부족, 설계 복잡성 등의 문제를 여전히 안고 있으며, 이 한계를 극복하기 위해 AI가 활용되고 있습니다.

 

AI는 다양한 유전자 정보를 학습하여 특정 질환에 최적화된 가이드 RNA(gRNA)를 자동으로 설계하고, 비의도적 변이 위험까지 예측하는 기능을 갖추었습니다. 기존에는 수작업으로 며칠씩 걸리던 편집 설계가, AI 기반으로는 수 시간 내에 완료됩니다. 이는 유전자 치료제 개발의 속도와 정밀도를 동시에 끌어올리는 요인이 되었습니다. 실제로 연구자들은 ‘OpenCRISPR-1’이나 ‘CRISPR AI’와 같은 AI 기반 공개형 서비스를 활용해 실험 설계와 편집 효율을 높이고 있으며, 미국 바이오기업인 Beam Therapeutics와 CRISPR Therapeutics는 이를 바탕으로 유전자 설계 플랫폼을 사업화해 효율을 극대화하고 있습니다. 국내 바이오 벤처들도 이러한 기술 흐름에 적극적으로 합류하고 있습니다.

 

정부 역시 이러한 기술 혁신을 뒷받침하기 위한 정책 마련에 박차를 가하고 있습니다. 과학기술정보통신부는 '첨단바이오 이니셔티브'(2024.04.)를 통해 AI 기반 유전자·신약 개발 플랫폼 구축을 추진 중이며, 보건복지부와 함께 ‘범부처 재생의료기술개발사업’(2021~2030)을 통해 유전자 치료 기술의 전주기적 지원 체계를 강화하고 있습니다.

 

이와 함께, 한국생명공학연구원은 국가생명연구자원정보센터(KOBIC)를 중심으로 한 바이오 연구데이터의 통합 수집·제공 체계를 정비하고 있습니다. KOBIC은 고품질의 유전체, 전사체, 단백체 데이터를 기반으로 연구자들에게 데이터 기반 분석 환경을 제공 및 바이오 데이터를 전처리·표준화·구조화함으로써 다양한 AI 알고리즘에 적용할 수 있도록 지원할 예정입니다. 예컨대, 딥러닝(CNN, RNN)을 활용한 유전자 기능 부위 예측, 생성형 AI(LLM) 기반의 염기서열 생성, 혹은 유전자 편집 도구의 자동 설계 등에서 이러한 데이터는 핵심 자원으로 활용됩니다. 나아가, KOBIC은 AI 학습과 의료 응용을 연결하는 데이터-기술 연계 생태계의 중심축, 즉 AI 기반 정밀의료의 허브 플랫폼으로서의 역할을 수행할 것으로 기대합니다.

 

그러나 기술 발전에는 윤리적 문제를 반드시 고려해야 합니다. 특히 생식세포 수준의 유전자 편집은 '인간 개량' 논란이라는 민감한 문제와 연결됩니다. 따라서 ① 의료 목적에 한정된 제한적 사용, ② 투명성과 책임성을 확보할 수 있는 공공 감시 체계, ③ 국제적 윤리 기준 정립 및 협력 체계 구축이 반드시 수반되어야 합니다. 기술의 효율성만큼이나 윤리적 정당성 확보가 병행되지 않으면 사회 구성원이 폭넓게 받아들이기 어렵습니다.

 

이러한 상황에서 대한민국이 글로벌 기술 리더십을 확보하려면 몇 가지 핵심 과제를 병행해야 합니다. 첫째, R&D 투자의 확장은 물론, 데이터 큐레이션·분석·AI 알고리즘 개발까지 아우르는 융합형 실전 인재 양성이 절실합니다. 둘째, 산업계와 연구계가 공동 활용할 수 있도록 데이터 인프라를 고도화하고, 표준화된 공유 생태계를 조성해야 합니다. 셋째, 국민적 수용성과 사회적 공감대를 확보하기 위한 교육과 과학 소통이 선행되어야 합니다. 여기에 더해, 기술 발전 속도를 따라잡을 수 있는 개방적이고 미래지향적인 규제 및 정책 체계 마련도 필수적입니다. 이는 혁신을 억제하지 않으면서도 안전성과 신뢰를 확보하는 균형 전략으로 기능해야 합니다.

 

결론적으로 AI 기반 유전자 편집기는 단순한 기술적 진보를 넘어 정밀의료, 맞춤형 치료, 차세대 신약 개발을 통합하는 미래의료의 핵심 플랫폼으로 진화하게 될 것입니다. 상용화 과정에서 기술 안전성, 비용 문제, 인프라 구축 등의 현실 과제가 남아 있지만, 이를 전략적으로 극복해 나간다면 유전자 질환에 대한 근본적 치료가 가능한 시대가 도래할 것입니다. 정부, 연구기관, 산업계가 공동의 전략과 비전을 공유하고 긴밀히 협력할 때, 이 기술은 인류의 건강 증진과 생명과학 혁신을 견인하는 동력으로 작용할 것입니다.

 

 

 

 

 

KOBICian’s story는 KOBIC 멤버가 직접 작성하는 현장감 넘치는 글로서 KOBIC의 업무 방향이나 공식 입장과는 다를 수 있습니다.

다른 KOBICian’s Story 보기

KOBICian's Story Thumbnail

지구상에는 아직 확인되지 않은 것을 포함하여 약 870만 종의 생물이 살고 있는 것으로 추정되며, 인류는 이들과 공존하는 동시에 자원으로 이용하여 윤택한 삶을 일구어 나가고 있습니다. 혹시 여러분은 사소한 일상 속에서 하루에 얼마나 많은 바이오소재를 접하고 있는지 알고 있나요? 예를 들어 아침에 일어나 세면을 할 때 필요한 비누와 샴푸, 피부 미백 및 자외선 차단 등의 목적으로 바르는 화장품, 건강을 위해 섭취하는 건강기능식품 등이 바이오소재의 활용 사례입니다.

 

KOBIC에서는 국가 차원에서 확보·관리·활용되고 있는 바이오소재 현황을 파악하고, 바이오소재의 중장기정책 방향 수립 및 바이오 연구‧산업 활용을 위한 통계정보를 제공하기 위해 매년 12월부터 1월 사이에 국내 바이오소재 관리기관을 대상으로 바이오소재의 확보 및 분양, 장비, 시설, 인력 등 현황을 온라인 형태로 조사하고 있습니다. 그리고 그 결과를 분석하여 매년 4월 말 국가통계포털(KOSIS, KOrean Statistical Information Service)에 바이오소재통계라는 명칭으로 공표하고 있습니다.

 

또한, 지난 2011년부터 생명연구자원법 제19조 및 동법 시행령 제13조(통계조사 및 통계간행물의 발간)에 근거하여 국가생명연구자원 통계자료집을 발간하고 있습니다. 여기에는 KOSIS에 공표한 현황과 바이오소재 관련 상세 통계정보, 동향 등이 포함되어 있으며, 바이오소재 총괄지원단 홈페이지를 통해 통계자료집 PDF 파일, 통계설명자료, 통계용어 등을 공개하고 있습니다.

 

2024년에 실시한 총 204개 소재자원은행을 대상으로 조사한 결과에 따르면 무려 20,709,924점의 바이오소재를 보유한 것으로 조사되었습니다. 이 중에서 세포, 종자 등 증식이 가능한 자원은 총 87,676종 3,946,385점이고, 핵산, 추출물 등 파생된 자원은 총 251,593종 16,763,539점입니다. 국가 바이오산업의 핵심 인프라가 점차 강화되면서 바이오소재의 보유 수도 점차 증가하는 경향이 뚜렷하게 나타나고 있습니다(전년 대비 약 6.8% 증가, 2020년 이후 연평균 5.82% 증가).

 

특히, 가장 많은 바이오소재를 보유한 클러스터는 야생생물 클러스터(6,144,646점, 전체 대비 약 29.7%)였고, 그 다음은 천연물 클러스터(4,744,200점, 전체 대비 약 22.9%)로 확인되었는데, 이처럼 우리 주위에 있는 자연환경에서 다양한 동식물과 관련 자원들이 풍부하게 존재한다는 것을 볼 수 있습니다.

 

바이오소재 활용 중심의 연구 활성화, 산업계의 신소재 개발 및 기술혁신 수요 등으로 인하여 2024년에는 소재자원은행에서 총 812,241점의 분양이 이루어졌으며, 이 중 증식가능자원은 총 7,117종 81,153점이고, 파생자원은 총 8,712종 731,088점입니다. 코로나-19 팬데믹, R&D 예산 확보 및 운영 등의 이유로 분양 수치는 변동이 있지만, 산업계 및 연구계 등 다양한 수요기관에 분양을 진행하면서 바이오소재를 다양하게 활용하고 있음을 볼 수 있습니다.

 

소재자원은행은 새로운 바이오소재를 발굴 및 관리하고, 이를 연구 및 산업적 목적으로 활용하면서 다양한 성과를 내고 있습니다. 2024년 기준, 204개의 소재자원은행과 관련된 논문은 총 3,092편(분양된 소재 활용 2,593편, 소재 발굴·개발 499편)을 발간하고, 특허는 총 317건(분양된 소재 활용 262건, 소재 발굴·개발 55건)을 등록하였습니다. 또한, 바이오소재의 장기 보존, 분류학적 동정, QC(Quality Control), 분석·실험 대행, 기술교육 지원 등의 다양한 대외서비스는 총 3,240건을 실시하여, 바이오소재의 적극적인 인프라 지원을 통한 활용 확대에 노력을 아끼지 않고 있습니다.

 

통계자료에 의하면 해외에서도 방대한 바이오소재의 활용이 이루어짐을 알 수 있습니다. 일본 RIKEN BRC(BioResource Research Center)는 매년 약 15,000 ~ 16,000개의 바이오소재를 제공하고 있으며, 설립 이후 총 331,444개 이상의 바이오소재를 약 7,900개의 일본 기관과 6,500개의 일본 외 기관에 제공하고 있습니다(2024년 보고서 기준). 우리나라의 2024년 단일 소재자원은행 분양 기준, 극소수의 은행을 제외하면 대부분 은행의 분양 수치가 10,000개 이하인데, 이 점을 볼 때 일본 RIKEN BRC의 분양 수치가 많다고 볼 수 있습니다. 또한, 일본 바이오뱅크(BBJ, BioBankJapan)은 2023년 4~12월 기준, DNA 샘플 29,152건, 혈청 샘플 1,343건, 임상·게놈정보 877,896건으로 상당히 많은 성과를 제공하고 있음을 볼 수 있습니다.

 

바이오소재는 전 세계적으로 그 중요성이 점점 커지고 있으며, 인류의 삶의 질 향상과 지속가능한 미래를 위한 핵심 자원으로 자리매김하고 있습니다. 방대한 바이오소재는 단순한 데이터가 아닌, 미래를 위한 소중한 자산임을 잊지 말아야 하며, 앞으로도 국내 바이오소재의 체계적인 관리와 활용을 통해, 바이오 분야의 경쟁력을 강화하고, 글로벌 바이오산업을 선도하는 기반을 지속적으로 다져나가야 할 것입니다.

  • 작성자이광희
  • 작성일2025-07-14
  • 조회수133
  • 댓글수0
KOBICian's Story Thumbnail

최근 저는 국가과학기술인력개발원(KIRD)에서 주관한 출연(연) 대상 AI 통합 교육과정에 강사로 참여하여, 전사체 및 유전체 데이터 분석에 대하여 강의하였습니다. 이 과정에서 우리 센터가 수행하고 있는 국가통합바이오빅데이터 구축 사업과 유전체 데이터 생산 및 분석 업무에 대해서도 소개하는 시간을 가졌습니다. 강의가 끝난 후 진행된 질의응답 시간에는 유전체 분석 기술에 대한 일반적인 관심뿐만 아니라, 개인의 건강 문제와 관련된 현실적인 질문들도 많았습니다. 

 

한 수강생은 할아버지와 아버지 모두 대장암 진단을 받은 가족력이 있다고 했고, 자녀를 둔 입장에서 자신도 유전적 위험이 있는지를 알고 싶어 교육에 참여했다고 밝혔습니다.  곧 은퇴를 앞둔 나이가 지긋한 어떤 수강생은 가족 중 다수가 심혈관 질환을 앓거나 이로 인해 사망한 이력이 있어, 본인도 유전적 소인이 있는지 확인하고자 교육에 참석했다고 했습니다.

 

이와 같은 질문들은 제가 지인이나 가족에게 유전체 분석 업무를 설명할 때 자주 듣는 내용들과도 유사합니다. “나도 유전체 검사를 받을 수 있나요?”, “검사를 받으면 어떤 정보를 얻을 수 있나요?”, “내가 어떤 질병에 취약한지 알 수 있나요?” 같은 관심과 질문들이 반복적으로 나타납니다. 최신 전장유전체 분석 기술(Whole Genome Sequencing, WGS)을 활용하면 개인 간 유전체 염기서열의 차이를 정밀하게 분석할 수 있습니다. 사람의 유전체는 약 30억 개의 염기쌍으로 이루어져 있는데, 임의의 두 사람을 비교하면 평균적으로 전체의 약 0.1%, 즉 약 300만 개의 염기쌍이 서로 다르다는 사실이 알려져 있습니다. 이러한 차이는 대부분 질병과 무관한 자연스러운 유전적 다양성이지만, 일부는 질병의 위험성과 직접적인 연관이 있을 수 있습니다. 그러나 이 많은 변이 중 어떤 것이 실제로 질병 발생에 영향을 주는지를 식별하는 것은 아래와 같은 문제로 매우 복잡한 문제이며, 여전히 많은 연구가 진행 중입니다.

 

ⓐ 여러 유전 변이가 하나의 표현형에 영향을 미치는 다인자성 질환이 존재함

ⓑ 동일한 질환이라도 개인마다 원인을 제공한 유전자가 다름

ⓒ 모든 질환을 DNA 염기 서열 변화 수준에서만 원인을 파악할 수 없음

ⓓ 정확한 분석을 위한 대규모 임상정보-유전체 데이터 통합 DB가 필요함

 

특히 유전체 기반 예측은 단일 유전자 변이로 발현되는 질환에서는 비교적 명확한 결론을 내릴 수 있지만, 고혈압, 당뇨병, 심혈관 질환처럼 다양한 요인이 작용하는 복합질환에서는 예측 정확도가 낮을 수밖에 없습니다. 따라서 개인의 유전 정보를 바탕으로 질환 발생 가능성을 평가하거나 의료적 결정을 내리기 위해서는 여전히 전문가의 해석과 신중한 접근이 필요합니다. 현재 국내에서 진행되고 있는 유전체 분석 서비스는 크게 두 가지로 나눌 수 있습니다.

 

1. DTC(Direct-To-Consumer) 유전자 검사: 소비자가 의료기관을 통하지 않고 직접 유전자 검사를 의뢰할 수 있는 서비스입니다. 국내에서는 개인의 특성이나 건강에 관련된 웰니스(wellness) 항목에 대해서만 DTC 유전자 검사가 허용되어 있으며, 예를 들어 카페인 대사, 영양소 흡수, 피부 특성, 체질 등과 관련된 정보를 제공받을 수 있습니다. 단, 질병의 진단, 예후, 치료와 같은 의료적 목적의 유전자 검사는 의료기관을 통해서만 가능하며, DTC 검사로는 제공되지 않습니다.

2. 의료기관 기반 유전 진단 검사 : 질환 진단을 목적으로 하며, 반드시 전문가의 판단과 해석이 필요합니다. 임상 진단에서는 비용과 해석 효율성을 고려하여 특정 유전자나 유전자 패널에 집중하는 타겟 시퀀싱이 주로 사용됩니다. 희귀질환 진단이나 연구 목적에 적합한 폭넓은 유전 정보를 제공하기 위해서는 상대적으로 비용이 높은 전장유전체 분석(WGS)이나 전장엑솜 분석(WES)을 수행하기도 합니다.

기술의 발전과 분석 비용 절감, 국가 단위의 바이오 빅데이터 구축이 병행됨에 따라, 향후에는 국가 또는 공공 시스템 차원에서 유전체 정보가 구조적으로 축적되고 활용되는 기반이 마련될 수 있을 것입니다.

 

유전체 기술은 의료·보건 분야뿐 아니라 교육과 사회복지 영역에서도 실질적인 파급 효과를 가질 수 있습니다. 제 배우자는 초등학교 특수교사로 재직 중인데, 다양한 발달장애 및 희귀 유전 질환을 가진 학생들을 지도하고 있습니다. 질환을 앓고 있는 학생의 삶은 직접적으로 나타나는 다양한 어려움으로 체감되며, 이를 곁에서 지켜보는 보호자에게는 오랜 시간 지속되는 심리적·신체적 부담이 따릅니다. 

 

저는 조기 유전 진단 기술의 보편화와 정밀화가 사회적으로 매우 중요하며, 만약 중증 유전질환을 태아기 단계에서 진단할 수 있다면, 일부 사례에서는 가족이 적절한 결정을 내릴 수 있는 선택권을 가질 수도 있을 것으로 생각합니다.

이번에 참석한 유럽 인간유전학회(ESHG 2025, ‘25.5.24~27, 이탈리아 밀라노)에서는 유전체 기반 진단과 관련된 최신 연구 동향이 활발히 공유되었습니다. 특히 특정 질환의 원인이 되는 causal variant(원인 변이)를 규명하고 이를 진단하는 발표에서, 의료 전문가와 생물정보학자 간의 협업이 매우 중요하다는 발표 내용이 인상 깊었습니다. 정밀한 유전 질환 진단을 위해서는 기술뿐 아니라 다양한 분야 간 긴밀한 협력이 필수적임을 다시 한번 확인할 수 있었습니다.

최근 여러 경험을 통해 저는 유전체 분석 기술에 대한 사회적 관심과 수요가 점점 더 현실적으로 커지고 있음을 실감하게 되었습니다. 앞으로 기술이 더 발전하고 활용 사례가 축적된다면, 더 많은 사람들이 자신의 유전 정보를 바탕으로 건강을 관리하고 예방 중심의 의료 체계로 나아갈 수 있는 기반이 마련될 것이라 기대합니다. 제 자신도 앞으로 정밀의료 기반 유전체 분석 기술의 개발과 데이터 통합 플랫폼 구축을 통해 국민 건강에 기여할 수 있도록 최선을 다하겠습니다.

  • 작성자김종환
  • 작성일2025-07-07
  • 조회수185
  • 댓글수0
KOBICian's Story Thumbnail

2025년 6월 영국 캠브리지에서 개최된 제38회 국제 염기서열 데이터베이스 연합체(International Nucleotide Seqeucne Database Collaboration, INSDC) 연례회의에 KOBIC이 참석하여 한국의 유전체 데이터 관리와 공유 전담 기관으로서의 역할과 책임을 재확인하는 중요한 기회를 가졌습니다. INSDC는 미국 국립보건원(NIH) 산하 국립의학도서관(NLM)의 NCBI, 유럽분자생물학연구소(EMBL) 산하 EBI, 그리고 일본 국립유전학연구소(NIG) 산하 DDBJ로 구성된 연합체로 지난 38년간 전 세계 유전체 데이터의 표준화와 공유에 핵심적 역할을 해 왔습니다.

 

현재 유전체 연구에 종사하는 대부분의 연구자들은 INSDC 데이터베이스를 통해 필요한 유전체 정보를 검색하고 활용한 경험이 있습니다. 특히 학술 논문 출판 과정에서 원시 데이터나 분석 결과를 INSDC 산하 리포지토리에 등록하고 해당 accession number를 Data Availability 섹션에 명시하는 것은 이미 국제적 표준으로 자리 잡았습니다. 주요 국제 학술지들은 INSDC 관리 데이터베이스를 신뢰할 수 있는 데이터 공유 리포지토리로 인정하고 저자들에게 이를 통한 데이터 공개를 적극 권장하고 있습니다. 

 

이러한 국제적 동향 속에서 KOBIC이 운영하는 국가 바이오 데이터 스테이션(K-BDS) 역시 글로벌 수준의 공신력과 표준화 달성을 목표로 하고 있습니다. INSDC의 멤버십 확장 계획이 발표된 이후, KOBIC은 정식 멤버가 되기 위한 지속적인 노력을 기울여왔습니다. 

 

이번 회의에서 가장 흥미로웠던 주제는 바로 AI 기술의 도입 가능성과 그 실질적 한계에 대한 논의였습니다. 각 INSDC 멤버 기관들은 이미 AI를 시범적으로 적용하고 있거나, 이를 위한 인프라 구축을 적극적으로 추진하고 있었습니다.

 

EMBL-EBI의 ENA(European Nucleotide Archive)는 사용자 지원 서비스의 개선을 위해 챗봇 시스템을 개발 중이라 밝혔습니다. ENA 문서와 가이드라인을 학습한 이 챗봇은 사용자들의 반복적인 문의사항에 자동으로 대응함으로써 HelpDesk 운영 부담을 크게 줄일 것으로 기대됩니다. 다만 아직 핵심적인 데이터 처리 과정에는 AI를 적용하지 않고 있으며, “현재의 AI 도입은 글로벌 AI붐에 발맞춰 가는 수준”이라는 신중한 평가를 내놓았습니다.

 

NCBI는 세 기관 중 가장 적극적인 AI 도입 전략을 선보였습니다. 현재 전체 SRA(Sequence Read Archive) 데이터의 90% 이상을 자동화된 규칙 기반 시스템으로 처리하고 있으며, AI 기술을 접목하여 샘플 자동 분류, 작업 스케줄링 최적화, 임상 요약 생성 등 효율화를 도모하고 있습니다. 흥미롭게도 NCBI 관계자는 “AI가 반복적인 업무를 줄여줄 수는 있지만, 그만큼 해석, 검증, 관리 등 새로운 방식의 고차원적 과업과 이에 따른 책임이 뒤따른다”는 솔직한 견해를 표명하며, 최종 품질관리는 여전히 전문 인력이 직접 수행해야 한다는 점을 강조했습니다. 

 

DDBJ는 미래 지향적 인프라 투자에 집중하고 있었습니다. NVIDIA A100 GPU 기반의 AI 전용 클러스터 구축과 3차원 데이터 분석이 가능한 고성능 시스템 도입을 통해 향후 AI 응용 연구를 위한 견고한 기반을 마련했다고 발표했습니다. 

 

회의를 통해 도출된 공통 결론은 “AI는 단순한 자동화 도구가 아닌 생명정보학 데이터 관리 패러다임을 근본적으로 전환할 혁신 기술이며, 신중하고 단계적인 접근이 필수적”이라는 인식이었습니다.

 

이 외 INSDC 전반에 걸쳐 데이터 교환 관련 표준화와 정책에 대한 심도 있는 논의가 이루어졌습니다. 데이터 표준화와 자동화가 최우선 과제로 부각되었으며, GFF3(General Feature Format 3), modBAM(modified Binary Alignment Map) 등 새로운 데이터 포맷으로의 전환과 이에 따른 검증 프로세스의 자동화가 시급한 현안으로 논의되었습니다. 메타데이터의 품질관리 강화도 중요한 화두로 단순 제공하는 것을 넘어 정확성 확보와 최소 요건 준수를 강화하는 방향으로 정책이 전환되고 있습니다. 

 

또한 최근 국제 규범 준수와 접근 및 이익 공유(ABS) 대응이 새로운 과제로 등장했습니다. 생물다양성협약(CBD), 세계보건기구(WHO) 펜데믹 조약(PAD), 국가관할권 이원 지역의 해양생물다양성 보전 및 지속가능한 이용에 관한 협약(BBNJ) 등 다양한 국제 규범이 강화되면서, 유전자원의 접근과 이익 공유에 대한 체계적 관리와 필수가 되었습니다. 이러한 국제 협약의 변화가 INSDC의 공개 데이터 정책에 미치는 영향에 대해 논의하였으며, INSDC는 샘플 출처 정보를 메타데이터에 필수적으로 포함하도록 하고 사용자 가이드라인에 CARE 원칙(Collective Benefit, Authority to Control, Responsibility, Ethics)을 명시하는 등의 개선 방안들을 공유했습니다. 

 

이번 회의를 통해 KOBIC은 INSDC 정식 멤버 가입을 위한 로드맵을 더욱 구체화할 수 있었습니다. 지난 1년간 BioProject, BioSample, SRA 데이터에 대해 XML 템플릿을 개선하고, 기술적 연계 체계를 강화한 것이 국제적으로 주목받는 진전으로 평가받았습니다. 

 

INSDC 연례회의는 단순한 정보 교환의 장을 넘어, 미래 생명정보 흐름의 규칙을 함께 만들어가는 글로벌 포럼이자 AI 시대를 맞이한 생명과학 커뮤니티의 책임과 균형을 재확인하는 자리였습니다. KOBIC은 이러한 흐름 속에서 AI 기반 메타데이터 추천 시스템과 데이터 제출 오류 감지 시스템 개발에 관심을 기울이고, 국제 표준에 부합하는 데이터 품질관리 시스템을 지속적으로 강화하며, 연구자 친화적인 데이터 제출 및 검색 서비스를 개선해 나가겠습니다. 궁극적으로 신뢰할 수 있고 지속 가능한 생명정보 공유의 중심으로 성장하여 글로벌 생명과학 발전에 기여하겠습니다.

  • 작성자김혜린
  • 작성일2025-06-30
  • 조회수155
  • 댓글수0
TOP