피앤피뉴스 - ㈜유클리드소프트, AI학습용 데이터 통해 ‘화학물질 위험성 예측 데이터’ 구축 성공

  • 맑음강릉2.3℃
  • 맑음보성군0.3℃
  • 구름조금인제-2.8℃
  • 맑음상주-0.7℃
  • 맑음속초2.8℃
  • 맑음순천-2.0℃
  • 구름조금서귀포9.3℃
  • 맑음부산7.5℃
  • 구름조금원주-1.1℃
  • 맑음남원-0.2℃
  • 구름많음파주-3.0℃
  • 흐림부안1.5℃
  • 맑음홍성-1.4℃
  • 구름조금부여-1.5℃
  • 맑음포항5.8℃
  • 구름조금양평-1.3℃
  • 구름조금군산0.7℃
  • 구름많음수원-0.2℃
  • 구름조금홍천-2.2℃
  • 맑음영천-1.6℃
  • 구름조금제천-4.0℃
  • 맑음울진5.1℃
  • 맑음합천-0.1℃
  • 맑음대구1.4℃
  • 맑음북강릉4.5℃
  • 구름조금태백-3.2℃
  • 맑음울릉도7.8℃
  • 구름많음서울1.6℃
  • 맑음흑산도5.1℃
  • 맑음진주-1.3℃
  • 맑음의령군-3.0℃
  • 맑음제주7.5℃
  • 맑음함양군-2.3℃
  • 맑음울산4.6℃
  • 구름많음동두천-1.8℃
  • 맑음금산-1.6℃
  • 맑음영광군0.6℃
  • 구름조금보은-2.1℃
  • 맑음고창군0.1℃
  • 구름조금임실-1.2℃
  • 맑음북부산1.2℃
  • 맑음문경-0.2℃
  • 맑음영주-1.9℃
  • 맑음청주2.2℃
  • 맑음서청주-1.5℃
  • 맑음거제4.4℃
  • 맑음밀양-0.1℃
  • 맑음동해3.4℃
  • 맑음산청-0.7℃
  • 맑음광양시4.6℃
  • 구름조금서산0.3℃
  • 맑음세종0.8℃
  • 구름조금이천-2.2℃
  • 맑음장흥-1.6℃
  • 구름조금추풍령-1.7℃
  • 맑음완도3.7℃
  • 맑음김해시4.7℃
  • 맑음강진군0.7℃
  • 흐림백령도7.2℃
  • 구름조금북춘천-3.8℃
  • 맑음고흥-1.6℃
  • 구름조금대관령-3.9℃
  • 맑음통영5.3℃
  • 맑음구미-0.4℃
  • 맑음의성-2.7℃
  • 맑음대전0.7℃
  • 구름조금성산4.2℃
  • 맑음경주시-0.4℃
  • 맑음해남-0.6℃
  • 맑음봉화-4.1℃
  • 맑음정선군-3.5℃
  • 맑음목포4.1℃
  • 구름조금춘천-3.0℃
  • 맑음천안-1.8℃
  • 맑음충주-2.1℃
  • 구름조금강화-0.7℃
  • 구름조금영월-3.0℃
  • 구름조금정읍0.5℃
  • 맑음여수6.0℃
  • 구름조금전주1.8℃
  • 맑음북창원5.2℃
  • 구름많음인천3.3℃
  • 맑음순창군-0.7℃
  • 맑음영덕3.5℃
  • 맑음광주4.2℃
  • 맑음양산시1.4℃
  • 맑음창원5.2℃
  • 구름조금철원-3.6℃
  • 맑음남해2.9℃
  • 맑음거창-1.7℃
  • 맑음진도군0.1℃
  • 구름조금장수-2.6℃
  • 맑음청송군-3.7℃
  • 구름많음고산9.9℃
  • 구름조금보령0.0℃
  • 맑음안동-1.3℃
  • 맑음고창0.1℃

㈜유클리드소프트, AI학습용 데이터 통해 ‘화학물질 위험성 예측 데이터’ 구축 성공

서광석 기자 / 기사승인 : 2024-12-29 09:00:42
  • -
  • +
  • 인쇄
AI학습용 데이터 5,286만 건 구축 노하우 반영 및 자체 플랫폼 활용해 ‘화학물질 위험성 예측 데이터’ 구축

 

 

 

AI 전문기업 ㈜유클리드소프트(이하 유클리드소프트)는 2024년 ‘초거대AI 확산 생태계 조성 사업’에 선정, ‘화학물질 위험성 예측 데이터’를 성공적으로 제출했다고 밝혔다.

‘초거대AI 확산 생태계 조성 사업’은 초거대AI데이터 구축 및 개방을 통하여 AI 생태계 조성 및 AI 일상화를 실현할 수 있도록 지원하는 것을 목적으로 하는 사업으로, 과학기술정보통신부가 주관하고, 한국지능정보사회진흥원(NIA)이 전담하여 추진한다.

주관기관인 유클리드소프트를 중심으로 △한국마이크로의료로봇연구원 △한국인공지능융합산업협회 △삼육대학교 산학협력단이 컨소시엄을 구성하였으며, 수요기관으로 화학물질안전원이 참여하였다. 유클리드소프트 컨소시엄은‘증기압 데이터 5,000건’, ‘연소열 데이터 5,000건’, ‘인화점 데이터 10,000건’ 총 2만 건의 데이터를 구축했다. 각 화학물질 데이터의 물리화학적 특성 데이터를 포괄적으로 수집하여 정리 및 표준화하였으며, 이를 기반으로 한 위험성 예측 모델을 개발하였다.

유클리드소프트는 화학 구조와 텍스트 데이터를 결합해 위험성을 예측하는 멀티모달 AI 모델을 개발했다. 이 모델은 메시지 패싱 신경망(Message Passing Neural Network, MPNN)과 켐버타(ChemBERTa)를 결합해 화학 구조 및 텍스트 데이터를 동시에 처리하며 높은 예측 정확도와 데이터 활용 가능성을 입증했다. 이번 프로젝트에서 한국화학연구원 강영묵 박사는 공공연 파견지원 프로그램을 통해 유클리드소프트에 합류해 과제 수주와 수행 전반에 중요한 역할을 했다. 강 박사는 삼육대학교 류한철 교수 연구실과 협력하여 멀티모달 모델을 설계하고, 데이터 검증 과정을 이끌었다.

멀티모달 모델은 화학 구조를 그래프로 표현해 원자와 결합 간 상호작용을 학습하는 MPNN과 화학 구조 텍스트를 자연어처럼 처리하는 ChemBERTa의 강점을 통합했다. 이를 통해 더욱 신뢰도 높은 위험성 예측 결과를 도출할 수 있었다. 이 모델은 충분히 유효한 독립 테스트 세트를 통해 검증되었으며, 높은 예측 정확도를 기록해 데이터의 품질과 활용 가능성을 입증했다.

유클리드소프트는 이번에 개발한 화학물질 위험성 예측 모델을 웹 기반 서비스로 제공할 계획이다. 사용자는 화학물질 예측 서비스 플랫폼인 'Chem.EUSO'에 접속하여 화학물질의 물리화학적 특성과 위험성을 예측할 수 있다. 회사 관계자는 “이번 서비스는 화학사고 예방과 안전 대응 능력 향상을 위한 중요한 도구가 될 것”이라며 “글로벌 사용자들이 쉽고 편리하게 이용할 수 있도록 최선을 다하겠다”고 말했다.

‘화학물질 위험성 예측 데이터’는 △화학사고의 예방 및 안전사고 대응능력 강화 △화학물질 위험성 정보의 체계적 관리 및 활용성 증대 △국제적 화학물질 관리 규제 대응 등에 활용할 수 있다. 이 데이터는 2025년 AI Hub를 통해 공개될 예정이며, 이를 활용하여 화학사고 발생률을 감소시키고, 사고 발생 시 효과적인 대응을 가능하게 하여, 공공의 안전과 건강을 향상시킬 수 있을 것으로 기대된다. 또한, 국제 화학물질 관리 규제에 대응하는 데이터를 제공하여 국내 기업들이 국제 시장에 진출하고 글로벌 경쟁력을 강화하는 데에 기여할 것으로 전망된다.

유클리드소프트 박주한 대표는 “’화학물질 위험성 예측 데이터’는 화학 사고에 대한 신속한 정보 제공을 통하여 사고 처리 비용 및 시간 등의 경제적 손실을 최소화하는 데에 활용할 수 있다”며 “표준화된 양질의 화학물질 위험성 예측 데이터를 제공하여 국내 기업들이 국제 화학물질 관리 규제에 효과적으로 대응할 수 있는 지원 시스템을 구축하는 데에 이바지할 것”이라고 전했다.

한편, 유클리드소프트는 지난 4년 동안 AI 학습용 데이터 5286만 건과 초거대AI 학습을 위한 말뭉치 데이터 3억 토큰을 구축했으며 2022년에는 ‘인공지능 학습용 데이터 구축 사업’ 최종 평가에서‘대규모 시각 추론 학습 데이터’가 우수 등급을 받는 등 데이터 구축 분야의 전문성을 인정받고 있다. 2024년 ‘초거대AI 확산 생태계 조성사업’에서도 ‘화학물질 위험성 예측 데이터’외에 ‘시각화 자료 질의응답 데이터’사업 또한 구축을 완료하였다.

 

피앤피뉴스 / 서광석 기자 gosiweek@gmail.com 

[저작권자ⓒ 피앤피뉴스. 무단전재-재배포 금지]

WEEKLY HOTISSUE

뉴스댓글 >

많이 본 뉴스

초·중·고

대학

공무원

로스쿨

자격증

취업

오피니언

종합