[센터소식] [성대신문 기획보도]인공지능 시대 핵심 인프라, 우리 학교 슈퍼컴퓨팅센터
- 슈퍼컴퓨팅센터
- 조회수226
- 2024-09-01
연구비 절감 및 연구 효율 향상을 도모하는 고성능 컴퓨팅 서비스 구축
슈퍼컴퓨팅이란 고성능 컴퓨팅으로 AI 연구 개발 과정에서 요구되는 고급 연산 문제를 풀기 위해 슈퍼컴퓨터 및 *컴퓨터 클러스터를 사용하는 것을 의미한다. 국내외 대학사회에서 AI 연구에 대한 수요가 증가함에 따라 슈퍼컴퓨팅 시설 구축의 필요성이 꾸준히 제기됐다. 이에 따라 설립된 우리 학교 슈퍼컴퓨팅센터는 약 40억 원 규모의 집중투자를 통해 2022년부터 고성능 그래픽 처리 장치(이하 GPU) 중심의 슈퍼컴퓨팅 서비스를 개시하고 활발한 운영을 이어오고 있다.
AI 연구 개발 경쟁력 유지를 위한 지속적인 노력 및 정부 지원 필요해
우리 학교 슈퍼컴퓨팅센터, 연구 중심 대학을 선도하다.
우리 학교 슈퍼컴퓨팅센터는 본교의 장기 전략인 ‘VISION2030+’에 맞춰 연구 중심 대학으로 나아가기 위해 학술 연구 역량 향상과 학생 수업 지원 등의 역할을 수행하고자 설립된 기관이다. 우리 학교 슈퍼컴퓨팅센터 최형기 센터장은 “우리 학교 슈퍼컴퓨팅센터는 우리 대학이 로봇, 빅데이터, AI 등의 4차 산업혁명 핵심 기술을 선점할 수 있는 융복합 연구 및 교육 클러스터의 중심이 되도록 최선을 다해 노력하고 있다”고 말했다. 자과캠 의학관에 위치한 우리 학교 슈퍼컴퓨팅센터는 2022년 4월 개관해 교내 연구자들에게 연구비 절감 및 편리한 연구 환경 조성을 위한 고성능 컴퓨팅 서비스를 제공하고 있으며, 고성능 컴퓨터를 활용한 교육 및 기술 세미나도 개최하는 등 다방면으로 활동하고 있다.
우리 학교 슈퍼컴퓨팅센터에서 제공하는 주요 서비스로는 △GPU 클러스터 서비스 △베어메탈 서비스 △서버위탁 서비스가 있다. GPU 클러스터 서비스와 베어메탈 서비스는 시중보다 저렴한 가격에 GPU 중심의 장비를 대여해 일반 서버에서는 5일~6일 소요되는 연산을 불과 몇 시간 만에 빠르게 진행할 수 있는 서비스다. 두 서비스는 기본적으로 슈퍼컴퓨터와 같은 고성능 컴퓨터에 반드시 필요한 GPU를 사용하는 서비스라는 점에서 유사하지만 이용 방식 측면에서 차이를 보인다. GPU 클러스터 서비스는 사용자가 우리 학교 슈퍼컴퓨팅센터로부터 발급받은 GPU 클러스터 계정을 통해 복잡한 계산을 여러 서버에 있는 GPU로 나눠 동시에 처리하고, 고속 네트워크로 결과를 합산해 도출하는 방식이다. 반면 베어메탈 서비스는 사용자가 서버 1대를 할당받아서 운영 체계부터 환경 구성까지 직접 설정해 사용하는 방식으로 제공된다. 두 서비스는 △바이오 △소재부품 △우주항공 등 다양한 연구 분야에서 활용되며 계산과학 및 시뮬레이션 등의 연구 개발에 유용하게 사용될 수 있다. 일례로 신약 개발을 위해 필요한 임상실험을 대체할 수 있는 시뮬레이션을 단기간에 개발하거나 ChatGPT와 같은 *거대 언어 모델(LLM)을 개발하는 데도 도움을 준다.
또 다른 주요 서비스 중 하나인 서버위탁 서비스의 경우 우리 학교 슈퍼컴퓨팅센터 서버룸 내에서 우리 학교 연구실 및 연구소 소유의 서버에 대한 관리 인프라를 갖추고 위탁 관리해 주는 서비스다. 자과캠 의학관 내에 위치한 우리 학교 슈퍼컴퓨팅센터 서버룸 내부에는 서비스 제공을 위한 서버 및 네트워크 장치를 비롯해, 슈퍼컴퓨터가 가장 최적화된 성능을 보존할 수 있도록 일정한 온도 및 습도를 유지하는 항온항습기 또한 운용되고 있다. 본 서비스는 △네트워크 및 물리적 보안 시설 △방화벽 △*UPS 등이 갖춰진 공간에 연구 서버를 설치함으로써 연구자로 하여금 더욱 안정적으로 서버를 이용하고 원활히 데이터를 처리할 수 있게 한다는 장점이 있다.
우리 학교 슈퍼컴퓨팅센터 통합관제실 내부 모습. 사진 | 동윤서 기자 dong1201@
연구 협력을 통한 시너지를 위해
우리 학교 슈퍼컴퓨팅센터는 타 대학 및 기관과의 협력을 꾸준히 확장해나가고 있다. 지난 4월 우리 학교 슈퍼컴퓨팅센터는 국가초고성능컴퓨팅 전문센터로 지정된 울산과학기술원(이하 UNIST) 슈퍼컴퓨팅센터와 ‘슈퍼컴퓨팅 기반 연구 혁신 생태계 강화를 위한 업무 협약’을 체결했다. 이에 따라 양 기관은 △각 센터 내 연구 장비 공동 활용 △슈퍼컴퓨팅 기술 개발·교육 부문 협력 △슈퍼컴퓨팅 및 데이터 기반의 신사업 발굴 협력 △연구 혁신 생태계 강화를 위한 슈퍼컴퓨팅 활용 기술 협력 △포괄적인 인적·물적 자원 교류 등을 함께 이루고 있다. 최 센터장은 “CPU 자원 중심의 UNIST 슈퍼컴퓨팅센터와 GPU 자원 중심의 우리 학교 슈퍼컴퓨팅센터의 협력은 CPU, GPU 교차사용 등의 공동 활용, 슈퍼컴퓨팅 기술 교류, 학술 공동연구 등에서 많은 시너지를 낼 것”이라며 “현재 두 대학의 협력은 계속 확장 중”이라고 전했다. 오늘(4일)은 근래 최신 GPU 장비를 대폭 확장한 기초과학연구원(이하 IBS) 슈퍼컴퓨팅센터와의 업무 협약식이 이뤄진다. 본 협약은 IBS 슈퍼컴퓨팅센터의 최신 장비를 우리 학교 연구자들에게 비용 부담 없이 사용할 수 있는 기회를 제공하고, 교내 IBS 산하 연구단인 뇌과학이미징연구단, 이차원양자헤테로구조체연구단의 슈퍼컴퓨팅 자원 활용을 보다 효과적으로 지원하자는 취지를 지닌다.
우리 학교 슈퍼컴퓨팅센터 서버룸 내부 모습. 사진 | 동윤서 기자 dong1201@
AI 연구 수요 증가에 따라 가중되는 비용 부담
대학사회 내 AI 연구 수요가 높아지는 상황 속에서 우리 학교 슈퍼컴퓨팅센터 역시 활발히 연구를 이어가고 있지만 이에 따라 자연스럽게 운영비용에 대한 부담이 가중되고 있다. 무엇보다 연구 개발이 활발한 대학일수록 GPU 클러스터를 비롯한 연구에 필요한 최신 장비 가동으로 인해 전기요금 부담이 큰 것으로 나타났다. 한국전력의 통계 자료에 의하면 지난해 전기요금 최상위 대학에 오른 서울대의 경우 22만 6,836MWh의 전력 사용량을 기록하며 약 328억 원의 전기요금을 부담했으며, 한국과학기술원(KAIST)의 경우 12만 756MWh의 전력 사용량을 기록해 약 170억 원의 전기요금을 부담했다.
우리 학교 역시 전기요금 부담이 가중되고 있는 상황이다. 우리 학교 슈퍼컴퓨팅센터에서 제공하는 서버를 이용하는 단과대학이 △공과대학 △생명공학대학 △소프트웨어융합대학 △자연과학대학 △정보통신대학 등으로 다양해지고 있으며, 센터 내 위탁관리 장비 또한 2022년에는 389대였던 것에 비해 올해 약 505대로 증가해 전력 사용량이 늘어났기 때문이다. 또한 장비 가동을 위한 전기요금 외에도 △서버 유지비용 △연구 장비 발열 시 장비의 온도를 낮추기 위한 냉방비 △최근 환율 상승으로 인해 급등하는 GPU 가격에 따른 최신 장비 구축의 어려움 등도 큰 부담으로 작용하고 있다. 이에 올해 우리 학교 슈퍼컴퓨팅센터가 내세운 운영 목표는 효율적인 공간 활용을 위한 시설 개선 및 정책 수립, 냉난방 효율 증대를 위한 시설 개선 및 캠페인 진행 등이다. 최 센터장은 “우리 학교 슈퍼컴퓨팅센터는 GPU 클러스터 서비스를 제공하고 교내 각 연구실의 서버를 위탁해 관리하는 역할을 수행하고 있는데 최근 교내에 고전력, 고성능의 서버들이 대폭 증가하고 있다”며 “이를 효율적으로 운영할 수 있는 교내 중앙 집중적인 공간이나 인프라 확충, 추가적인 전력 공급이 필요한 상황에 적극적으로 대처하고자 해당 목표를 설정하게 됐다”고 밝혔다. 더불어 우리 학교 슈퍼컴퓨팅센터는 지난 5월 불필요한 전기 사용을 줄이고 위탁 공간을 확보하자는 취지에서 전기절감캠페인 사업을 진행하기도 했다. 위 사업을 통해 우리 학교 슈퍼컴퓨팅센터는 위탁 관리하고 있던 서버 500대 중 사용률과 성능이 저조한 서버 34대를 학교에 반납하고 폐기 처리했다.
최 센터장은 “우리 학교 슈퍼컴퓨팅센터가 지닌 경쟁력을 유지하기 위해서는 최소 4년~5년 주기로 막대한 예산을 수반하는 시스템적 확충이 필요한데 국내 대학의 예산 범위 내에서는 이뤄내기가 쉽지 않다”며 “우리 학교나 슈퍼컴퓨팅센터 내에서 이를 위한 관심과 노력을 경주해야 하고, 정부에서도 국가 연구 경쟁력 확보를 위해 공공기관에 대한 공공재 첨단 장비 지원 체계를 구축하기를 희망한다”고 말했다.
◆ 컴퓨터 클러스터= 네트워크에 접속된 다수의 컴퓨터를 통합해 하나의 거대한 병렬 컴퓨팅 환경을 구축하는 기법.
◆ 거대 언어 모델(LLM)= 대규모 텍스트 데이터를 학습해 인간과 유사한 자연어 이해와 생성 능력을 갖춘 인공지능 모델.
◆ UPS= Uninterruptible Power Supply System의 약자로, 정전 시 비상 부하를 공급하는 무정전전원장치를 일컫는 말.
[성대 신문=동윤서 기자]
adong1201@skkuw.com
○ 기사 출처
- 성대 신문
○ 관련 보도