기존 H100 대비 메모리 용량 3배 이상, 대규모 언어 모델(LLM) 추론 병목 현상 획기적 개선
AI 에이전트, 이미지/영상/코드 생성 등 고성능 필요한 AI 서비스 지연 시간 최소화
삼성SDS가 클라우드 ‘SCP’를 통해 엔비디아 최신 GPU를 활용한 구독형 서비스를 선보이며 급증하는 AI 연산 수요 대응에 나섰다.
삼성SDS는 클라우드 플랫폼 SCP(삼성 클라우드 플랫폼)를 통해 엔비디아의 최신 GPU 'B300(Blackwell Ultra)' 기반 GPUaaS(GPU 구독형 서비스)를 국내 최초로 론칭했다고 23일 밝혔다.
이번 서비스는 기업들이 AI 모델 개발을 넘어 실제 서비스에 적용하는 ‘AI 추론’ 단계로 진입하면서 증가하는 고성능 컴퓨팅 수요에 대응하기 위한 전략으로 풀이된다.
삼성SDS에 따르면, B300 GPU는 12단 HBM3E(고대역폭 메모리)를 탑재해 GPU당 288GB 메모리와 초당 8TB의 대역폭을 제공한다. 이는 기존 H100 대비 메모리 용량은 3.6배, 대역폭은 2.4배 향상된 수준으로, 대규모 언어모델(LLM) 구동 시 발생하는 데이터 병목 현상을 크게 개선할 수 있다.
삼성SDS는 앞서 2021년 A100, 2023년 H100 기반 GPUaaS를 선제적으로 도입하며 AI 인프라 시장을 확대해 왔다. 이번 B300 서비스 출시를 통해 GPU 기반 클라우드 생태계 경쟁력을 더욱 강화한다는 전략이다.
'SCP B300 GPUaaS' 고객은 해당 서비스를 통해 고용량 메모리를 기반으로 AI 에이전트, 이미지·영상·코드 생성 및 분석 등 고성능 AI 서비스를 보다 효율적으로 운영할 수 있다. 또한 사용량 기반 과금 방식으로 초기 투자 부담을 줄이고 비용 효율성을 높일 수 있다고 삼성SDS는 강조했다.
이와 함께 삼성SDS는 보안 역량을 결합한 클라우드 환경을 제공해 민감한 기업 데이터를 안전하게 처리할 수 있도록 지원한다. GPU 수급이 어려운 상황에서도 최신 아키텍처를 즉시 활용할 수 있다는 점도 장점으로 꼽힌다고 삼성SDS는 덧붙였다.
아울러 삼성SDS는 향후 서비스 확장도 예고했다. 삼성SDS는 별도의 인프라 비용 없이 사용한 만큼만 비용을 지불하는 '서버리스(Serverless) 추론 서비스'와 자동 분산 학습이 가능한 'AI 학습 서비스'를 올해 3분기 출시할 계획이다.
삼성SDS 이호준 클라우드서비스사업부장(부사장)은 "SCP가 보유한 자원 최적화·에너지 절감 등 GPU 효율화 역량을 바탕으로 대기업, 중견/중소, 공공 등 AI를 업무에 적용하려는 고객에게 국내 최초 B300 GPU 서비스를 제공해 AX 전환을 적극 지원하겠다"고 밝혔다.
한편 삼성SDS는 민관협력형(PPP) 클라우드 사업자로서 대구센터에 H100 기반 GPUaaS를 도입하고, 정부의 초거대 AI 공통기반 구축 및 고성능 컴퓨팅 지원사업에도 참여하는 등 공공·민간을 아우르는 AI 인프라 사업을 확대하고 있다. [파이낸셜신문=황병우 기자]

