ResetData와 BP Castrol, 데이터 센터 설계 재정의를 원하다

Source: ResetData

AI 팩토리라는 용어는 유행어에서 설계도로 발전했으며 올해 호주에서는 멜버른에 최초의 맞춤형 사례가 공개될 예정입니다. ResetData는 업계 혁신을 지원하기 위해 AI 최적화 인프라와 AI 마켓플레이스를 제공하고 있으며, 이를 위해 BP Castrol을 비롯한 주요 공급업체와 협력하여 가장 강력한 GPU를 최적의 성능으로 유지하는 최첨단 액체 냉각 시스템을 제공하고 있습니다. 이는 주권적이고 지속 가능한 AI 인프라 모델을 만들고 8월 21일 시드니 클라우드 및 데이터센터 컨벤션에서 내부 스토리를 공유할 것입니다.

ResetData는 고성능, 저영향 AI 컴퓨팅 환경을 제공하는 데 주력하는 호주 기술 인프라 회사입니다. AI 팩토리는 AI, 머신 러닝 및 대규모 언어 모델 워크로드를 위해 특별히 설계되었으며, 고밀도 GPU 클러스터와 고급 액체 냉각을 결합하여 배출량과 에너지 비용을 줄이면서 최대 성능을 제공합니다.

ResetData의 공동 CEO인 Bass Salah()이(가) 밝혔습니다. 최근 기사에서 당사의 AI 팩토리는 호주 기업의 경쟁 환경을 변화시킬 것입니다. 이 기술에 대한 액세스는 이전에는 소수의 개인 GPU 클러스터로 제한되었습니다. 당사의 AI 팩토리 출시는 인공 지능에 대한 액세스를 확대하여 호주의 경제 성장을 가속화합니다. ResetData AI 마켓플레이스는 즉시 배포할 수 있는 NVIDIA 인증 AI 모델을 제공합니다.”

그는 덧붙였습니다. 출시 시 당사의 빠르게 성장하는 AI 솔루션은 회계, 법률, 소매, 기술 및 엔지니어링 팀에 서비스를 제공할 것입니다. ResetData는 최대 40% 낮은 비용, 45% 적은 배출량 및 제로 폐수로 호주 IT를 보다 에너지 효율적이고 지속 가능한 기반 위에 구축하고 있습니다. 데이터 센터는 이미 국가 전력 공급량의 20분의 1을 사용하고 있으며 빠르게 성장하고 있기 때문에 이러한 효율성은 국가적으로 중요합니다. 초고밀도, 저지연 CBD AI 팩토리는 업계의 미래입니다.”

호주의 AI 인프라는 현재 외국 소유의 하이퍼스케일 공급업체에 크게 의존하고 있습니다. 멜버른에 위치한 ResetData의 AI-F1은 더 큰 주권적 역량을 제공하고 이번 달 말에 가동될 예정입니다. 1.25MW 규모의 이 부지에는 Nvidia H200 GPU 클러스터가 있으며 최신 AI 워크로드를 수용하도록 구축되었습니다.AI 마켓플레이스 및 부문 도달 범위인프라와 함께 ResetData는 Nvidia AI Enterprise에서 Nvidia 인증 AI 모델 및 마이크로서비스에 대한 즉각적인 액세스를 제공하는 AI 마켓플레이스 플랫폼을 출시했습니다. 이 마켓플레이스는 스타트업 및 연구 기관에서 정부 기관 및 회계, 법률, 소매, 기술, 엔지니어링 등에서 잠재적인 응용 분야를 가진 대기업에 이르기까지 광범위한 청중을 대상으로 합니다.액체 냉각의 역할액체 냉각은 오늘날의 극단적인 계산 부하를 관리하는 AI-F1의 능력에 기본적입니다. GPU가 이제 각각 1킬로와트 이상을 소비합니다. 2킬로와트 GPU에 대한 설계가 이미 등장하고 있습니다. 공기 냉각만으로는 더 이상 충분하지 않습니다. BP Castrol은 데이터 센터 시장 개발 전문성을 통해 이러한 고밀도 배포를 가능하게 하는 열 관리 시스템을 제공하고 있습니다.

BP Castrol의 접근 방식은 콜드 플레이트가 CPU 및 GPU에서 직접 열을 끌어와 소스에서 70~80%를 제거하는 직접 칩 냉각과 전체 서버가 유전체 유체에 잠겨 훨씬 더 높은 밀도를 달성하는 액침 냉각을 모두 포함합니다. 직접 칩 시스템은 수많은 기존 데이터 센터 설계와 호환되지만 여전히 보조 공기 냉각이 필요하며, 액침은 완전히 없이 작동할 수 있지만 모든 OEM이 현재 지원하는 것은 아닌 하드웨어 및 보증 고려 사항이 필요합니다.운영 현실과 위험 관리BP Castrol의 아시아 태평양 데이터 센터 시장 개발 이사인 Mark Roberts는 직접 액체 냉각(DLC) 및 액침이 증가함에 따라 데이터 센터 운영자가 실제로 유체의 상태를 모니터링하지 않으면 가동 중단 위험이 있다고 경고했습니다. W.Media에서 보도한 바와 같이, Mark Roberts는 다음과 같이 말했습니다.

“우리는 실제로 데이터 센터에서 단일 실패 지점을 설계하는 데 수년 동안 노력했습니다. 우리는 하나를 다시 넣었습니다. 공기가 임계점에 도달하고 있습니다. 우리는 현재 보기 시작하는 TDP로 이러한 GPU 중 일부를 냉각할 수 없으며 1킬로와트 GPU가 정상일 것이고 2킬로와트 GPU까지 냉각할 수 없다는 것을 추가했습니다. H200이 함께 제공되는 NVL72 랙의 현재 세대는 약 120~130킬로와트입니다.”

그는 덧붙였습니다. “우리는 분명히 600킬로와트 주변에서 발표를 보기 시작할 것입니다. 우리가 저하된 상태의 유체에 대해 이야기할 때 잠재적으로 장비 고장이 발생하고 잠재적인 부식 문제가 발생하며 냉각 용량이 줄어들 것입니다. 그리고 이것은 한 번에 모두 발생하지 않을 것입니다. 따라서 상태 기반 모니터링 시스템이든 분기별 예방 유지 관리이든 해당 유체를 모니터링하는 것이 정말 중요합니다. 5백만 달러 상당의 랙에 대해 이야기할 때 유체와 이를 통과하는 모든 것이 위험을 완화할 수 있도록 실제로 확인하는 것이 가장 좋습니다.”

AI 팩토리가 생산에 들어감에 따라 유체 품질은 부식, 생물 오염 및 재료 열화를 포함한 위험과 함께 모든 하드웨어 구성 요소만큼 중요합니다. BP Castrol은 냉각수를 예비 부품으로 취급하고 자세한 유체 상태 기록을 유지하며 상태 기반 모니터링을 사용하여 성능에 영향을 미치기 전에 변경 사항을 감지할 것을 권장합니다.

운영 요구 사항은 상당합니다. 고밀도 AI 환경의 액침 탱크에는 수천 리터의 유체가 포함될 수 있는 반면 직접 칩 시스템은 높은 압력과 유량으로 작동하며 종종 랙 매니폴드를 통해 초당 15리터 이상을 이동합니다. 때로는 피크 드로우가 밀리초 동안 거의 두 배로 증가하는 급격한 GPU 전력 스파이크는 시스템이 갑작스러운 부하 변화에서도 냉각 성능을 유지하도록 설계되어야 함을 의미합니다. BP Castrol의 엔지니어링 접근 방식에는 배관 크기를 늘리고 완충 탱크를 사용하여 열 안정성을 유지하는 것이 포함됩니다.

지속 가능한 AI 인프라ResetData–BP Castrol 파트너십은 AI 특정 데이터 센터 설계와 고급 냉각 기술이 성능 및 지속 가능성 목표를 모두 충족하기 위해 어떻게 통합되는지 보여줍니다. AI-F1 시설은 AI 워크로드를 위해 설계되었습니다. 주권적 인프라, GPU 밀도, 효율적인 냉각 및 접근 가능한 AI 마켓플레이스의 조합은 호주 및 그 이상 지역의 미래 시설에 대한 선례를 세웁니다.시드니에서 기조 연설에서 시드니 클라우드 및 데이터센터 컨벤션 2025, BP Castrol의 Mark Roberts와 ResetData의 Bass Salah는 기조 연설 “AI 팩토리 – 최신 유행 문구이거나 데이터 센터 산업을 재정의하기 위해 여기에 있습니다.”를 발표할 예정입니다. 이 세션에서는 AI 팩토리의 예상 성장, 물리적 인프라에 미치는 영향, 호주 최초의 주권 AI 팩토리 구축에서 얻은 교훈을 다룰 것입니다.

참석자들은 비즈니스 동인과 설계 선택에서 열 위험 관리, 하드웨어 호환성 및 빠르게 진화하는 AI 하드웨어 요구 사항에 직면한 확장과 같은 운영상의 문제에 이르기까지 근거 있는 논의를 기대할 수 있습니다.

시드니 클라우드 및 데이터센터 컨벤션은 2025년 8월 21일 오전 8시부터 오후 8시 30분까지 시드니 국제 컨벤션 센터에서 개최됩니다. 다음 주소에서 참석 등록을 제출하십시오. https://clouddatacenter.events/events/sydney-cloud-datacenter-convention-2025/

[Author: Conor McNevin]

Publish on W.Media
Author Info:
Picture of Simon Dux
Simon Dux
Share This Article
Related Posts
Other Popular Posts