Mendesain Ulang Pusat Data untuk Era AI

Terkadang perubahan terjadi begitu cepat sehingga sulit untuk mengikutinya, kita harus membuat konsesi atau menghadapi rintangan yang berat. GPU menetapkan kecepatan, karena AI mulai mengambil alih dunia, tetapi pusat data berjuang – beberapa tidak dapat memenuhi tuntutan waktu pemasaran, sementara yang lain membayar harga yang mahal.

Perbedaan yang mencolok dalam pembangunan infrastruktur AI dapat dilihat jika kita melihat kembali beberapa tahun, atau bahkan membandingkannya dengan beban HPC standar saat ini. Terlepas dari kekuatannya, pengaturan 20 hingga 30 kW yang khas tidak lagi cukup untuk mendukung beban kerja AI.

Mengapa pusat data saat ini mencapai batasnya

Dengan B200 terbaru yang populer, seri GB, menggunakan 100–130 kW per rak, dunia berlomba untuk memenuhi tolok ukur baru: 600 kW Rubin Ultra. Kita sekarang melihat rentang beban 20 kW hingga 600 kW per meter persegi – yang pada dasarnya memampatkan pusat data 15 hingga 20 MW menjadi hanya 1.000 meter persegi ruang putih.

Dari sudut pandang real estat atau lingkungan, ini mungkin tampak seperti perubahan positif. Tetapi membawa tantangan teknik dan operasional yang serius – yang membuat tim operasi dan proyek terjaga di malam hari. Berikut adalah beberapa tantangannya.

  • Ketegangan beban atau kebocoran:

    Ketegangan beban yang direkomendasikan untuk rak 100 kW adalah dua hingga tiga ratus kilo per meter persegi. Ini berarti sulit untuk merancang riser yang dapat mendukung berat seperti itu. Akibatnya, pipa pendingin sering dipasang di atas lantai atau di atas rak sebagai solusi sementara. Tetapi ini bukan solusi jangka panjang yang mudah beradaptasi. Memecahkan satu masalah cenderung menciptakan masalah lain, dan mempertahankan waktu aktif pusat data menjadi tantangan nyata.

  • Ekspansi pusat data:

    Karena infrastruktur menjadi lebih padat, pusat data besar tidak lagi dapat memanfaatkan lahan secara maksimal. Orang mungkin berasumsi ini berarti kepadatan penerapan yang lebih tinggi dalam jejak yang lebih kecil – tetapi bukan itu masalahnya. Peraturan pemerintah dan batasan teknik listrik membatasi berapa banyak daya yang dapat dikirim ke satu lokasi. Menurut pandangan saya, “Efektivitas Penggunaan Lahan” pusat data menurun dari hari ke hari.

  • Perencanaan proyek:

    Pusat data sekarang membutuhkan infrastruktur mekanik dan sipil yang kuat yang mampu mendukung solusi apa pun. Namun, merancang untuk berbagai beban kapasitas tidak ideal secara ekonomis. Anggaran meningkat secara signifikan, dan ROI menjadi dipertanyakan, terutama ketika penerapan kapasitas rendah menempati ruang dengan spesifikasi tinggi yang sama.

  • Keusangan perangkat keras:

    Perangkat keras yang ketinggalan zaman membuat perencanaan proyek menjadi lebih sulit. Dengan sistem yang hanya bertahan dua hingga tiga tahun, pusat data sudah berjuang dengan masalah sebelumnya. Lebih buruk lagi, sistem yang akan datang tidak kompatibel dengan yang lama, tidak menyisakan ruang untuk penggunaan kembali atau adaptasi.

Memikirkan kembali tumpukan pusat data

Mengingat semua tantangan ini, inilah saatnya untuk memikirkan kembali dan menata ulang empat pilar utama pusat data yang khas:

  • Telekomunikasi:

    Jaringan pusat data masa depan akan sangat padat. Setiap NVIDIA SuperPod mungkin membutuhkan 22 km optik. Harapkan sidecar seukuran rak tunggal dan hingga 5.000 kabel pada papan Rubin dengan PCB 72 lapis. Apakah Anda Ruang Pertemuan Saya siap untuk mendukung ini?

  • Listrik:

    Daya adalah sumber kehidupan setiap sistem. Rak tiba dengan daya internal, dan pusat data bergerak melampaui pengaturan N atau 2N tradisional. Sistem sekarang membutuhkan jumlah koneksi yang ganjil, yang membuat redundansi tidak dapat diprediksi, baik untuk PDU, busbar, ATS, atau transformator N(x).

  • Arsitektur:

    Setiap iterasi baru membawa perubahan: knalpot kabel, jaringan cairan pendingin, pertimbangan penahan beban. Setiap komponen harus diperhitungkan, dan tidak ada satu pun kegagalan yang memengaruhi yang lain. Pusat data harus diskalakan dari HPC ke AI generasi berikutnya dengan desain ulang minimal.

  • Mekanis:

    Riser yang mampu mendukung dua hingga tiga ratus kilo atau lebih di masa depan, ruang plenum untuk kabel daya dan jaringan yang besar, dan tunjangan untuk infrastruktur pendingin yang luas adalah tantangan sehari-hari bagi tim proyek. Setiap aspek rekayasa fisik harus dipertimbangkan, dan semua persyaratan mekanis harus dipenuhi.

 

*Penulis menangani operasi dan strategi ujung ke ujung untuk Compute Nordic. Dia memiliki sekitar 13 tahun pengalaman dengan berbagai pemain DC utama di India dan Norwegia.

**Bagian ini pertama kali muncul di Edisi 9 majalah Cloud & Datacenters W.Media. Klik gambar di bawah dan buka halaman 22-23 untuk membaca ceritanya.

Publish on W.Media
Author Info:
Picture of Deborah Grey
Deborah Grey
Share This Article
Related Posts
Other Popular Posts
Northeast Asia News [ID]