Nvidia GH200 서버를 7,500유로에 구입해 데스크톱으로 개조한 사례

1 day ago 3

  • Nvidia Grace-Hopper GH200 서버를 개인용 AI 데스크톱으로 개조한 실험으로, 235B 파라미터 모델을 로컬에서 실행할 수 있는 수준의 성능 확보
  • Reddit에서 7,500유로에 중고 GH200 시스템을 구입해, 데이터센터용 수랭 서버공랭 데스크톱으로 재조립
  • 냉각·전원·센서 오류 등으로 GPU 온도 1,677만°C 표시, 팬 회로 손상, 수동 납땜 복구 등 다수의 하드웨어 트러블슈팅 수행
  • 최종적으로 4개의 수랭 쿨러, CNC 가공 어댑터, 3D 프린팅 부품을 조합해 안정적인 시스템 완성
  • 총비용 약 9,000유로로, 단일 H100 GPU 가격보다 저렴하게 초고성능 AI 워크스테이션 구축

Grace-Hopper 서버 구입과 사양

  • Reddit의 r/LocalLLaMA 게시판에서 10,000유로짜리 GH200 서버 매물을 발견, 흥정 끝에 7,500유로에 구매
    • 구성: 2× Grace-Hopper Superchip, 2× 72코어 Grace CPU, 2× H100 GPU, 480GB LPDDR5X, 96GB HBM3, 총 1,152GB 고속 메모리
    • NVLink-C2C 대역폭 900GB/s, 전력 1,000~2,000W, 3,000W PSU 포함
  • 판매자는 GPTshop.ai로, Nvidia 서버를 데스크톱으로 개조해 판매하는 업체
    • 시스템은 원래 수랭식 서버공랭식으로 변환한 ‘프랑켄시스템’ 형태였음
    • 외관이 투박하고 랙 장착 불가, 48V 전원 공급 장치 부착

서버 분해 및 청소

  • 서버는 심한 먼지 오염 상태였으며, 8개의 고출력 팬이 진공청소기 수준의 소음을 발생
    • 가정 내 사용 불가 수준으로 시끄러워, 분해 후 청소 및 재조립 진행
  • 이소프로판올 수 리터를 사용해 메인보드 전체 세척, 히팅 플로어 위에서 일주일 건조
  • Grace-Hopper 모듈 내부 상태를 확인하기 위해 분해, 내부 구조 탐색

수랭 시스템 재구성

  • 누수 위험 때문에 맞춤형 블록 대신 Arctic Liquid Freezer III 420 AIO 쿨러 4개 사용
    • GPU·CPU 다이 치수 측정 후 Fusion 360으로 어댑터 블록 설계
    • Bambu X1 3D 프린터로 프로토타입 제작, 이후 CNC 가공으로 최종 부품 완성
  • 가공 후 잔유 오일 제거 및 장착 완료, 냉각 성능 확보

데스크톱 조립

  • ProfilAlu 알루미늄 프로파일로 프레임 제작, Fusion 360으로 설계
    • 수십 개의 PCB·필터 마운트 부품을 3D 프린팅으로 제작
    • 수 킬로그램의 필라멘트를 사용해 구조 안정화

주요 문제 발생

  • 팬 전원 연결 중 ‘팝’ 소리와 연기 발생, 일부 팬 헤더 회로 손상
    • 잘못된 전류 계산으로 MOSFET 손상 추정
    • 팬 전원은 별도 12V-5A 어댑터로 대체
  • 팬 오류로 BMC(Baseboard Management Controller) 가 부팅 차단
    • phosphor-sensor-monitor.service 비활성화로 팬 체크 우회

GPU 온도 오류와 회로 수리

  • 부팅 중 GPU 온도 16,777,214°C로 표시, 시스템 자동 종료
    • 이는 24비트 정수 최대값(2²⁴-2) 으로, 센서 신호 오류를 의미
  • 현미경으로 점검 결과, 100nF 커패시터와 4.7kΩ 저항 손상 확인
    • 미세 납땜으로 회로 복구, UV 마스크로 고정
    • 재조립 후 정상 부팅 성공

최종 구성 및 성능

  • 추가 제작 부품:
    • 8TB E1.S SSD 마운트, 3kW PSU 후면 패널, 라디에이터 보호용 메시
  • GPU 초기화 문제는 NVLink 비활성화 설정으로 해결
    • /etc/modprobe.d/nvidia-disable-nvlink.conf에 NVreg_NvLinkDisable=1 추가

벤치마크 결과

  • 144코어로 Llama.cpp 빌드 90초 소요, 대형 모델 테스트 결과:
    • gpt-oss-120b-Q4_K_M: 프롬프트 2974.79, 토큰 195.84
    • GLM-4.5-Air-Q4_K_M: 프롬프트 1936.65, 토큰 100.71
    • Qwen3-235B-A22B-Instruct: 프롬프트 1022.79, 토큰 65.90
  • GPU당 약 300W 소비, 최대치(900W) 대비 여유 있음

비용 내역

  • Grace-Hopper 서버 €7,500, SSD €250, CNC 어댑터 €700, 수랭 쿨러 €180
  • 프레임 €200, 유리 패널 €40, 3D 프린팅 재료 €40, 기타 부품 €50
  • 세척용 이소프로판올 €20, 12V 전원 €10, LED 조명 €10
  • 총비용 약 €9,000, 단일 H100 GPU보다 저렴

결론

  • 235B 파라미터 모델을 로컬에서 실행 가능한 데스크톱 완성
  • 데이터센터급 하드웨어를 개인용으로 전환하는 과정에서 센서 오류, 회로 손상, 냉각 문제 등 다수의 난관 극복
  • 결과적으로 고성능 AI 연구용 워크스테이션을 저비용으로 구축한 사례

Read Entire Article