-
Nvidia Grace-Hopper GH200 서버를 개인용 AI 데스크톱으로 개조한 실험으로, 235B 파라미터 모델을 로컬에서 실행할 수 있는 수준의 성능 확보
- Reddit에서 7,500유로에 중고 GH200 시스템을 구입해, 데이터센터용 수랭 서버를 공랭 데스크톱으로 재조립
- 냉각·전원·센서 오류 등으로 GPU 온도 1,677만°C 표시, 팬 회로 손상, 수동 납땜 복구 등 다수의 하드웨어 트러블슈팅 수행
- 최종적으로 4개의 수랭 쿨러, CNC 가공 어댑터, 3D 프린팅 부품을 조합해 안정적인 시스템 완성
- 총비용 약 9,000유로로, 단일 H100 GPU 가격보다 저렴하게 초고성능 AI 워크스테이션 구축
Grace-Hopper 서버 구입과 사양
- Reddit의 r/LocalLLaMA 게시판에서 10,000유로짜리 GH200 서버 매물을 발견, 흥정 끝에 7,500유로에 구매
- 구성: 2× Grace-Hopper Superchip, 2× 72코어 Grace CPU, 2× H100 GPU, 480GB LPDDR5X, 96GB HBM3, 총 1,152GB 고속 메모리
- NVLink-C2C 대역폭 900GB/s, 전력 1,000~2,000W, 3,000W PSU 포함
- 판매자는 GPTshop.ai로, Nvidia 서버를 데스크톱으로 개조해 판매하는 업체
- 시스템은 원래 수랭식 서버를 공랭식으로 변환한 ‘프랑켄시스템’ 형태였음
- 외관이 투박하고 랙 장착 불가, 48V 전원 공급 장치 부착
서버 분해 및 청소
- 서버는 심한 먼지 오염 상태였으며, 8개의 고출력 팬이 진공청소기 수준의 소음을 발생
- 가정 내 사용 불가 수준으로 시끄러워, 분해 후 청소 및 재조립 진행
-
이소프로판올 수 리터를 사용해 메인보드 전체 세척, 히팅 플로어 위에서 일주일 건조
- Grace-Hopper 모듈 내부 상태를 확인하기 위해 분해, 내부 구조 탐색
수랭 시스템 재구성
- 누수 위험 때문에 맞춤형 블록 대신 Arctic Liquid Freezer III 420 AIO 쿨러 4개 사용
- GPU·CPU 다이 치수 측정 후 Fusion 360으로 어댑터 블록 설계
-
Bambu X1 3D 프린터로 프로토타입 제작, 이후 CNC 가공으로 최종 부품 완성
- 가공 후 잔유 오일 제거 및 장착 완료, 냉각 성능 확보
데스크톱 조립
-
ProfilAlu 알루미늄 프로파일로 프레임 제작, Fusion 360으로 설계
- 수십 개의 PCB·필터 마운트 부품을 3D 프린팅으로 제작
- 수 킬로그램의 필라멘트를 사용해 구조 안정화
주요 문제 발생
- 팬 전원 연결 중 ‘팝’ 소리와 연기 발생, 일부 팬 헤더 회로 손상
- 잘못된 전류 계산으로 MOSFET 손상 추정
- 팬 전원은 별도 12V-5A 어댑터로 대체
- 팬 오류로 BMC(Baseboard Management Controller) 가 부팅 차단
-
phosphor-sensor-monitor.service 비활성화로 팬 체크 우회
GPU 온도 오류와 회로 수리
- 부팅 중 GPU 온도 16,777,214°C로 표시, 시스템 자동 종료
- 이는 24비트 정수 최대값(2²⁴-2) 으로, 센서 신호 오류를 의미
- 현미경으로 점검 결과, 100nF 커패시터와 4.7kΩ 저항 손상 확인
- 미세 납땜으로 회로 복구, UV 마스크로 고정
- 재조립 후 정상 부팅 성공
최종 구성 및 성능
- 추가 제작 부품:
- 8TB E1.S SSD 마운트, 3kW PSU 후면 패널, 라디에이터 보호용 메시
- GPU 초기화 문제는 NVLink 비활성화 설정으로 해결
-
/etc/modprobe.d/nvidia-disable-nvlink.conf에 NVreg_NvLinkDisable=1 추가
벤치마크 결과
-
144코어로 Llama.cpp 빌드 90초 소요, 대형 모델 테스트 결과:
- gpt-oss-120b-Q4_K_M: 프롬프트 2974.79, 토큰 195.84
- GLM-4.5-Air-Q4_K_M: 프롬프트 1936.65, 토큰 100.71
- Qwen3-235B-A22B-Instruct: 프롬프트 1022.79, 토큰 65.90
- GPU당 약 300W 소비, 최대치(900W) 대비 여유 있음
비용 내역
- Grace-Hopper 서버 €7,500, SSD €250, CNC 어댑터 €700, 수랭 쿨러 €180
- 프레임 €200, 유리 패널 €40, 3D 프린팅 재료 €40, 기타 부품 €50
- 세척용 이소프로판올 €20, 12V 전원 €10, LED 조명 €10
-
총비용 약 €9,000, 단일 H100 GPU보다 저렴
결론
-
235B 파라미터 모델을 로컬에서 실행 가능한 데스크톱 완성
- 데이터센터급 하드웨어를 개인용으로 전환하는 과정에서 센서 오류, 회로 손상, 냉각 문제 등 다수의 난관 극복
- 결과적으로 고성능 AI 연구용 워크스테이션을 저비용으로 구축한 사례