LLM 가격을 논할 때 핵심을 놓치고 있음. 구독형 토큰 가격은 API 가격보다 10~40배 저렴해서, 월 $90짜리 Claude 구독은 API 토큰 가격으로 환산하면 거의 $1000~$4000에 해당함 이건 나무만 보고 숲을 못 보는 것 같음. ChatGPT와 일하는 건 예전에 엔터프라이즈 시절 인도 오프쇼어 개발자들과 일하던 느낌과 섬뜩하게 비슷함. 명시적으로 안내하면 생산적이지만, 마음대로 두면 WTF 순간이 많이 생김 원격 개발자와 달리 아웃소싱의 문제는, 제대로 굴리려면 정말 뛰어난 관리자와 기술 리더가 필요하다는 점임 미국 소프트웨어 회사 임원인 친구가 있는데, 동유럽 지사의 프로그래머 몇 팀을 해고하고 소수의 미국 프로그래머와 AI로 대체할 준비를 하고 있음. 그쪽이 훨씬 생산적이고 새 기능을 훨씬 빠르게 만든다고 함 미국 최첨단 AI의 미래는 API 호출이 아니라, OAI/Anthropic에 컨설턴트나 외부 업체처럼 작업을 가져가고, 중간 작업물을 대량으로 보지 않은 채 제품 같은 결과물을 받는 형태임 로컬 모델을 어떻게든 써보려고 정말 많이 시도했음. 여러 실행 환경, 도구, 스킬, 프롬프트 등을 다 써봤음 더 가능성 높은 시나리오는 하단이 사라지고, 상단은 최첨단 모델을 통해 더 생산적으로 되는 것임 DeepSeek를 오픈소스 LLM의 예로 드는 서사를 계속 보는데, 그들은 엄청난 양의 토큰을 원가로 보조하고 있음. 게으르지 않고 비판적으로 생각하면 왜 그러는지 쉽게 이해할 수 있음 엔지니어 비용보다 품질 경험과 개인적 가치관이 더 중요하다고 봄. 지난 몇 년간 아웃소싱 작업에서 너무 많은 지름길을 봤고, AI도 지름길을 아주 좋아함. 둘의 조합은 비용 절감만큼의 가치가 없음 글이 다루지 않는 부분이 있음. 좋은 엔지니어는 기존 프로젝트에서 코딩 자체에 쓰는 시간이 다른 작업에 비해 많지 않음. 좋은 엔지니어는 시스템을 끝에서 끝까지 이해함. 오프쇼어 개발자는 Llama3보다 못함Hacker News 의견들
두 번째로, 모델을 다루는 “운영자”의 실력이 결과에 엄청난 차이를 만듦. 프롬프트를 잘 쓰고 주도성이 높은 숙련된 시니어 개발자는 동기와 기초 역량이 부족한 팀원보다 훨씬 좋은 결과를 냄
마지막으로 Opus 같은 5T급 최첨단 모델과, 벤치마크에서만 잘 보이는 DeepSeek의 작은 증류 모델 사이에는 능력, 결정성, 오류 처리에서 큰 차이가 있음
그래서 대기업은 할인된 구독 플랜보다 훨씬 더 많이 내는 구조임
그리고 로컬 모델이 “DeepSeek에서 증류된 것”이라는 말은 잘못 알고 있는 것 같음. 로컬 모델들이 벤치마크에서만 잘하는 것도 아니고, Qwen 3.6은 꽤 괜찮은 모델임. 물론 Opus는 아니지만 훨씬 빠르고, 속도 자체도 하나의 품질임
이 회사들은 막대한 적자를 내고 있고 수천억 달러 규모의 부채와 약정이 있음. 조만간 수익화 수도꼭지를 열어야 함
LLM은 아웃소싱 개발자를 대체할 가능성이 큼. 맥락을 아는 내부 직원들이 LLM을 써서 예전 오프쇼어 개발자가 하던 일을 할 수 있기 때문임
기업은 항상 한계비용을 낮추려 함. 미국에서 소프트웨어 아키텍트 1명을 고용해 명세를 쓰게 하고, 인도 개발자 10명을 고용해 에이전트 100개를 돌보게 할 것임
경험상 효과적인 결과를 얻으려면 매우 상세한 설계 문서와 작업 명세를 써야 함. 보통 효과적인 프롬프트만큼 자세해야 함
그 정도로 상세한 명세를 이미 썼다면, 왜 아웃소싱 개발자와 최첨단 모델이 필요한가?
강한 제품/프로젝트 리더가 매우 꼼꼼하게 감독하는 회사들은 새로운 세대의 개발자를 만들 수 있겠지만, 어떤 회사들은 영업 문구를 믿고 소프트웨어가 유지보수 불가능해지면서 실패할 것임
10년 뒤에도 개발자 수는 지금과 비슷하고, 더 많은 제품을 만들고 있을 것이라 봄. AI는 의미 있는 고립된 영역의 자동화에 쓰이겠지만, 대부분의 소프트웨어 개발은 같은 개념을 더 적은 텍스트 쓰레기로 표현하는 더 높은 추상화 수준에서 이뤄질 것임
코드의 핵심은 이상한 경계 사례의 복잡함을 구체적으로 인코딩하고 드러내는 데 더 집중될 것임
소프트웨어 개발을 처음 시작했을 때, 여러 사람 손을 거쳐 내려온 아주 지저분한 MUD를 작업했음. AI가 엄격한 감독과 수정 없이 만든 진흙덩어리와 스파게티 코드를 누가 기꺼이 파헤치려 할지 상상하기 어려움
소프트웨어 개발의 핵심은 늘 문제 해결, 더 정확히는 문제 식별이었음. 시간이 지나며 우리는 그 지점에 집중하기 위해 잡다한 것들을 점점 제거해 왔음. 이 흐름은 계속될 것이고, 문제를 명시하는 더 간결하고 추상적인 언어로 진화하며, 까다로운 논리 흐름, 드라이버 부분, 수학은 라이브러리와 도구로 더 많이 격리될 것 같음
엔지니어들이 협조적이어도, 관리자나 사업주는 긴밀한 협업을 꺼리고 거리를 둔 작업 방식을 강제함. 예를 들면 주 1회 통화 같은 식임
직접 겪어 봤음. 한 번은 아웃소싱 개발팀에 £300k를 썼는데, 다행히 내 돈은 아니었고, 끝에 아무것도 납품받지 못함. 대부분의 시간은 단순히 작업 방향을 맞추는 데 쓰였음
나와 파트너는 원하는 게 뭔지 어느 정도 알고 있었고 동기화를 더 자주 해서 노력을 맞추려 했지만, 그쪽 관리자들이 계속 막았음. 이게 컨설팅 사업 모델임
원격 정규직은 인센티브가 반대임. 말 그대로 풀타임 직원이고, 소통을 방해하는 관리 계층이 없으며, 게으르거나 사기꾼이 아니라면 흥미로운 문제를 풀고 싶지 지루하게 있고 싶지는 않을 것임
원문의 가정이 빗나간 지점도 거기라고 봄. DeepSeek와 최첨단 모델의 차이는 보통 저품질 아웃소싱으로 메울 수 있는 범위가 아님. 결국 매우 숙련된 아웃소싱 엔지니어에게 돈을 내게 되고, 그들은 크게 싸지 않을 수 있음. 애초에 아웃소싱은 비용뿐 아니라 역량과 수용력 때문에도 이뤄짐
모든 것을 적절한 세부 수준까지 명세해야 하고, 그 시점이면 LLM도 꽤 잘 해낼 가능성이 큼. 게다가 많은 아웃소싱 팀은 내부 팀과 전혀 다른 방식으로 만들며, 납품 수준과 속도의 차이가 절대적임
모든 것이 이렇게 빠르게 변하는데, 왜 남의 직원을 최신 흐름에 맞게 훈련시키는 데 내 시간과 돈을 써야 하는지도 의문임
제조업에 적용하면, 로봇 우선 전략은 단순히 제조업을 국내로 되돌리는 데 그치면 안 되고 더 높게 잡아야 함. 새로운 아웃소싱 제조 목적지가 되는 것임
그래서 중소기업은 내부 엔지니어, 재무, 마케팅 인력을 지금만큼 많이 둘 필요가 없어질 수 있음
이는 증류 위협과 최첨단 성능을 밀어붙이는 데 필요한 독점 실행 환경 개발 노력이 결합되어 필연적임
OAI/Anthropic은 100% 모두의 일자리를 빼앗고 “노동”을 소유하려 할 것임. 여기서는 중국 쪽이 선역임
그런데 그들이 깨닫지 못한 건, 정의하는 일이 해법 자체보다 더 어렵다는 점임
하지만 Claude Code와 Anthropic 모델, 또는 Codex와 GPT 5.5를 Qwen, GLM, Gemma와 같은 실행 환경에서 비교하면, 최첨단 모델이 압도적으로 앞섬. 이제는 비최첨단 모델의 의미를 모르겠음. 아끼는 시간보다 낭비하는 시간이 더 큼
좁은 범위의 코딩, 예를 들어 특정 함수 작성은 느리지만 가능함. 다만 고급 소비자용 하드웨어에서 일반 LLM 채팅 용도로 쓰는 것은 비용을 제외하면 경쟁력 있음
https://www.williamangel.net/blog/2026/05/17/offline-llm-ene...
추론 비용이 내려가면, 지난 몇 년간 그래 왔듯이, 올해 말에는 오늘의 최첨단 모델을 노트북에서 돌릴 수 있게 될 것임
소프트웨어 엔지니어로서 사실상 다 쓰기 어려울 만큼 충분하고, 효율 향상을 생각하면 아주 싼 편임
게다가 Claude/Codex가 이미 잘하고 매달 나아지고 있는데, 누가 실행 환경을 만지작거리거나 에이전트 오케스트레이션을 정의하고 싶겠음
개발자가 약할수록 더 높은 능력의 AI가 필요함. 이 글의 전제는 약한 개발자와 약한 AI가, 강한 개발자와 거의 자율적인 AI보다 낫다고 혼동하기 때문에 성립하지 않음
최첨단 AI를 쓰는 약한 개발자가 만드는 제품은 이미, 약한 2년 전 AI를 곁들인 유능한 개발자보다 못함
더 분명히 말하면, 강한 개발자는 2년 전에도 AI를 활용해 고품질 제품을 만들 수 있었음. 최신 AI를 써도 약한 개발자는 여전히 고전하지만, 강한 개발자는 더 강한 AI에 더 많은 일을 위임해 생산성을 더 끌어올릴 수 있음
감독 없는 계약자나 과잉 채용된 신입들이 있는 악몽 같은 조직은 요즘 같은 시기에는 훨씬 더 치명적일 것임
특히 지정학적 위험 때문에 추론 하드웨어가 강하게 제한되는 상황에서는, 최첨단 모델이 제공하는 수준에 맞먹는 로컬 AI를 쓰는 건 아직 너무 비싸고 비효율적임
로컬 LLM이 장기적으로 이 최첨단 회사들을 위협할 수 있다는 주장도 매우 의심스러움
토큰이 비싸지는 이유는 그들이 시장을 장악하기 시작했고, 그 우위를 이용해 국경 안팎의 하드웨어 유통을 제한할 것이기 때문임
일부 워크플로에는 로컬 LLM이 더 많이 쓰일 가능성이 크지만, 최첨단 모델 수준이 필요한 작업은 아니며, 최첨단 모델의 더 가볍고 작은 버전이 롱테일을 잡기 위해 제시하는 가격도 이기기 어려울 것임
내 인상으로는 DeepSeek가 v4를 특히 저렴한 추론을 위해 설계했고, 가격이 75% 낮아도 손해를 보지 않는 것 같음
높은 품질의 작업과 자기 일에 대한 자부심을 중시한다면, 아웃소싱 인력은 해법이 아님. 대체로 자기 일에 세심한 주의를 기울이지 않기 때문에 비용이 낮은 것임
반대로 그냥 어떻게든 끝내기만 하고 제대로 됐는지는 신경 쓰지 않는다면, 가능한 한 적은 돈을 쓰는 것보다 나은 방법도 없을 것임

20 hours ago
2









English (US) ·