Andrej Karpathy의 최근 몇 주간 Claude 코딩 경험에 대한 단상

1 week ago 7

코딩 워크플로우의 변화

2024년 11월에는 80% 수동+자동완성, 20% 에이전트 코딩이었으나, 12월에는 이 비율이 역전되어 80% 에이전트 코딩, 20% 수정/터치업으로 전환
실질적으로 영어로 프로그래밍하는 상황이 되었으며, LLM에게 어떤 코드를 작성할지 말로 지시하는 형태
자존심이 상하는 부분이 있지만, 대규모 "코드 액션" 단위로 소프트웨어를 다루는 힘이 너무나 유용
이에 적응하고, 설정하고, 사용법을 배우고, 가능/불가능한 것을 파악하면 더욱 효과적임
약 20년간의 프로그래밍 경력에서 가장 큰 기본 코딩 워크플로우 변화이며, 불과 몇 주 만에 발생함
상당수(두 자릿수 퍼센트)의 엔지니어들에게 비슷한 일이 일어나고 있을 것으로 예상되나, 일반 대중의 인식은 한 자릿수 초반 퍼센트 수준으로 추정

IDE/에이전트 스웜/오류 가능성

"더 이상 IDE 필요 없다" 또는 "에이전트 스웜" 관련 과대광고는 현재로서는 과장이라고 생각함
모델은 여전히 실수를 하며, 실제로 중요한 코드가 있다면 매의 눈으로 감시해야 하고, 옆에 큰 IDE를 띄워두는 것이 필요
실수의 성격이 변화함: 더 이상 단순 문법 오류가 아니라, 약간 부주의하고 성급한 주니어 개발자가 저지를 법한 미묘한 개념적 오류
가장 흔한 오류 유형: 사용자 대신 잘못된 가정을 세우고 확인 없이 그대로 진행
추가적인 문제점:
- 혼란을 관리하지 못함
- 명확화 요청을 하지 않음
- 불일치를 드러내지 않음
- 트레이드오프를 제시하지 않음
- 반박해야 할 때 반박하지 않음
- 여전히 다소 아첨하는(sycophantic) 경향이 있음
플랜 모드에서는 나아지지만, 경량의 인라인 플랜 모드가 필요함
코드와 API를 과도하게 복잡화하는 경향도 있고, 추상화를 비대하게 만들고, 작업 후 죽은 코드를 정리하지 않음
1000줄에 걸쳐 비효율적이고 비대하며 취약한 구조를 구현하는 경우가 있으며, "이렇게 하면 안 되나요?"라고 물으면 "물론이죠!"라며 즉시 100줄로 줄임
작업과 무관하더라도 마음에 들지 않거나 충분히 이해하지 못한 주석과 코드를 변경/삭제하는 경우가 여전히 있음
CLAUDE.md에 지침을 넣어 간단히 수정 시도를 해도 이런 문제들이 발생
이런 문제에도 불구하고 여전히 순수하게 거대한 개선이며, 수동 코딩으로 돌아가기는 매우 어려움
현재 워크플로우: 왼쪽에 ghostty 윈도우/탭에서 소수의 Claude Code 세션, 오른쪽에 IDE로 코드 확인 및 수동 편집

끈기(Tenacity)

에이전트가 쉬지 않고 무언가에 매달리는 것을 보는 것은 매우 흥미로움
지치지 않고, 의기소침해지지 않으며, 인간이라면 다음을 기약하며 오래전에 포기했을 상황에서도 계속 시도함
무언가와 오랫동안 씨름하다가 30분 후 결국 성공하는 것을 지켜보면 "AGI를 느끼는" 순간 같음
스태미나가 작업의 핵심 병목이라는 것을 깨닫게 되며, LLM을 손에 들면 이것이 극적으로 증가됨

속도 향상

LLM이 보조하는 것의 "속도 향상"을 어떻게 측정할지 불분명함
하려던 일이 확실히 훨씬 빨라진 느낌이지만, 주요 효과는 하려던 것보다 훨씬 더 많은 것을 하게 됨:
- 이전에는 코딩할 가치가 없었을 온갖 것들을 코딩 가능
- 지식/스킬 문제로 이전에는 작업할 수 없었던 코드에 접근 가능
속도 향상이지만, 더 많은 부분은 확장(expansion) 일 가능성이 있음

레버리지

LLM은 특정 목표를 충족할 때까지 루프를 돌리는 데 탁월하며, 이것이 "AGI를 느끼는" 마법의 대부분
무엇을 할지 지시하지 말고, 성공 기준을 주고 지켜볼 것
테스트를 먼저 작성하게 하고 그것을 통과하게 할 것
브라우저 MCP와 루프에 넣을 것
정확성이 매우 높을 것 같은 나이브 알고리듬을 먼저 작성하고, 정확성을 유지하면서 최적화 요청
명령형에서 선언형으로 접근 방식을 바꾸면 에이전트가 더 오래 루프를 돌며 레버리지를 확보함

재미

예상하지 못한 부분은 에이전트와 함께하면 프로그래밍이 더 재미있어 진다는 것
빈칸 채우기 식의 지루한 작업이 제거되고 창의적인 부분만 남음
막힘/정체(재미없는 상태)가 줄어들고, 더 많은 용기를 경험하게 됨 — 항상 함께 긍정적 진전을 이룰 방법이 있기 때문
반대 감정을 가진 사람들도 있음: LLM 코딩은 코딩 자체를 좋아하는 엔지니어와 만드는 것을 좋아하는 엔지니어로 나누게 됨

퇴화(Atrophy)

수동으로 코드를 작성하는 능력이 서서히 퇴화하기 시작했다는 걸 알게 됨
생성(코드 작성) 과 판별(코드 읽기) 은 뇌에서 다른 능력
프로그래밍에 관련된 작은 문법적 세부 사항들로 인해, 작성에 어려움을 겪더라도 코드 리뷰는 문제없이 가능

슬로파칼립스(Slopacolypse)

2026년은 GitHub, Substack, arXiv, X/Instagram 및 일반적으로 모든 디지털 미디어에 걸쳐 슬로파칼립스(저품질 AI 생성 콘텐츠 범람)의 해가 될 것으로 예상
실제 진정한 개선 외에도 훨씬 더 많은 AI 과대광고 생산성 극장이 나타날 것(그게 가능하기나 한가?)

질문들

"10X 엔지니어"에게 무슨 일이 일어나고 있을까? — 평균과 최고 엔지니어 간의 생산성 비율? 이 비율이 크게 증가할 가능성 있음
LLM으로 무장하면, 제너럴리스트가 스페셜리스트를 점점 더 능가하게 될까? LLM은 빈칸 채우기(마이크로)에서 대전략(매크로)보다 훨씬 뛰어남
미래의 LLM 코딩은 어떤 느낌일까? 스타크래프트를 하는 것 같을까? 아님 팩토리오를 하거나, 음악을 연주하는 것 같을까?
사회의 얼마나 많은 부분이 디지털 지식 노동에 의해 병목처럼 막혀있을까?

TLDR

Claude와 Codex 등 LLM 에이전트 역량이 2025년 12월경 어떤 종류의 일관성 임계점을 넘어 소프트웨어 엔지니어링 및 관련 분야에 위상 변화(phase shift) 를 발생 시킴
지능 부분이 갑자기 나머지 모든 것 — 통합(도구, 지식), 새로운 조직 워크플로우의 필요성, 프로세스, 더 일반적인 확산 — 보다 상당히 앞서 있는 느낌
2026년은 업계가 새로운 역량을 소화하는 고 에너지의 해가 될 것

Read Entire Article