Andrej Karpathy의 최근 몇 주간 Claude 코딩 경험에 대한 단상

1 week ago 7

코딩 워크플로우의 변화

  • 2024년 11월에는 80% 수동+자동완성, 20% 에이전트 코딩이었으나, 12월에는 이 비율이 역전되어 80% 에이전트 코딩, 20% 수정/터치업으로 전환
  • 실질적으로 영어로 프로그래밍하는 상황이 되었으며, LLM에게 어떤 코드를 작성할지 말로 지시하는 형태
  • 자존심이 상하는 부분이 있지만, 대규모 "코드 액션" 단위로 소프트웨어를 다루는 힘이 너무나 유용
  • 이에 적응하고, 설정하고, 사용법을 배우고, 가능/불가능한 것을 파악하면 더욱 효과적임
  • 20년간의 프로그래밍 경력에서 가장 큰 기본 코딩 워크플로우 변화이며, 불과 몇 주 만에 발생함
  • 상당수(두 자릿수 퍼센트)의 엔지니어들에게 비슷한 일이 일어나고 있을 것으로 예상되나, 일반 대중의 인식은 한 자릿수 초반 퍼센트 수준으로 추정

IDE/에이전트 스웜/오류 가능성

  • "더 이상 IDE 필요 없다" 또는 "에이전트 스웜" 관련 과대광고는 현재로서는 과장이라고 생각함
  • 모델은 여전히 실수를 하며, 실제로 중요한 코드가 있다면 매의 눈으로 감시해야 하고, 옆에 큰 IDE를 띄워두는 것이 필요
  • 실수의 성격이 변화함: 더 이상 단순 문법 오류가 아니라, 약간 부주의하고 성급한 주니어 개발자가 저지를 법한 미묘한 개념적 오류
  • 가장 흔한 오류 유형: 사용자 대신 잘못된 가정을 세우고 확인 없이 그대로 진행
  • 추가적인 문제점:
    • 혼란을 관리하지 못함
    • 명확화 요청을 하지 않음
    • 불일치를 드러내지 않음
    • 트레이드오프를 제시하지 않음
    • 반박해야 할 때 반박하지 않음
    • 여전히 다소 아첨하는(sycophantic) 경향이 있음
  • 플랜 모드에서는 나아지지만, 경량의 인라인 플랜 모드가 필요함
  • 코드와 API를 과도하게 복잡화하는 경향도 있고, 추상화를 비대하게 만들고, 작업 후 죽은 코드를 정리하지 않음
  • 1000줄에 걸쳐 비효율적이고 비대하며 취약한 구조를 구현하는 경우가 있으며, "이렇게 하면 안 되나요?"라고 물으면 "물론이죠!"라며 즉시 100줄로 줄임
  • 작업과 무관하더라도 마음에 들지 않거나 충분히 이해하지 못한 주석과 코드를 변경/삭제하는 경우가 여전히 있음
  • CLAUDE.md에 지침을 넣어 간단히 수정 시도를 해도 이런 문제들이 발생
  • 이런 문제에도 불구하고 여전히 순수하게 거대한 개선이며, 수동 코딩으로 돌아가기는 매우 어려움
  • 현재 워크플로우: 왼쪽에 ghostty 윈도우/탭에서 소수의 Claude Code 세션, 오른쪽에 IDE로 코드 확인 및 수동 편집

끈기(Tenacity)

  • 에이전트가 쉬지 않고 무언가에 매달리는 것을 보는 것은 매우 흥미로움
  • 지치지 않고, 의기소침해지지 않으며, 인간이라면 다음을 기약하며 오래전에 포기했을 상황에서도 계속 시도함
  • 무언가와 오랫동안 씨름하다가 30분 후 결국 성공하는 것을 지켜보면 "AGI를 느끼는" 순간 같음
  • 스태미나가 작업의 핵심 병목이라는 것을 깨닫게 되며, LLM을 손에 들면 이것이 극적으로 증가됨

속도 향상

  • LLM이 보조하는 것의 "속도 향상"을 어떻게 측정할지 불분명함
  • 하려던 일이 확실히 훨씬 빨라진 느낌이지만, 주요 효과는 하려던 것보다 훨씬 더 많은 것을 하게 됨:
    • 이전에는 코딩할 가치가 없었을 온갖 것들을 코딩 가능
    • 지식/스킬 문제로 이전에는 작업할 수 없었던 코드에 접근 가능
  • 속도 향상이지만, 더 많은 부분은 확장(expansion) 일 가능성이 있음

레버리지

  • LLM은 특정 목표를 충족할 때까지 루프를 돌리는 데 탁월하며, 이것이 "AGI를 느끼는" 마법의 대부분
  • 무엇을 할지 지시하지 말고, 성공 기준을 주고 지켜볼 것
  • 테스트를 먼저 작성하게 하고 그것을 통과하게 할 것
  • 브라우저 MCP와 루프에 넣을 것
  • 정확성이 매우 높을 것 같은 나이브 알고리듬을 먼저 작성하고, 정확성을 유지하면서 최적화 요청
  • 명령형에서 선언형으로 접근 방식을 바꾸면 에이전트가 더 오래 루프를 돌며 레버리지를 확보함

재미

  • 예상하지 못한 부분은 에이전트와 함께하면 프로그래밍이 더 재미있어 진다는 것
  • 빈칸 채우기 식의 지루한 작업이 제거되고 창의적인 부분만 남음
  • 막힘/정체(재미없는 상태)가 줄어들고, 더 많은 용기를 경험하게 됨 — 항상 함께 긍정적 진전을 이룰 방법이 있기 때문
  • 반대 감정을 가진 사람들도 있음: LLM 코딩은 코딩 자체를 좋아하는 엔지니어만드는 것을 좋아하는 엔지니어로 나누게 됨

퇴화(Atrophy)

  • 수동으로 코드를 작성하는 능력이 서서히 퇴화하기 시작했다는 걸 알게 됨
  • 생성(코드 작성)판별(코드 읽기) 은 뇌에서 다른 능력
  • 프로그래밍에 관련된 작은 문법적 세부 사항들로 인해, 작성에 어려움을 겪더라도 코드 리뷰는 문제없이 가능

슬로파칼립스(Slopacolypse)

  • 2026년은 GitHub, Substack, arXiv, X/Instagram 및 일반적으로 모든 디지털 미디어에 걸쳐 슬로파칼립스(저품질 AI 생성 콘텐츠 범람)의 해가 될 것으로 예상
  • 실제 진정한 개선 외에도 훨씬 더 많은 AI 과대광고 생산성 극장이 나타날 것(그게 가능하기나 한가?)

질문들

  • "10X 엔지니어"에게 무슨 일이 일어나고 있을까? — 평균과 최고 엔지니어 간의 생산성 비율? 이 비율이 크게 증가할 가능성 있음
  • LLM으로 무장하면, 제너럴리스트가 스페셜리스트를 점점 더 능가하게 될까? LLM은 빈칸 채우기(마이크로)에서 대전략(매크로)보다 훨씬 뛰어남
  • 미래의 LLM 코딩은 어떤 느낌일까? 스타크래프트를 하는 것 같을까? 아님 팩토리오를 하거나, 음악을 연주하는 것 같을까?
  • 사회의 얼마나 많은 부분이 디지털 지식 노동에 의해 병목처럼 막혀있을까?

TLDR

  • Claude와 Codex 등 LLM 에이전트 역량이 2025년 12월경 어떤 종류의 일관성 임계점을 넘어 소프트웨어 엔지니어링 및 관련 분야에 위상 변화(phase shift) 를 발생 시킴
  • 지능 부분이 갑자기 나머지 모든 것 — 통합(도구, 지식), 새로운 조직 워크플로우의 필요성, 프로세스, 더 일반적인 확산 — 보다 상당히 앞서 있는 느낌
  • 2026년은 업계가 새로운 역량을 소화하는 고 에너지의 해가 될 것

Read Entire Article