인류의 모든 요리를 2메가바이트로 압축하기

4 hours ago 2
  • Epicure는 4.14M개 레시피와 FlavorDB 화합물 데이터로 1,790개 표준 재료의 300차원 임베딩을 학습한 모델임
  • 기존 FlavorGraph의 영어 중심 말뭉치, 고정된 화학·레시피 혼합, 산재된 재료 어휘 문제를 줄이도록 설계됨
  • Cooc, Chem, Core는 같은 구조에서 랜덤워크 스키마만 바꿔 레시피 공동출현과 화학 신호의 비중을 비교함
  • 세 임베딩은 27개 감각·영양 방향과 8개 요리 거대 지역을 선형적으로 복구하고, 비지도 방식으로 20개 요인을 얻음
  • 최근접 이웃과 SLERP 방향 산술로 rice를 South-Asian 방향으로 회전시키는 식의 재료 탐색이 가능하지만, 코드와 산출물은 미공개 상태임

Epicure의 목표

  • 재료 임베딩은 재료 간 궁합, 문화권별 유사 재료, 감각·영양 축에서의 위치를 찾기 위한 기반임
    • 된장에는 미림, 다시, 참기름이 어울리고, 올리브오일에는 바질, 토마토, 프로슈토가 어울리는 식의 지식은 여러 문화권 레시피 말뭉치와 요리사의 직관에 축적돼 있음
    • 메뉴·레시피 보조 도구, 보유 재료 기반 추천, 지중해 재료에서 동아시아권 대응 재료로 이동하는 탐색, 지방감·발효·쓴맛·고단백 같은 축 기반 탐색에 활용 가능함
  • 기존 연구는 화학 기반 풍미 네트워크와 레시피·지식그래프 기반 접근으로 이어져 왔음
    • Ahn et al. [2011]은 풍미 네트워크를 도입하고, 공유 화합물에서 문화권별 차이가 나타남을 보임
    • Garg et al. [2017]의 FlavorDB는 936개 식품 엔티티의 향 분자를 목록화했고, FooDB는 70,000개 화합물로 화학적 범위를 확장함
    • FlavorGraph [Park et al., 2021]는 FlavorDB와 Recipe1M+를 결합해 6,653개 재료와 1,645개 화합물의 이질 그래프를 만들고 Metapath2Vec으로 학습한 공개 음식 임베딩임
    • FoodKG [Haussmann et al., 2019]는 레시피, 영양, 온톨로지 데이터를 RDF 지식그래프로 통합해 추천을 목표로 함

FlavorGraph의 한계와 Epicure의 설계

  • 이전 분석에서는 FlavorGraph의 300차원 임베딩에서 맛, 질감, 영양, 지리, 문화, 가공을 포함한 15개 이상 해석 가능한 요리 차원이 확인됐고, LLM 보강 어휘 통합이 대부분의 신호를 강화한 것으로 나타남
  • FlavorGraph의 고정된 사전학습에는 세 가지 제약이 있었음
    • 영어 중심 말뭉치 하나에 의존함
    • 화학 신호와 레시피 문맥 신호가 하나의 고정된 귀납 편향으로 융합돼 있어 설계 축으로 조절하기 어려움
    • 재료 어휘에 준비 방식 세부사항과 비식품 항목이 섞인 산재된 구조가 남아 있음
  • Epicure는 이 제약을 줄이기 위해 처음부터 다시 학습한 세 가지 형제 skip-gram 재료 임베딩으로 구성됨
    • 11개 출처에서 4.14M개 레시피를 모음
    • 언어 범위는 영어, 중국어, 러시아어, 베트남어, 스페인어, 튀르키예어, 인도네시아어, 독일어, Indian-English임
    • 원시 재료 문자열을 LLM 보강 파이프라인으로 1,790개 표준 재료 항목으로 정규화함
    • 세 모델은 아키텍처와 하이퍼파라미터를 공유하고, skip-gram 목적함수가 보는 랜덤워크 스키마만 다름

데이터와 세 가지 임베딩

  • Epicure는 두 종류의 그래프를 출발점으로 삼음
    • 재료-재료 NPMI 그래프는 203,508개 엣지로 구성됨
    • FlavorDB 재료-화합물 그래프는 80,019개 엣지로 구성되며, 15개 범주의 2,247개 타입 지정 화합물 노드를 포함함
  • 세 Metapath2Vec 변형은 화학과 레시피 문맥 사이의 스펙트럼에서 서로 다른 위치를 차지함
    • Cooc

      • 레시피 공동출현 그래프만 걷는 모델임
      • 재료가 실제 레시피에서 함께 나타나는 문맥 신호에 초점을 둠
    • Chem

      • 타입 지정 화합물 메타패스만 걷는 모델임
      • 재료와 화합물 관계에서 오는 화학적 신호에 초점을 둠
    • Core

      • 화합물 기반 경로와 재료-재료 경로를 함께 사용함
      • 제어된 혼합 비율로 재료-재료 walk를 주입해 화학 신호와 레시피 문맥 신호를 섞음
      • 이 구성은 같은 입력 데이터와 학습 구조 안에서 화학-vs-레시피 문맥 비중을 설계 축으로 드러냄
      • 세 형제 모델의 차이는 랜덤워크 스키마에서만 발생하도록 설계됨
      • 임베딩의 성질 차이를 입력 데이터가 아니라 walk 스키마의 효과로 비교할 수 있음

임베딩 공간에서 복구된 요리 의미

  • 세 Epicure 모델은 지도학습 probe에서 연속 감각·영양 방향 27개요리 거대 지역 8개를 선형적으로 복구함
    • 요리권 분리 가능성의 평균 Cohen’s d는 Cooc/Core/Chem 순서로 2.43/2.70/3.07임
    • probe 범위에는 cuisine, food-group, NOVA 가공 등급, USDA 다량영양소, 19개 감각 범주가 포함됨
  • 비지도 분석은 각 모델에서 20개 해석 가능한 요인을 복구함
    • food-group 잔차화된 임베딩 위에서 다중 seed 안정 FastICA를 적용함
    • 각 요인의 상위 사분위 항목을 GMM으로 분할해 모델별 150–200개의 이름 붙은 요리 모드를 얻음
  • GMM 모드의 평균 일관성은 무작위 쌍 기준선보다 높았음
    • Cooc/Core/Chem의 평균 일관성은 0.611/0.833/0.703임
    • 대응되는 무작위 쌍 기준선은 0.097/0.348/0.115임
  • 기존 임베딩 연구 관점도 검증에 사용됨
    • Mikolov et al. [2013]의 word2vec 선형 방향성 관점은 27개 지도 요리 probe, 20개 FastICA 요인, SLERP 회전 연산의 기반이 됨
    • Mu et al. [2017]의 등방성 관점에 따라 participation ratio와 평균 pairwise cosine으로 임베딩 등방성을 직접 측정함
    • 세 형제 모델은 등방성 스펙트럼에서 뚜렷하게 다른 위치에 놓이며, 이는 입력 데이터가 아니라 walk 스키마의 속성으로 다뤄짐
    • Caliskan et al. [2017]의 WEAT는 이름 붙은 의미 축이 기하 구조에 반영되는지 진단하는 보조 검증으로 사용됨

탐색 연산과 활용 가능성

  • Epicure는 같은 300차원 임베딩 공간에서 두 가지 보완적 연산 계열을 제공함
    • 최근접 이웃 기반 짝짓기

      • top-K 이웃 검색으로 재료 주변의 가까운 항목을 찾음
      • 모드 멤버십 조회로 특정 요리 모드에 속하는 항목을 탐색함
    • SLERP 방향 산술

      • seed 재료를 지도학습 pole vector나 emergent factor-mode pole 쪽으로 회전시킴
      • 연속 각도 θ가 seed 지배적 검색과 target 지배적 검색 사이를 보간함
      • 예시로 rice에 South-Asian 방향을 더하면 curry leaf, urad dal, chana dal, fenugreek seed 쪽으로 이동함
      • 지도 의미 방향과 비지도 emergent 모드를 모두 재료 탐색에 사용할 수 있음
      • 셰프 대상 도구가 재료를 회전, 혼합, 검색하면서 감각·영양·문화적으로 일관된 방향을 따라 탐색할 수 있음
      • 화학 기반 관계와 레시피 문맥 기반 관계를 모델 선택과 walk 스키마로 조절할 수 있음
      • 코드와 학습된 산출물은 현재 공개되지 않았음
Read Entire Article