인류의 모든 요리를 2메가바이트로 압축하기

4 hours ago 2

Epicure는 4.14M개 레시피와 FlavorDB 화합물 데이터로 1,790개 표준 재료의 300차원 임베딩을 학습한 모델임
기존 FlavorGraph의 영어 중심 말뭉치, 고정된 화학·레시피 혼합, 산재된 재료 어휘 문제를 줄이도록 설계됨
Cooc, Chem, Core는 같은 구조에서 랜덤워크 스키마만 바꿔 레시피 공동출현과 화학 신호의 비중을 비교함
세 임베딩은 27개 감각·영양 방향과 8개 요리 거대 지역을 선형적으로 복구하고, 비지도 방식으로 20개 요인을 얻음
최근접 이웃과 SLERP 방향 산술로 rice를 South-Asian 방향으로 회전시키는 식의 재료 탐색이 가능하지만, 코드와 산출물은 미공개 상태임

Epicure의 목표

재료 임베딩은 재료 간 궁합, 문화권별 유사 재료, 감각·영양 축에서의 위치를 찾기 위한 기반임
- 된장에는 미림, 다시, 참기름이 어울리고, 올리브오일에는 바질, 토마토, 프로슈토가 어울리는 식의 지식은 여러 문화권 레시피 말뭉치와 요리사의 직관에 축적돼 있음
- 메뉴·레시피 보조 도구, 보유 재료 기반 추천, 지중해 재료에서 동아시아권 대응 재료로 이동하는 탐색, 지방감·발효·쓴맛·고단백 같은 축 기반 탐색에 활용 가능함
기존 연구는 화학 기반 풍미 네트워크와 레시피·지식그래프 기반 접근으로 이어져 왔음
- Ahn et al. [2011]은 풍미 네트워크를 도입하고, 공유 화합물에서 문화권별 차이가 나타남을 보임
- Garg et al. [2017]의 FlavorDB는 936개 식품 엔티티의 향 분자를 목록화했고, FooDB는 70,000개 화합물로 화학적 범위를 확장함
- FlavorGraph [Park et al., 2021]는 FlavorDB와 Recipe1M+를 결합해 6,653개 재료와 1,645개 화합물의 이질 그래프를 만들고 Metapath2Vec으로 학습한 공개 음식 임베딩임
- FoodKG [Haussmann et al., 2019]는 레시피, 영양, 온톨로지 데이터를 RDF 지식그래프로 통합해 추천을 목표로 함

FlavorGraph의 한계와 Epicure의 설계

이전 분석에서는 FlavorGraph의 300차원 임베딩에서 맛, 질감, 영양, 지리, 문화, 가공을 포함한 15개 이상 해석 가능한 요리 차원이 확인됐고, LLM 보강 어휘 통합이 대부분의 신호를 강화한 것으로 나타남
FlavorGraph의 고정된 사전학습에는 세 가지 제약이 있었음
- 영어 중심 말뭉치 하나에 의존함
- 화학 신호와 레시피 문맥 신호가 하나의 고정된 귀납 편향으로 융합돼 있어 설계 축으로 조절하기 어려움
- 재료 어휘에 준비 방식 세부사항과 비식품 항목이 섞인 산재된 구조가 남아 있음
Epicure는 이 제약을 줄이기 위해 처음부터 다시 학습한 세 가지 형제 skip-gram 재료 임베딩으로 구성됨
- 11개 출처에서 4.14M개 레시피를 모음
- 언어 범위는 영어, 중국어, 러시아어, 베트남어, 스페인어, 튀르키예어, 인도네시아어, 독일어, Indian-English임
- 원시 재료 문자열을 LLM 보강 파이프라인으로 1,790개 표준 재료 항목으로 정규화함
- 세 모델은 아키텍처와 하이퍼파라미터를 공유하고, skip-gram 목적함수가 보는 랜덤워크 스키마만 다름

데이터와 세 가지 임베딩

Epicure는 두 종류의 그래프를 출발점으로 삼음
- 재료-재료 NPMI 그래프는 203,508개 엣지로 구성됨
- FlavorDB 재료-화합물 그래프는 80,019개 엣지로 구성되며, 15개 범주의 2,247개 타입 지정 화합물 노드를 포함함
세 Metapath2Vec 변형은 화학과 레시피 문맥 사이의 스펙트럼에서 서로 다른 위치를 차지함
- Cooc
  - 레시피 공동출현 그래프만 걷는 모델임
  - 재료가 실제 레시피에서 함께 나타나는 문맥 신호에 초점을 둠
- Chem
  - 타입 지정 화합물 메타패스만 걷는 모델임
  - 재료와 화합물 관계에서 오는 화학적 신호에 초점을 둠
- Core
  - 화합물 기반 경로와 재료-재료 경로를 함께 사용함
  - 제어된 혼합 비율로 재료-재료 walk를 주입해 화학 신호와 레시피 문맥 신호를 섞음
  - 이 구성은 같은 입력 데이터와 학습 구조 안에서 화학-vs-레시피 문맥 비중을 설계 축으로 드러냄
  - 세 형제 모델의 차이는 랜덤워크 스키마에서만 발생하도록 설계됨
  - 임베딩의 성질 차이를 입력 데이터가 아니라 walk 스키마의 효과로 비교할 수 있음

임베딩 공간에서 복구된 요리 의미

세 Epicure 모델은 지도학습 probe에서 연속 감각·영양 방향 27개와 요리 거대 지역 8개를 선형적으로 복구함
- 요리권 분리 가능성의 평균 Cohen’s d는 Cooc/Core/Chem 순서로 2.43/2.70/3.07임
- probe 범위에는 cuisine, food-group, NOVA 가공 등급, USDA 다량영양소, 19개 감각 범주가 포함됨
비지도 분석은 각 모델에서 20개 해석 가능한 요인을 복구함
- food-group 잔차화된 임베딩 위에서 다중 seed 안정 FastICA를 적용함
- 각 요인의 상위 사분위 항목을 GMM으로 분할해 모델별 150–200개의 이름 붙은 요리 모드를 얻음
GMM 모드의 평균 일관성은 무작위 쌍 기준선보다 높았음
- Cooc/Core/Chem의 평균 일관성은 0.611/0.833/0.703임
- 대응되는 무작위 쌍 기준선은 0.097/0.348/0.115임
기존 임베딩 연구 관점도 검증에 사용됨
- Mikolov et al. [2013]의 word2vec 선형 방향성 관점은 27개 지도 요리 probe, 20개 FastICA 요인, SLERP 회전 연산의 기반이 됨
- Mu et al. [2017]의 등방성 관점에 따라 participation ratio와 평균 pairwise cosine으로 임베딩 등방성을 직접 측정함
- 세 형제 모델은 등방성 스펙트럼에서 뚜렷하게 다른 위치에 놓이며, 이는 입력 데이터가 아니라 walk 스키마의 속성으로 다뤄짐
- Caliskan et al. [2017]의 WEAT는 이름 붙은 의미 축이 기하 구조에 반영되는지 진단하는 보조 검증으로 사용됨

탐색 연산과 활용 가능성

Epicure는 같은 300차원 임베딩 공간에서 두 가지 보완적 연산 계열을 제공함
- 최근접 이웃 기반 짝짓기
  - top-K 이웃 검색으로 재료 주변의 가까운 항목을 찾음
  - 모드 멤버십 조회로 특정 요리 모드에 속하는 항목을 탐색함
- SLERP 방향 산술
  - seed 재료를 지도학습 pole vector나 emergent factor-mode pole 쪽으로 회전시킴
  - 연속 각도 θ가 seed 지배적 검색과 target 지배적 검색 사이를 보간함
  - 예시로 rice에 South-Asian 방향을 더하면 curry leaf, urad dal, chana dal, fenugreek seed 쪽으로 이동함
  - 지도 의미 방향과 비지도 emergent 모드를 모두 재료 탐색에 사용할 수 있음
  - 셰프 대상 도구가 재료를 회전, 혼합, 검색하면서 감각·영양·문화적으로 일관된 방향을 따라 탐색할 수 있음
  - 화학 기반 관계와 레시피 문맥 기반 관계를 모델 선택과 walk 스키마로 조절할 수 있음
  - 코드와 학습된 산출물은 현재 공개되지 않았음