FLAMEHAVEN FileSearch는 현재 ⭐ Star 81 / 🍴 Fork 11로, 소규모이지만 릴리즈마다 명확한 개선을 지속해온 프로젝트입니다. 이번 v1.3.1 릴리즈는 단순한 기능 추가가 아니라, 🔍 프로젝트 한 줄 요약 Self-hosted RAG 검색 엔진 문서(PDF/DOCX/MD/TXT)를 업로드하면 키워드 + 시맨틱 + 하이브리드 검색 외부 벡터 DB 없이 로컬에서 동작 Docker 한 줄로 3분 내 실행 가능 ✨ v1.3.1 핵심 업데이트 (개발자가 좋아할 포인트) sentence-transformers / torch 완전 제거 자체 구현한 DSP v2.0 (Deterministic Semantic Projection) 도입 ✔️ 벡터 생성 < 1ms ✔️ 초기화 지연 없음 (기존 2분 → 즉시) 시맨틱 검색이지만, ML 프레임워크 없이 결정론적으로 동작 2️⃣ 메모리 & 성능 최적화 int8 벡터 양자화 코사인 유사도 계산 30% 이상 속도 개선 메타데이터 90% 이상 압축 (Gravitas-Pack) 개인 서버 / 사내 VM에서도 부담 없이 운영 가능 3️⃣ 검색 모드 확장 keyword / semantic / hybrid 검색 모드 지원 typo correction + query refinement 포함 기존 API와 완전 backward-compatible 4️⃣ 안정성 & 신뢰성 테스트 프레임워크를 pytest → unittest로 전환 19/19 테스트 통과 (0.33s) 타임아웃, CI 불안정성 제거 🔐 여전히 유지되는 프로덕션 기능들 API Key 기반 인증 & 권한 관리 Rate limiting / Audit log Batch search (1~100 queries) Optional Redis 캐시 Prometheus 메트릭 👀 이런 분들께 특히 적합합니다 사내 문서 검색용 로컬 RAG가 필요한 팀 외부 SaaS(Pinecone 등)에 데이터 올리기 어려운 환경 “PoC는 됐는데, 운영은 어떻게 하지?” 단계에 있는 개발자 재현 가능성 / 비용 / 통제권을 중시하는 엔지니어 🔗 GitHub 👉 https://github.com/flamehaven01/Flamehaven-Filesearch ---사용해보시고 도움이 되었다면 ⭐ 한 번 눌러주셔도 큰 힘이 됩니다.
👉 *“문서 검색용 RAG를 가볍고, 재현 가능하며, 완전히 self-hosted로 만들 수 없을까?”*라는 질문에서 시작한 오픈소스 프로젝트입니다.
👉 “시맨틱 검색 = 무거운 ML 스택”이라는 전제를 깨는 업데이트입니다.
1️⃣ ML 의존성 완전 제거 (가장 큰 변화)
→ 메모리 사용량 75% 감소
의견·피드백·PR 모두 환영합니다.

1 month ago
15










English (US) ·