---
title: "달록KB LLM 접근성 — 미해결 과제 / 알려진 제약 (Open Issues)"
category: "status"
document_type: "status"
source_status: "generated"
knowledge_group: "00_current_state"
priority: "High"
purpose: "달록KB의 핵심 의도(외부 LLM도 KB에 접근해 컨텍스트 확보)에서 아직 미해결인 부분·알려진 제약·현재 동작하는 접근 트랙·향후 해결 후보를 기록한 살아있는 트래커. 2026-06-04 잠정 종결 시점 기준."
read_when: ["문서이전·KnowledgeBase","컨텍스트복구","운영규칙·프롬프트작성"]
updated: "2026-06-04"
source_of_truth: "https://dallog-tools.hansbridge.co.kr/"
---

# 달록KB LLM 접근성 — 미해결 과제 / 알려진 제약 (Open Issues)

> 이 문서는 **살아있는 트래커**다. 달록KB의 핵심 설계 의도는 *"외부 LLM도 KB에 접근해 프로젝트 컨텍스트를 확보"* 하는 것이었는데, 그 목표가 **부분적으로만 달성**됐다. 아직 미해결인 부분·제약·향후 해결 후보를 여기 모아 추후 해결할 수 있게 한다. **2026-06-04 잠정 종결** 시점 기록.

## 0. 한 줄 요약

- KB·콘텐츠·배포 인프라는 **정상**이다. 막히는 건 "일부 외부 LLM의 fetch 능력 + Cloudflare AI봇 차단"뿐이다.
- 현재 운영 가능: **Claude.ai(Opus 4.8) · Grok · 로컬 Claude Code = OK.** GPT · Gemini = 제약 있음.
- 남은 달록 작업은 위 3중 소통으로 진행 가능 → 본 이슈는 "완전 달성"을 위한 잔여 과제로 보존.

## 1. 배경 — 왜 KB를 만들었나

- 원래 분업: **Claude.ai = 라이너(기획·지시자), Claude Code = 실행자.**
- Claude.ai 지능 이슈 시기에 **GPT(5.5급)를 보조 라이너**로 썼는데, 정작 **GPT가 노션에 접근 못 함** → 그게 발단이 되어 **노션 탈피 + 달록KB(Source of Truth) 구축**으로 이어졌다.
- 즉 KB의 설계 의도 자체가 "여러 LLM이 공용으로 컨텍스트를 확보"하는 것이다. 이 의도의 완전 달성이 본 트래커의 종착점이다.

## 2. 현재 접근 트랙 (2026-06-04 기준)

| AI | 방법 | 상태 |
|---|---|---|
| 로컬 Claude Code (Opus 4.8) | 레포 파일 직접 Read/Grep | ✅ fetch·차단 무관, 항상 가능 |
| Claude.ai (Opus 4.8) | `llms.txt` URL fetch | ✅ 검증됨 (Opus 4.8 업데이트 후 라이너 복귀) |
| Grok | `llms.txt` URL fetch | ✅ 검증됨 (의외의 성공) |
| ChatGPT (GPT) | URL fetch | ⚠️ 테스트서 "cache miss"/DNS 실패 — 도구측 추정, 재시도 필요 |
| Gemini | URL fetch | ⚠️ "외부 네트워크 제한"으로 실패 |

> 검증 메모: 같은 `llms.txt` URL을 Claude.ai·Grok는 정상 fetch했다. 따라서 GPT/Gemini 실패는 **Cloudflare/KB 문제가 아니라 각 LLM의 fetch 도구 한계**다.

## 3. 미해결 / 알려진 제약

### 3-1. Cloudflare "Block AI bots" (무료 플랜)
- AI 크롤러 UA(ClaudeBot · GPTBot · Claude-User · Claude-SearchBot)를 **엣지에서 403 차단**.
- AI Crawl Control의 크롤러별 토글이 **무료 플랜에서 읽기 전용(잠김)** → 선택적 허용 불가.
- `robots.txt`는 AI 허용을 선언(권고용)했으나, 엣지 403과는 **별개 레이어**라 이것만으로는 안 풀린다.
- 참고: ChatGPT-User 등 '허용' UA는 **verified-bot(출처 IP 검증)** 방식이라, curl로 UA만 사칭하면 사칭봇으로 403 — 즉 curl로는 허용 경로를 검증할 수 없고 실제 LLM으로만 확인 가능.

### 3-2. 일부 LLM의 fetch 능력 한계
- **GPT**: 테스트 시 cache-miss/DNS — Cloudflare가 아니라 ChatGPT 브라우징 도구 측 가능성이 크다(같은 URL을 다른 LLM은 정상 fetch). 재시도/추가 확인 필요.
- **Gemini**: 채팅에서 임의 URL fetch를 잘 안 한다(설계상 제약).

### 3-3. 업로드(llms-full.txt) 방식의 스냅샷 한계
- `llms-full.txt`를 프로젝트/Gem에 업로드하면 fetch 무관하게 KB 전체를 참조할 수 있으나, **업로드 시점의 스냅샷**이라 이후 추가된 문서는 **재업로드 전까지 미반영**된다. 성장하는 KB에 "한 번 업로드로 끝"은 맞지 않는다 → URL(live) 방식이 본선, 업로드는 fetch 불가 AI 전용 대안.

## 4. 향후 해결 후보 (자원·시점 생기면)

1. **Cloudflare "Block AI bots" 해제** 또는 `/knowledge/*` WAF Skip 규칙 — 정공법. 단 무료 플랜은 토글이 잠겨 있어 유료 전환 또는 WAF 규칙 필요.
2. **GPT URL fetch 재시도** — cache-miss가 일시적이면 GPT도 live(URL) 트랙으로 편입 → 스냅샷 문제 없음.
3. **GitHub 공개 레포 raw URL**을 대체 fetch 소스로 (`github.com/ccy-hansbridge/dallog-tools`). CF를 못 가져오는 LLM이 GitHub는 가져올 수 있는 경우 대비.
4. **업로드 트랙 사용 시** KB 갱신마다 `llms-full.txt` 재업로드 규율 (편입 파이프라인이 자동 재생성하므로 "다시 받아 교체"만).
5. **Hansbridge AI Hub 전환** 시 통합 시스템 기준으로 재설계 — [Hansbridge AI Hub 전환 설계서](#/doc/playbook-02) 참조.

## 5. 현재 결론 (잠정 종결)

- 남은 달록 프로젝트 작업은 **Claude.ai(Opus 4.8) 라이너 + Grok 보조 + 로컬 Claude Code 실행**의 3중(로컬 CC 포함) 소통으로 충분히 진행 가능하다.
- 본 이슈는 KB 의도의 **완전 달성**(GPT·Gemini 등 모든 LLM 상시 접근)을 위한 잔여 과제로 보존한다. §4 후보로 추후 해결한다.
- 이 트래커는 미해결 항목이 풀릴 때마다 갱신한다.

## 6. 이미 깔린 접근 인프라 (참고)

- `llms.txt` — URL 색인(절대 URL). fetch 되는 LLM에 URL 하나로 KB 전체 열람.
- `llms-full.txt` — 전체 본문 1파일. fetch 안 되는 LLM에 프로젝트/Gem 업로드용.
- `ai-index.html` — HTML 정적 색인(절대 URL). `sitemap.xml` — 전체 URL.
- `robots.txt` — AI 크롤러 읽기 허용 선언.
- 모두 신규 문서 편입 시 `_gen_ai_index.cjs`로 **자동 재생성**된다.

---

*잠정 종결: 2026-06-04. 본 트래커는 미해결 항목이 풀릴 때 갱신한다. 참고: [달록KB 관리설명서](#/doc/manual-01) · [AI 협업 청사진](#/doc/playbook-01).*
