1. 1회차 · 프롬프트 엔지니어링 철학 (Zoom LIVE)

코스: [LIVE] 실무 프롬프트 설계 심화 워크샵 차시: 1 / 4 (Zoom 라이브) 슬러그: live-prompt-design 일시: 매주 수요일 20:00~22:00 KST

학습 목표

LLM의 작동 원리(Next-token prediction)를 이해하고 좋은 프롬프트가 왜 중요한지 논리적으로 설명한다
좋은 프롬프트의 5원칙(명확성·맥락·구조·예시·제약)을 자기 업무 프롬프트에 체크리스트로 적용한다
실무에서 흔한 "프롬프트가 들쭉날쭉한 현상"의 원인을 3가지(모델 확률성·맥락 부족·제약 부재)로 분류해 진단한다
90분 이론 + 40분 실습 + 20분 Q&A 구조를 통해 자기 프롬프트 2개를 실시간 리팩토링 경험으로 체화한다

세션 구조 (2시간)

20:00~21:00 이론 세션 (60분) — LLM 원리 → 5원칙 → 나쁜/좋은 프롬프트 비교 → 템플릿 3종
21:00~21:40 실습 (40분) — 자기 업무 프롬프트 2개를 5원칙에 맞춰 리팩토링, 강사 1:1 피드백
21:40~22:00 Q&A 라이브 (20분) — 자유 질문 + 2회차 예고

도입

한국 대기업 AI 도입 첫 해 흔한 현상. "ChatGPT Plus 법인 계정 1,000개 풀었는데 아무도 제대로 못 쓴다." 이유는 단 하나, 질문을 잘 못 던져서입니다. 프롬프트 엔지니어링은 신비한 기술이 아니라 언어의 논리를 다루는 훈련입니다. 개발을 몰라도, 통계를 몰라도 배울 수 있습니다. 단, 직접 실습을 거치지 않으면 체화되지 않습니다.

이 1회차는 프롬프트 엔지니어링의 철학적 뼈대를 세우는 시간입니다. LLM이 실제로 어떻게 작동하는지 알면 "왜 A는 되고 B는 안 되는가"가 직관적으로 이해됩니다. 그 이해 위에 5원칙을 얹으면, 이후 3회차 동안 배울 모든 고급 기법이 자연스럽게 받아들여집니다.

2시간 라이브 후 여러분은 "자기 업무 프롬프트 2개를 5원칙으로 리팩토링한 버전"을 가지고 나가게 됩니다. 1주일간 이 프롬프트를 실제 업무에 쓰면서 차이를 체감하시면 됩니다.

핵심 개념

LLM의 작동 원리 — Next Token Prediction

LLM은 거대한 다음 토큰 예측기입니다. "한국의 수도는" 뒤에 "서울"이 올 확률이 가장 높다고 학습했습니다. 단순한 원리지만 수조 개의 텍스트로 학습되면 놀라운 일반화가 생깁니다.

중요한 건:

LLM은 "정답을 외운 것"이 아니라 확률적으로 그럴듯한 텍스트를 생성
같은 프롬프트도 매번 다른 결과 (temperature 0 제외)
학습 데이터에 없거나 모호하면 할루시네이션 발생

이 사실이 할루시네이션·일관성 문제의 근본 원인입니다. 그래서 프롬프트는 "AI에게 생각의 방향을 강하게 제시"해 확률 분포를 좁혀주는 역할을 합니다.

좋은 프롬프트의 5원칙

1. 명확성 (Clarity) 지시가 한 가지로만 해석되게. "좀 잘 해줘"는 모호. "3문단, 각 100자 이내, 이모지 없이"는 명확.

2. 맥락 (Context) 왜·누가·어떤 상황에서인지 충분히. "이메일 써줘"보다 "신규 제품 런칭 D-7 기존 유료 고객에 재구매 유도 이메일".

3. 구조 (Structure) 구분선·번호·XML 태그 등 시각적 조직화. [역할], [과제], [제약], [출력 형식].

4. 예시 (Examples) Few-shot은 사실상 최강의 조정 수단. 좋은 예시 2-3개가 복잡한 설명 10줄보다 효과적.

5. 제약 (Constraints) 출력 형식·길이·금지 사항 명시. "JSON으로", "200자 이내", "이모지 금지", "근거 없는 통계 금지".

프롬프트가 들쭉날쭉한 3가지 원인

원인 1: 모델 확률성 같은 프롬프트도 temperature > 0이면 매번 다름. 해결: temperature 0 또는 seed 고정.

원인 2: 맥락 부족 구체적 상황·제약 없으면 LLM이 평균값 출력. 해결: 5원칙 전면 적용.

원인 3: 제약 부재 출력 형식·길이 미지정 → 매번 다른 구조. 해결: JSON Schema 또는 명시적 포맷.

모델 선택 실무 가이드

모델	강점	약점	추천 용도
GPT-4o	빠름·일상 작업 우수	복잡 reasoning 조금 약함	분류·추출·요약
GPT-4o-mini	매우 저렴·빠름	품질 차이 존재	대량 배치
Claude Sonnet 4.5	한국어·분석·윤리 우수	속도 보통	분석·긴 문서
Claude Opus 4	최상급 reasoning	느림·비쌈	고난도 창작
Gemini 2.0 Pro	멀티모달 우수	한국어 조금 약함	이미지 포함 작업

기본 실습은 GPT-4o, 심화는 Claude Sonnet 4.5 권장.

상세 설명

나쁜 프롬프트 예시

블로그 글 좀 써줘.

문제:

주제 없음
길이 기준 없음
스타일·톤 정보 없음
독자 미정의
출력 형식 미정
페르소나 부재

결과: 모델이 "가장 일반적인 블로그 글"을 생성. 어디에도 쓸 수 없음.

좋은 프롬프트 예시 (5원칙 적용)

당신은 10년 경력의 B2B SaaS 콘텐츠 전략가입니다.  [역할]

[주제]
스타트업 CTO를 위한 AI 코드 리뷰 도구 도입 가이드  [명확성]

[독자]
- 5~50명 규모 스타트업의 기술 리더
- 이미 GitHub Copilot은 사용 중
- 경쟁 도구(Cursor·CodiumAI 등) 비교를 원함  [맥락]

[요구사항]
1. 서론은 실무 Pain Point 1개로 시작 (예: PR 리뷰 지연)
2. 본문은 H2 소제목 4개로 구조화
3. 각 소제목마다 실제 도구 이름 최소 1개 언급
4. 결론은 의사결정 체크리스트 5줄  [구조]

[예시 톤]
"사람 리뷰어가 부족한 현실에서, AI 코드 리뷰어는 대체가 아니라 보완이다."  [예시]

[제약]
- 2,000자 내외
- 수식어 남발 금지 (예: "혁신적인·획기적인")
- 근거 없는 통계 인용 금지
- 결론 전에 요약 반복 금지 [제약]

이 프롬프트는 동일 모델이라도 훨씬 예측 가능한 결과를 냅니다. 5원칙 모든 요소가 포함되어 있습니다.

실무 프롬프트 3종 템플릿

템플릿 1. 문서 요약

역할: 당신은 {도메인} 분야의 시니어 애널리스트입니다.

과제: 다음 문서를 {목적 대상}이 3분 안에 읽을 수 있도록 요약하세요.

문서:
{document_text}

요약 형식:
1. 핵심 결론 (1줄)
2. 주요 근거 (bullet 3개)
3. 실무 액션 (bullet 2개)

제약:
- 전문 용어는 괄호로 풀어쓰기
- 추측·과장 금지
- 원문에 없는 통계 추가 금지

템플릿 2. 이메일 초안

역할: 당신은 {회사명}의 {직무} 담당자입니다. 경어체로 간결하게 씁니다.

상황: {상황_설명}

수신자: {수신자_정보}

이메일 작성 요구:
- 제목 1줄
- 본문 200자 이내
- 액션 아이템 명시 (무엇을·언제까지)
- 호의적이지만 부드러운 압박 포함

톤 예시: "확인 부탁드리며, 금주 목요일 오후 6시까지 답변 주시면 감사하겠습니다."

템플릿 3. 데이터 분석 질의

역할: 당신은 데이터 분석 컨설턴트입니다.

데이터:
{csv_or_table}

분석 요청:
1. 데이터에서 발견되는 패턴 3가지
2. 가능한 원인 가설 3가지
3. 추가로 수집해야 할 데이터 2가지

출력 형식:
- 각 섹션을 H2 헤딩으로
- 각 가설은 "~때문일 수 있다" 형태로 확신도 함께
- 추측과 팩트를 명확히 구분 ([FACT] / [HYPOTHESIS] 태그)

JSON 구조화 응답 (실무 필수)

API 호출·자동화 파이프라인과 연결할 때 필수:

[지시]
다음 CS 문의를 분류하여 JSON으로 반환.

[입력]
제목: {email_subject}
본문: {email_body}

[출력 스키마]
{
  "category": "refund|shipping|general|spam",
  "urgency": 1-5 정수,
  "sentiment": "positive|neutral|negative",
  "keywords": [string 3개],
  "summary": "한 줄 요약"
}

[제약]
- 반드시 유효한 JSON
- 추가 설명 없이 JSON만
- 모든 필드 필수

OpenAI API의 response_format: {"type": "json_object"} 설정과 함께 사용하면 100% JSON 보장.

이론 세션 흐름 (60분)

20:00-20:15 (15분) — 도입·원리

한국 AI 도입 현황
LLM 작동 원리 직관 (Next token)
확률성 · 할루시네이션 현실

20:15-20:40 (25분) — 5원칙 상세

각 원칙 예시 3개씩
나쁜 프롬프트 → 좋은 프롬프트 리팩토링 라이브 시연

20:40-21:00 (20분) — 모델 선택·템플릿

주요 LLM 비교 매트릭스
실무 템플릿 3종 설명
한국어 vs 영어 · 하이브리드 전략

실습 세션 흐름 (40분)

21:00-21:10 (10분) — 실습 준비

자기 업무에서 반복하는 프롬프트 2개 준비
ChatGPT/Claude 창 열기

21:10-21:30 (20분) — 리팩토링 실습

5원칙 체크리스트로 Before/After 작성
강사가 3-5명 스크린 공유해 라이브 피드백

21:30-21:40 (10분) — 결과 비교

Before/After 각각 5회 호출해 결과 일관성 비교
참가자 중 2-3명 발표

Q&A 예상 질문 5가지

Q1. 프롬프트 길이는 짧을수록 좋나요? 아니다. 명확성이 우선. 500자 정도가 실무 적합. 단, 5000자 이상은 모델 혼란 가능.

Q2. 한국어 vs 영어? GPT-4o, Claude는 한국어도 거의 동등. 편한 언어로 쓰되 핵심 지시어("반드시", "절대 금지" 등)는 영어 혼용이 안정적.

Q3. 좋은 프롬프트인지 어떻게 검증? 같은 프롬프트에 10번 호출 → 결과 일관성 확인. 3회차에서 정량 평가 방법 상세.

Q4. temperature는 얼마가 좋은가요? 분류·추출: 0.1~~0.3. 요약: 0.3~~0.5. 창작: 0.8~1.2. 기본 0.7은 어정쩡. 작업별 세팅 권장.

Q5. 프롬프트에 내 회사 정보 넣어도 안전한가? OpenAI/Anthropic 기본 정책: API는 학습에 사용 X (기본). ChatGPT 앱은 학습에 사용 O (설정에서 off 가능). 기업용은 반드시 API 또는 Enterprise Plan.

2회차까지 1주일 과제

리팩토링한 프롬프트 2개를 실제 업무에 5회 이상 사용
각 프롬프트를 10회 호출해 일관성 평가 (결과 비슷한가?)
발견한 개선점·의문점을 메모 → 2회차 Q&A에서 공유
2회차 준비: 자기 업무에서 "역할 분리"가 필요한 복잡한 작업 1개 선정

흔한 초보자 실수 5가지

"길게 쓰면 좋을 것" → 맥락은 풍부하되 중복은 제거
"이것저것 동시에 요청" → 한 번에 1-2가지 과제만
"예시 없이 완벽한 결과 기대" → Few-shot 예시 2-3개 추가
"출력 형식 미지정" → JSON, Markdown, Bullet 중 명시
"프롬프트를 저장·재사용하지 않음" → 버전 관리한 프롬프트 라이브러리 구축

한국 실무 적용 사례

토스 유사 — 고객 응대 분류 프롬프트 개선 "CS 이메일 분류해줘" → 5원칙 적용 후 정확도 73% → 91%.

쿠팡 유사 — 상품 설명 자동 생성 "상품 설명 써줘" → 페르소나 + 구조 + 예시 추가 후 편집 시간 70% 감소.

배민 유사 — 파트너 공지 메시지 자동 생성 톤·제약 명시 없던 기존 프롬프트 → Voice Code 주입 → 재작성 요청 빈도 80% 감소.

당근 유사 — 신고 사유 분류 단순 분류 프롬프트 → 우선순위·증거·키워드 JSON 응답 → 모더레이터 업무 50% 경감.

스타트업 유사 — 투자자 리포트 작성 "이번달 리포트 써줘" → 구조·데이터·근거 명시 → 임원 최종 수정 30분 → 5분.

실습 체크리스트

정리

좋은 프롬프트는 "LLM에게 맡길 일을 사람에게 설명하듯 쓰는 것"입니다. 5원칙(명확성·맥락·구조·예시·제약)을 기계적으로 체크하는 습관만 들여도 결과물 품질이 한 단계 올라갑니다. 이 1회차에서는 철학적 기반을, 2회차에서는 그 위에 구조화와 역할 분리라는 고급 설계를 얹습니다. 다음 주 수요일 20시에 다시 만납시다.