1. 1회차 · 프롬프트 엔지니어링 철학 (Zoom LIVE)
코스: [LIVE] 실무 프롬프트 설계 심화 워크샵 차시: 1 / 4 (Zoom 라이브) 슬러그: live-prompt-design 일시: 매주 수요일 20:00~22:00 KST
학습 목표
- LLM의 작동 원리(Next-token prediction)를 이해하고 좋은 프롬프트가 왜 중요한지 논리적으로 설명한다
- 좋은 프롬프트의 5원칙(명확성·맥락·구조·예시·제약)을 자기 업무 프롬프트에 체크리스트로 적용한다
- 실무에서 흔한 "프롬프트가 들쭉날쭉한 현상"의 원인을 3가지(모델 확률성·맥락 부족·제약 부재)로 분류해 진단한다
- 90분 이론 + 40분 실습 + 20분 Q&A 구조를 통해 자기 프롬프트 2개를 실시간 리팩토링 경험으로 체화한다
세션 구조 (2시간)
- 20:00~21:00 이론 세션 (60분) — LLM 원리 → 5원칙 → 나쁜/좋은 프롬프트 비교 → 템플릿 3종
- 21:00~21:40 실습 (40분) — 자기 업무 프롬프트 2개를 5원칙에 맞춰 리팩토링, 강사 1:1 피드백
- 21:40~22:00 Q&A 라이브 (20분) — 자유 질문 + 2회차 예고
도입
한국 대기업 AI 도입 첫 해 흔한 현상. "ChatGPT Plus 법인 계정 1,000개 풀었는데 아무도 제대로 못 쓴다." 이유는 단 하나, 질문을 잘 못 던져서입니다. 프롬프트 엔지니어링은 신비한 기술이 아니라 언어의 논리를 다루는 훈련입니다. 개발을 몰라도, 통계를 몰라도 배울 수 있습니다. 단, 직접 실습을 거치지 않으면 체화되지 않습니다.
이 1회차는 프롬프트 엔지니어링의 철학적 뼈대를 세우는 시간입니다. LLM이 실제로 어떻게 작동하는지 알면 "왜 A는 되고 B는 안 되는가"가 직관적으로 이해됩니다. 그 이해 위에 5원칙을 얹으면, 이후 3회차 동안 배울 모든 고급 기법이 자연스럽게 받아들여집니다.
2시간 라이브 후 여러분은 "자기 업무 프롬프트 2개를 5원칙으로 리팩토링한 버전"을 가지고 나가게 됩니다. 1주일간 이 프롬프트를 실제 업무에 쓰면서 차이를 체감하시면 됩니다.
핵심 개념
LLM의 작동 원리 — Next Token Prediction
LLM은 거대한 다음 토큰 예측기입니다. "한국의 수도는" 뒤에 "서울"이 올 확률이 가장 높다고 학습했습니다. 단순한 원리지만 수조 개의 텍스트로 학습되면 놀라운 일반화가 생깁니다.
중요한 건:
- LLM은 "정답을 외운 것"이 아니라 확률적으로 그럴듯한 텍스트를 생성
- 같은 프롬프트도 매번 다른 결과 (temperature 0 제외)
- 학습 데이터에 없거나 모호하면 할루시네이션 발생
이 사실이 할루시네이션·일관성 문제의 근본 원인입니다. 그래서 프롬프트는 "AI에게 생각의 방향을 강하게 제시"해 확률 분포를 좁혀주는 역할을 합니다.
좋은 프롬프트의 5원칙
1. 명확성 (Clarity) 지시가 한 가지로만 해석되게. "좀 잘 해줘"는 모호. "3문단, 각 100자 이내, 이모지 없이"는 명확.
2. 맥락 (Context) 왜·누가·어떤 상황에서인지 충분히. "이메일 써줘"보다 "신규 제품 런칭 D-7 기존 유료 고객에 재구매 유도 이메일".
3. 구조 (Structure)
구분선·번호·XML 태그 등 시각적 조직화. [역할], [과제], [제약], [출력 형식].
4. 예시 (Examples) Few-shot은 사실상 최강의 조정 수단. 좋은 예시 2-3개가 복잡한 설명 10줄보다 효과적.
5. 제약 (Constraints) 출력 형식·길이·금지 사항 명시. "JSON으로", "200자 이내", "이모지 금지", "근거 없는 통계 금지".
프롬프트가 들쭉날쭉한 3가지 원인
원인 1: 모델 확률성 같은 프롬프트도 temperature > 0이면 매번 다름. 해결: temperature 0 또는 seed 고정.
원인 2: 맥락 부족 구체적 상황·제약 없으면 LLM이 평균값 출력. 해결: 5원칙 전면 적용.
원인 3: 제약 부재 출력 형식·길이 미지정 → 매번 다른 구조. 해결: JSON Schema 또는 명시적 포맷.
모델 선택 실무 가이드
| 모델 | 강점 | 약점 | 추천 용도 |
|---|---|---|---|
| GPT-4o | 빠름·일상 작업 우수 | 복잡 reasoning 조금 약함 | 분류·추출·요약 |
| GPT-4o-mini | 매우 저렴·빠름 | 품질 차이 존재 | 대량 배치 |
| Claude Sonnet 4.5 | 한국어·분석·윤리 우수 | 속도 보통 | 분석·긴 문서 |
| Claude Opus 4 | 최상급 reasoning | 느림·비쌈 | 고난도 창작 |
| Gemini 2.0 Pro | 멀티모달 우수 | 한국어 조금 약함 | 이미지 포함 작업 |
기본 실습은 GPT-4o, 심화는 Claude Sonnet 4.5 권장.
상세 설명
나쁜 프롬프트 예시
블로그 글 좀 써줘.
문제:
- 주제 없음
- 길이 기준 없음
- 스타일·톤 정보 없음
- 독자 미정의
- 출력 형식 미정
- 페르소나 부재
결과: 모델이 "가장 일반적인 블로그 글"을 생성. 어디에도 쓸 수 없음.
좋은 프롬프트 예시 (5원칙 적용)
당신은 10년 경력의 B2B SaaS 콘텐츠 전략가입니다. [역할]
[주제]
스타트업 CTO를 위한 AI 코드 리뷰 도구 도입 가이드 [명확성]
[독자]
- 5~50명 규모 스타트업의 기술 리더
- 이미 GitHub Copilot은 사용 중
- 경쟁 도구(Cursor·CodiumAI 등) 비교를 원함 [맥락]
[요구사항]
1. 서론은 실무 Pain Point 1개로 시작 (예: PR 리뷰 지연)
2. 본문은 H2 소제목 4개로 구조화
3. 각 소제목마다 실제 도구 이름 최소 1개 언급
4. 결론은 의사결정 체크리스트 5줄 [구조]
[예시 톤]
"사람 리뷰어가 부족한 현실에서, AI 코드 리뷰어는 대체가 아니라 보완이다." [예시]
[제약]
- 2,000자 내외
- 수식어 남발 금지 (예: "혁신적인·획기적인")
- 근거 없는 통계 인용 금지
- 결론 전에 요약 반복 금지 [제약]
이 프롬프트는 동일 모델이라도 훨씬 예측 가능한 결과를 냅니다. 5원칙 모든 요소가 포함되어 있습니다.
실무 프롬프트 3종 템플릿
템플릿 1. 문서 요약
역할: 당신은 {도메인} 분야의 시니어 애널리스트입니다.
과제: 다음 문서를 {목적 대상}이 3분 안에 읽을 수 있도록 요약하세요.
문서:
{document_text}
요약 형식:
1. 핵심 결론 (1줄)
2. 주요 근거 (bullet 3개)
3. 실무 액션 (bullet 2개)
제약:
- 전문 용어는 괄호로 풀어쓰기
- 추측·과장 금지
- 원문에 없는 통계 추가 금지
템플릿 2. 이메일 초안
역할: 당신은 {회사명}의 {직무} 담당자입니다. 경어체로 간결하게 씁니다.
상황: {상황_설명}
수신자: {수신자_정보}
이메일 작성 요구:
- 제목 1줄
- 본문 200자 이내
- 액션 아이템 명시 (무엇을·언제까지)
- 호의적이지만 부드러운 압박 포함
톤 예시: "확인 부탁드리며, 금주 목요일 오후 6시까지 답변 주시면 감사하겠습니다."
템플릿 3. 데이터 분석 질의
역할: 당신은 데이터 분석 컨설턴트입니다.
데이터:
{csv_or_table}
분석 요청:
1. 데이터에서 발견되는 패턴 3가지
2. 가능한 원인 가설 3가지
3. 추가로 수집해야 할 데이터 2가지
출력 형식:
- 각 섹션을 H2 헤딩으로
- 각 가설은 "~때문일 수 있다" 형태로 확신도 함께
- 추측과 팩트를 명확히 구분 ([FACT] / [HYPOTHESIS] 태그)
JSON 구조화 응답 (실무 필수)
API 호출·자동화 파이프라인과 연결할 때 필수:
[지시]
다음 CS 문의를 분류하여 JSON으로 반환.
[입력]
제목: {email_subject}
본문: {email_body}
[출력 스키마]
{
"category": "refund|shipping|general|spam",
"urgency": 1-5 정수,
"sentiment": "positive|neutral|negative",
"keywords": [string 3개],
"summary": "한 줄 요약"
}
[제약]
- 반드시 유효한 JSON
- 추가 설명 없이 JSON만
- 모든 필드 필수
OpenAI API의 response_format: {"type": "json_object"} 설정과 함께 사용하면 100% JSON 보장.
이론 세션 흐름 (60분)
20:00-20:15 (15분) — 도입·원리
- 한국 AI 도입 현황
- LLM 작동 원리 직관 (Next token)
- 확률성 · 할루시네이션 현실
20:15-20:40 (25분) — 5원칙 상세
- 각 원칙 예시 3개씩
- 나쁜 프롬프트 → 좋은 프롬프트 리팩토링 라이브 시연
20:40-21:00 (20분) — 모델 선택·템플릿
- 주요 LLM 비교 매트릭스
- 실무 템플릿 3종 설명
- 한국어 vs 영어 · 하이브리드 전략
실습 세션 흐름 (40분)
21:00-21:10 (10분) — 실습 준비
- 자기 업무에서 반복하는 프롬프트 2개 준비
- ChatGPT/Claude 창 열기
21:10-21:30 (20분) — 리팩토링 실습
- 5원칙 체크리스트로 Before/After 작성
- 강사가 3-5명 스크린 공유해 라이브 피드백
21:30-21:40 (10분) — 결과 비교
- Before/After 각각 5회 호출해 결과 일관성 비교
- 참가자 중 2-3명 발표
Q&A 예상 질문 5가지
Q1. 프롬프트 길이는 짧을수록 좋나요? 아니다. 명확성이 우선. 500자 정도가 실무 적합. 단, 5000자 이상은 모델 혼란 가능.
Q2. 한국어 vs 영어? GPT-4o, Claude는 한국어도 거의 동등. 편한 언어로 쓰되 핵심 지시어("반드시", "절대 금지" 등)는 영어 혼용이 안정적.
Q3. 좋은 프롬프트인지 어떻게 검증? 같은 프롬프트에 10번 호출 → 결과 일관성 확인. 3회차에서 정량 평가 방법 상세.
Q4. temperature는 얼마가 좋은가요?
분류·추출: 0.10.3. 요약: 0.30.5. 창작: 0.8~1.2. 기본 0.7은 어정쩡. 작업별 세팅 권장.
Q5. 프롬프트에 내 회사 정보 넣어도 안전한가? OpenAI/Anthropic 기본 정책: API는 학습에 사용 X (기본). ChatGPT 앱은 학습에 사용 O (설정에서 off 가능). 기업용은 반드시 API 또는 Enterprise Plan.
2회차까지 1주일 과제
- 리팩토링한 프롬프트 2개를 실제 업무에 5회 이상 사용
- 각 프롬프트를 10회 호출해 일관성 평가 (결과 비슷한가?)
- 발견한 개선점·의문점을 메모 → 2회차 Q&A에서 공유
- 2회차 준비: 자기 업무에서 "역할 분리"가 필요한 복잡한 작업 1개 선정
흔한 초보자 실수 5가지
- "길게 쓰면 좋을 것" → 맥락은 풍부하되 중복은 제거
- "이것저것 동시에 요청" → 한 번에 1-2가지 과제만
- "예시 없이 완벽한 결과 기대" → Few-shot 예시 2-3개 추가
- "출력 형식 미지정" → JSON, Markdown, Bullet 중 명시
- "프롬프트를 저장·재사용하지 않음" → 버전 관리한 프롬프트 라이브러리 구축
한국 실무 적용 사례
토스 유사 — 고객 응대 분류 프롬프트 개선 "CS 이메일 분류해줘" → 5원칙 적용 후 정확도 73% → 91%.
쿠팡 유사 — 상품 설명 자동 생성 "상품 설명 써줘" → 페르소나 + 구조 + 예시 추가 후 편집 시간 70% 감소.
배민 유사 — 파트너 공지 메시지 자동 생성 톤·제약 명시 없던 기존 프롬프트 → Voice Code 주입 → 재작성 요청 빈도 80% 감소.
당근 유사 — 신고 사유 분류 단순 분류 프롬프트 → 우선순위·증거·키워드 JSON 응답 → 모더레이터 업무 50% 경감.
스타트업 유사 — 투자자 리포트 작성 "이번달 리포트 써줘" → 구조·데이터·근거 명시 → 임원 최종 수정 30분 → 5분.
실습 체크리스트
- Zoom 링크 접속, 카메라·마이크 확인
- 자기 업무 실제 프롬프트 2개 준비
- 이론 세션 중 5원칙 각 원칙 적용 예시 메모
- 실습 시간에 강사 피드백 1회 이상 요청
- 5원칙 체크리스트로 자기 프롬프트 리팩토링
- Q&A에서 질문 최소 1개 던지기
- 2회차 전까지 리팩토링한 프롬프트 10회 호출해 일관성 관찰
- 결과 메모 (좋은 점·개선점)
- 2회차 준비: 역할 분리 필요한 복잡 작업 선정
- 템플릿 3종을 자기 업무에 변형 적용
정리
좋은 프롬프트는 "LLM에게 맡길 일을 사람에게 설명하듯 쓰는 것"입니다. 5원칙(명확성·맥락·구조·예시·제약)을 기계적으로 체크하는 습관만 들여도 결과물 품질이 한 단계 올라갑니다. 이 1회차에서는 철학적 기반을, 2회차에서는 그 위에 구조화와 역할 분리라는 고급 설계를 얹습니다. 다음 주 수요일 20시에 다시 만납시다.