데이터를 어떻게 고르나요? — AI 데이터 기본 3강

01왜 "일단 다 모으자"는 망하는가 — 데이터 장바구니 파산 3가지
제가 1,000곳 넘는 회사를 컨설팅하면서 가장 많이 본 실패 패턴은 단순합니다. "AI 도입 준비해야 하니까 일단 데이터부터 다 모으자"고 시작하신 회사 중 절반 이상이 6개월 뒤 멈춥니다. 왜일까요?
- ① 카트 무게에 깔립니다. 매출 엑셀, 카톡 상담, 영수증 사진, CCTV 영상까지 다 모으면 정작 첫 번째 질문에 답할 수가 없습니다. "그래서 뭘 분석하지?"가 떠오르는 순간 손이 멈춥니다.
- ② 상한 재료가 카트에 섞입니다. "그 거래처는 김 부장만 안다", "2년 전 자료는 종이로만 있다" — 쓸 수 없는 데이터를 분류 안 하고 던지면 AI가 엉뚱한 답을 내고, 사장님은 "AI는 별거 없네"라고 결론 내십니다.
- ③ 영수증이 안 남습니다. 어떤 목적으로, 어떤 데이터를, 어디서 모았는지 기록 없이 진행하면 직원 한 명 퇴사할 때 그 한 달 작업이 통째로 날아갑니다.
핵심 원칙 — "메뉴 먼저, 장보기는 그 다음." 마트에서도 "오늘 저녁 김치찌개"가 정해져야 돼지고기·두부·파를 살 수 있습니다. 데이터도 똑같습니다. 먼저 풀고 싶은 문제 한 가지를 정하시고, 그 한 가지에 답할 데이터만 카트에 담으세요. 나머지는 다음 장보기에 사면 됩니다.
02마트 장보기 5단계 — 사장님이 진짜 살 데이터 골라내기
본격 5단계입니다. 종이 한 장에 그대로 따라 적으시면, 30분이면 우리 회사 첫 장바구니가 채워집니다.
| 단계 | 마트 장보기 | 실제 데이터 작업 |
|---|---|---|
| 1단계 | 오늘 저녁 메뉴 정하기 | 풀고 싶은 문제 1개 정의 |
| 2단계 | 장보기 리스트 적기 | 그 문제에 답할 데이터 3~5개 적기 |
| 3단계 | 매대 위치 확인 | 그 데이터가 회사 어디 시스템에 있나 |
| 4단계 | 신선도·유통기한 점검 | 충분히 쌓였나, 결측·중복 없나 |
| 5단계 | 장바구니에 담기 | AI가 한 번에 읽게 한 파일로 통합 |
1단계. 메뉴 정하기 — 풀고 싶은 문제 한 줄로 적기
"AI로 뭐 좀 해보자"는 메뉴가 아닙니다. "이번 분기 신규고객 이탈률을 줄이고 싶다"처럼 한 줄로 또렷해야 합니다. 좋은 메뉴 후보 3가지를 드립니다.
- "이번 달 매출 하락 거래처 TOP 5를 찾아 이유를 정리하고 싶다"
- "고객 클레임에서 반복되는 3대 유형을 뽑고 대응 매뉴얼을 만들고 싶다"
- "강의 수강생 중 재구매 가능성이 높은 100명을 골라 안내 문자를 보내고 싶다"
모두 대답이 행동으로 이어지는 질문입니다. "AI 한번 써보고 싶다"는 메뉴가 아니라 산책입니다.
2단계. 장보기 리스트 — 그 문제에 꼭 필요한 데이터 3~5개
메뉴가 "신규고객 이탈률 줄이기"라면 장보기 리스트는 이렇게 나옵니다 — ① 최근 6개월 신규고객 명단, ② 그들의 첫 구매·재구매 일자, ③ 상담·클레임 로그, ④ 마지막 접속·방문 시점. 끝입니다. 5개를 넘기지 마세요. 6개째부터는 다음 메뉴에 사시면 됩니다.
3단계. 매대 위치 확인 — 회사 어디에 있나
2강에서 만드신 "데이터 인벤토리"가 여기서 빛납니다. 리스트 5개 각각에 "어느 시스템에 있는지" 적으세요 — POS·구글시트·카톡·CRM·노션·종이 캐비닛. 매대 위치를 모르면 마트에서 한 시간 헤매듯, 데이터도 한 주 헤맵니다. 직원 1명에게 "이 5개 어디 있는지 30분 안에 찾아오세요"로 맡기시면 끝납니다.
4단계. 신선도·유통기한 점검 — 살 만한 상태인가
찾았다고 다 살 수 있는 건 아닙니다. 네 가지만 점검하세요.
- 충분히 쌓였나? 신규고객 명단이 7명뿐이면 분석할 게 없습니다. 최소 30~50건은 모인 데이터인지 확인.
- 같은 사물이 같은 이름인가? "(주)한국상사 / 한국상사(주) / 한상사"가 섞여 있으면 AI는 세 회사로 봅니다.
- 한 칸에 한 정보만 들어가 있나? "김부장 010-1234"는 두 칸으로 쪼개야 합니다. 사람 눈엔 편해도 AI 눈엔 깨진 표입니다.
- 이미지·종이·카톡인가? 그대로는 못 씁니다. 사진은 스마트폰 스캔·OCR로 텍스트화, 카톡은 PC 카톡 "대화내용 내보내기"로 텍스트 파일 추출 후 ChatGPT에 표 변환 요청.
5단계. 장바구니 담기 — 한 파일로 모으기
3·4단계를 통과한 데이터를 구글시트 하나에 통합하시는 것이 5단계의 끝입니다. 단, 두 가지만 지키세요. ① 모든 사물에 고유 ID(예: 고객ID `C0001`)를 부여하고, ② 시트마다 그 ID 컬럼을 똑같이 넣으세요. 그래야 AI에게 "고객별 상담·매출 통합해줘" 한 줄에 답이 나옵니다. 이름은 동명이인 때문에 키로 못 씁니다.
5단계 한 줄 요약 — "메뉴 → 리스트 → 매대 → 신선도 → 카트." 이 순서를 거꾸로 가면 망합니다. 데이터를 먼저 다 모으고 메뉴를 정하려 하면, 6개월 뒤 카트는 가득 찼는데 살 게 없는 상태가 됩니다.
03사장님 직접 vs 직원 vs AI vs 개발자 — 5단계 경계선
"이거 다 사장님이 직접 하셔야 하나요?"라고 물으시는데, 절대 아닙니다. 단계별로 누가 가장 잘하는지 정리해 드립니다.
| 작업 | 사장님 | 직원 | ChatGPT·Claude | 개발자 |
|---|---|---|---|---|
| 1. 메뉴(문제) 정의 | ◎ | |||
| 2. 데이터 리스트 작성 | ◎ | ○ | ||
| 3. 매대 찾기 (원본 수집) | ◎ | |||
| 4-1. 사진·카톡 → 표로 변환 | △ | ◎ | ||
| 4-2. 거래처명·표기 통일 | ○ | ◎ | ||
| 4-3. 카테고리 자동 분류 | ◎ | |||
| 5. ID 부여·시트 통합 | ◎ | ○ | ||
| 시스템 자동 연동 | ◎ | |||
| AI 사용 규칙 결정 | ◎ |
한 줄로 외우시면 됩니다 — "메뉴와 룰은 나, 모으기는 직원, 다듬기는 AI, 연동은 개발자." 이 분담이 무너지면 사장님이 자료 정리에 일주일 빠지고, 정작 의사결정은 못 하시게 됩니다.
04사장님이 반드시 직접 결정해야 할 한 가지 — AI 사용 룰 한 장
5단계를 시작하기 전, 한 장짜리 사내 규칙을 사장님 손으로 정리하셔야 합니다. 직원이 편하다고 회사 데이터를 통째로 ChatGPT에 붙여넣기 전에요.
"우리 회사 데이터, 외부 AI에 절대 넣지 않을 4종"
- 주민등록번호·생년월일 — 단 한 번도 외부 AI에 넣지 마세요.
- 고객 연락처 원본 — 분석 시에는 마스킹(예: 010-****-5678) 후에만.
- 미공개 거래처 단가표 — 가격 협상 자료는 회사 명의 유료 플랜에서만.
- 계약서 원문 — 요약이 필요하면 핵심만 발췌해서, 회사 정보는 가명 처리.
여기에 한 줄만 추가하시면 됩니다 — "회사 데이터는 회사 명의 유료 플랜(ChatGPT Team·Claude Team 등 학습 거부 옵션이 있는 플랜)에서만 다룬다." 이 한 장을 인쇄해서 직원 모니터 옆에 붙이는 것이 AI 도입의 진짜 1단계입니다. 도구보다 룰이 먼저입니다.
본문을 잘 이해하셨는지 점검해보세요. 답을 고르고 [정답 확인]을 누르면 즉시 채점됩니다.
Q1. 마트 장보기 5단계에서 가장 먼저 해야 할 일은?
Q2. 4단계 신선도 점검에서 틀린 것은?
Q3. 5단계에서 여러 시트를 연결할 때 키(key)로 가장 적합한 것은?
🎯 내 회사 장바구니 준비도 체크
해당되는 항목을 모두 클릭해 체크하세요. 마지막에 [내 점수 보기]를 누르면 등급이 나옵니다.
- 이번 분기에 AI로 풀고 싶은 문제 1개가 한 줄로 정의되어 있다
- 그 문제에 필요한 데이터 3~5개를 적을 수 있다
- 각 데이터가 회사 어느 시스템에 있는지 알고 있다
- 거래처·고객 표기가 회사 안에서 통일되어 있다
- 모든 고객(또는 주문)에 고유 ID가 부여되어 있다
- AI에 절대 넣지 않을 데이터 목록이 사내 문서로 있다
- 회사 명의 유료 AI 플랜을 사용 중이다 (ChatGPT Team·Claude Team 등)
오늘 한 가지만 기억하세요. 데이터는 많이 모으는 게 아니라, 메뉴부터 정하고 골라 담는 것입니다. 마트 장보기 5단계 — 메뉴 → 리스트 → 매대 → 신선도 → 장바구니. 종이 한 장에 우리 회사 첫 메뉴 한 줄과 데이터 3~5개를 적으시고, AI에 절대 넣지 않을 4종 목록을 직원 모니터 옆에 붙이세요. 카트가 가벼울수록 첫 프로젝트가 살아남습니다.
자주 묻는 질문
우리 조직에 맞는 AI 교육을
설계해드립니다.
위 자료의 내용을 기반으로 맞춤형 강의 커리큘럼을 구성해드립니다. 기업·공공기관·임원 대상 프로그램 모두 가능합니다.
조회수·다운로드 카운트 등 인터랙티브 기능은 자료실 인터랙티브 페이지에서 이용하실 수 있습니다.