AI 데이터2026.03. 27

데이터를 어떻게 고르나요? — AI 데이터 기본 3강

데이터를 어떻게 고르나요? — AI 데이터 기본 3강
📖 약 9분 분량 ✍️ 약 3,300자 📚 AI 데이터 리터러시 시리즈 3/8강
대표님, 마트에 갈 때 카트를 빈 채로 들고 한 시간 동안 모든 매대를 다 둘러보고 오시지는 않으시지요? 그런데 회사에 AI를 도입하시려는 많은 대표님이 데이터 앞에서는 정확히 그 일을 하십니다. "일단 다 모아두자"는 말이 가장 위험합니다. 1강에서 데이터가 무엇인지 배웠고, 2강에서 회사 어디에 숨어 있는지 찾으셨다면, 3강은 그중 우리 회사가 진짜로 살(=AI에 먹일) 데이터를 골라내는 단계입니다. 마트 장보기 5단계로 풀어드립니다. 카트와 종이 한 장 들고 시작하시지요.

01왜 "일단 다 모으자"는 망하는가 — 데이터 장바구니 파산 3가지

제가 1,000곳 넘는 회사를 컨설팅하면서 가장 많이 본 실패 패턴은 단순합니다. "AI 도입 준비해야 하니까 일단 데이터부터 다 모으자"고 시작하신 회사 중 절반 이상이 6개월 뒤 멈춥니다. 왜일까요?

  • ① 카트 무게에 깔립니다. 매출 엑셀, 카톡 상담, 영수증 사진, CCTV 영상까지 다 모으면 정작 첫 번째 질문에 답할 수가 없습니다. "그래서 뭘 분석하지?"가 떠오르는 순간 손이 멈춥니다.
  • ② 상한 재료가 카트에 섞입니다. "그 거래처는 김 부장만 안다", "2년 전 자료는 종이로만 있다" — 쓸 수 없는 데이터를 분류 안 하고 던지면 AI가 엉뚱한 답을 내고, 사장님은 "AI는 별거 없네"라고 결론 내십니다.
  • ③ 영수증이 안 남습니다. 어떤 목적으로, 어떤 데이터를, 어디서 모았는지 기록 없이 진행하면 직원 한 명 퇴사할 때 그 한 달 작업이 통째로 날아갑니다.

핵심 원칙 — "메뉴 먼저, 장보기는 그 다음." 마트에서도 "오늘 저녁 김치찌개"가 정해져야 돼지고기·두부·파를 살 수 있습니다. 데이터도 똑같습니다. 먼저 풀고 싶은 문제 한 가지를 정하시고, 그 한 가지에 답할 데이터만 카트에 담으세요. 나머지는 다음 장보기에 사면 됩니다.

02마트 장보기 5단계 — 사장님이 진짜 살 데이터 골라내기

본격 5단계입니다. 종이 한 장에 그대로 따라 적으시면, 30분이면 우리 회사 첫 장바구니가 채워집니다.

단계마트 장보기실제 데이터 작업
1단계오늘 저녁 메뉴 정하기풀고 싶은 문제 1개 정의
2단계장보기 리스트 적기그 문제에 답할 데이터 3~5개 적기
3단계매대 위치 확인그 데이터가 회사 어디 시스템에 있나
4단계신선도·유통기한 점검충분히 쌓였나, 결측·중복 없나
5단계장바구니에 담기AI가 한 번에 읽게 한 파일로 통합

1단계. 메뉴 정하기 — 풀고 싶은 문제 한 줄로 적기

"AI로 뭐 좀 해보자"는 메뉴가 아닙니다. "이번 분기 신규고객 이탈률을 줄이고 싶다"처럼 한 줄로 또렷해야 합니다. 좋은 메뉴 후보 3가지를 드립니다.

  • "이번 달 매출 하락 거래처 TOP 5를 찾아 이유를 정리하고 싶다"
  • "고객 클레임에서 반복되는 3대 유형을 뽑고 대응 매뉴얼을 만들고 싶다"
  • "강의 수강생 중 재구매 가능성이 높은 100명을 골라 안내 문자를 보내고 싶다"

모두 대답이 행동으로 이어지는 질문입니다. "AI 한번 써보고 싶다"는 메뉴가 아니라 산책입니다.

2단계. 장보기 리스트 — 그 문제에 꼭 필요한 데이터 3~5개

메뉴가 "신규고객 이탈률 줄이기"라면 장보기 리스트는 이렇게 나옵니다 — ① 최근 6개월 신규고객 명단, ② 그들의 첫 구매·재구매 일자, ③ 상담·클레임 로그, ④ 마지막 접속·방문 시점. 끝입니다. 5개를 넘기지 마세요. 6개째부터는 다음 메뉴에 사시면 됩니다.

3단계. 매대 위치 확인 — 회사 어디에 있나

2강에서 만드신 "데이터 인벤토리"가 여기서 빛납니다. 리스트 5개 각각에 "어느 시스템에 있는지" 적으세요 — POS·구글시트·카톡·CRM·노션·종이 캐비닛. 매대 위치를 모르면 마트에서 한 시간 헤매듯, 데이터도 한 주 헤맵니다. 직원 1명에게 "이 5개 어디 있는지 30분 안에 찾아오세요"로 맡기시면 끝납니다.

4단계. 신선도·유통기한 점검 — 살 만한 상태인가

찾았다고 다 살 수 있는 건 아닙니다. 네 가지만 점검하세요.

  • 충분히 쌓였나? 신규고객 명단이 7명뿐이면 분석할 게 없습니다. 최소 30~50건은 모인 데이터인지 확인.
  • 같은 사물이 같은 이름인가? "(주)한국상사 / 한국상사(주) / 한상사"가 섞여 있으면 AI는 세 회사로 봅니다.
  • 한 칸에 한 정보만 들어가 있나? "김부장 010-1234"는 두 칸으로 쪼개야 합니다. 사람 눈엔 편해도 AI 눈엔 깨진 표입니다.
  • 이미지·종이·카톡인가? 그대로는 못 씁니다. 사진은 스마트폰 스캔·OCR로 텍스트화, 카톡은 PC 카톡 "대화내용 내보내기"로 텍스트 파일 추출 후 ChatGPT에 표 변환 요청.

5단계. 장바구니 담기 — 한 파일로 모으기

3·4단계를 통과한 데이터를 구글시트 하나에 통합하시는 것이 5단계의 끝입니다. 단, 두 가지만 지키세요. ① 모든 사물에 고유 ID(예: 고객ID `C0001`)를 부여하고, ② 시트마다 그 ID 컬럼을 똑같이 넣으세요. 그래야 AI에게 "고객별 상담·매출 통합해줘" 한 줄에 답이 나옵니다. 이름은 동명이인 때문에 키로 못 씁니다.

5단계 한 줄 요약 — "메뉴 → 리스트 → 매대 → 신선도 → 카트." 이 순서를 거꾸로 가면 망합니다. 데이터를 먼저 다 모으고 메뉴를 정하려 하면, 6개월 뒤 카트는 가득 찼는데 살 게 없는 상태가 됩니다.

03사장님 직접 vs 직원 vs AI vs 개발자 — 5단계 경계선

"이거 다 사장님이 직접 하셔야 하나요?"라고 물으시는데, 절대 아닙니다. 단계별로 누가 가장 잘하는지 정리해 드립니다.

작업사장님직원ChatGPT·Claude개발자
1. 메뉴(문제) 정의
2. 데이터 리스트 작성
3. 매대 찾기 (원본 수집)
4-1. 사진·카톡 → 표로 변환
4-2. 거래처명·표기 통일
4-3. 카테고리 자동 분류
5. ID 부여·시트 통합
시스템 자동 연동
AI 사용 규칙 결정

한 줄로 외우시면 됩니다 — "메뉴와 룰은 나, 모으기는 직원, 다듬기는 AI, 연동은 개발자." 이 분담이 무너지면 사장님이 자료 정리에 일주일 빠지고, 정작 의사결정은 못 하시게 됩니다.

04사장님이 반드시 직접 결정해야 할 한 가지 — AI 사용 룰 한 장

5단계를 시작하기 전, 한 장짜리 사내 규칙을 사장님 손으로 정리하셔야 합니다. 직원이 편하다고 회사 데이터를 통째로 ChatGPT에 붙여넣기 전에요.

"우리 회사 데이터, 외부 AI에 절대 넣지 않을 4종"

  1. 주민등록번호·생년월일 — 단 한 번도 외부 AI에 넣지 마세요.
  2. 고객 연락처 원본 — 분석 시에는 마스킹(예: 010-****-5678) 후에만.
  3. 미공개 거래처 단가표 — 가격 협상 자료는 회사 명의 유료 플랜에서만.
  4. 계약서 원문 — 요약이 필요하면 핵심만 발췌해서, 회사 정보는 가명 처리.

여기에 한 줄만 추가하시면 됩니다 — "회사 데이터는 회사 명의 유료 플랜(ChatGPT Team·Claude Team 등 학습 거부 옵션이 있는 플랜)에서만 다룬다." 이 한 장을 인쇄해서 직원 모니터 옆에 붙이는 것이 AI 도입의 진짜 1단계입니다. 도구보다 룰이 먼저입니다.

📝 5분 체크포인트

본문을 잘 이해하셨는지 점검해보세요. 답을 고르고 [정답 확인]을 누르면 즉시 채점됩니다.

Q1. 마트 장보기 5단계에서 가장 먼저 해야 할 일은?

정답: A — "메뉴 먼저, 장보기는 그 다음." 풀고 싶은 문제가 한 줄로 또렷해야 5단계 전체가 작동합니다. 데이터를 먼저 다 모으는 회사는 6개월 뒤 카트만 무거워집니다.

Q2. 4단계 신선도 점검에서 틀린 것은?

정답: C — "모름(누락)"과 "0(영)"은 완전히 다른 의미입니다. 빈칸을 0으로 채우면 평균이 왜곡됩니다. 빈칸은 빈칸 그대로 두거나 "미상"으로 표기하세요.

Q3. 5단계에서 여러 시트를 연결할 때 키(key)로 가장 적합한 것은?

정답: B — 이름은 동명이인이 있고, 전화번호는 바뀝니다. 한번 부여하면 변하지 않는 고유 ID(C0001 같은 형식)만이 안전한 키입니다.

🎯 내 회사 장바구니 준비도 체크

해당되는 항목을 모두 클릭해 체크하세요. 마지막에 [내 점수 보기]를 누르면 등급이 나옵니다.

  • 이번 분기에 AI로 풀고 싶은 문제 1개가 한 줄로 정의되어 있다
  • 그 문제에 필요한 데이터 3~5개를 적을 수 있다
  • 각 데이터가 회사 어느 시스템에 있는지 알고 있다
  • 거래처·고객 표기가 회사 안에서 통일되어 있다
  • 모든 고객(또는 주문)에 고유 ID가 부여되어 있다
  • AI에 절대 넣지 않을 데이터 목록이 사내 문서로 있다
  • 회사 명의 유료 AI 플랜을 사용 중이다 (ChatGPT Team·Claude Team 등)

오늘 한 가지만 기억하세요. 데이터는 많이 모으는 게 아니라, 메뉴부터 정하고 골라 담는 것입니다. 마트 장보기 5단계 — 메뉴 → 리스트 → 매대 → 신선도 → 장바구니. 종이 한 장에 우리 회사 첫 메뉴 한 줄과 데이터 3~5개를 적으시고, AI에 절대 넣지 않을 4종 목록을 직원 모니터 옆에 붙이세요. 카트가 가벼울수록 첫 프로젝트가 살아남습니다.

다음 강 — 장바구니에 담은 재료 다듬기: AI가 떠먹기 좋게 4단계 손질

카트에 담긴 재료가 있어도 그대로 냄비에 던지면 안 됩니다. 4강에서는 정제·구조화·표준화·연결 4단계로 데이터를 손질해, ChatGPT·Claude가 한 번에 읽고 답할 수 있는 상태로 만드는 실전 방법을 다룹니다. 비전공자도 30분이면 따라합니다.

#데이터 리터러시#AI 데이터#데이터 선별#AI 1호 프로젝트#마트 장보기#사장님 가이드#김지백#AI 시리즈#비전공 대표

자주 묻는 질문

Q. AI 도입 첫 데이터, 무엇부터 골라야 하나요?
데이터부터 고르지 마세요. 먼저 "이번 분기에 풀고 싶은 문제 1개"를 한 줄로 정하시고, 그 문제에 답할 데이터 3~5개만 고르십시오. 마트에서 메뉴 정한 뒤 장보는 것과 똑같습니다. 일단 다 모으자는 접근은 6개월 뒤 카트만 무거워지고 멈춥니다.
Q. ChatGPT나 Claude에 회사 데이터를 넣어도 안전한가요?
개인 무료 플랜은 학습 데이터로 쓰일 수 있으니 민감 정보는 금물입니다. 회사 명의 유료 플랜(ChatGPT Team·Enterprise, Claude Team 등)에서 학습 거부 옵션을 켜고 쓰거나, 주민번호·연락처·계약서·미공개 단가표 4종은 마스킹 후에만 넣으세요. 이 룰 한 장을 직원 모니터 옆에 붙이는 것이 AI 도입의 진짜 1단계입니다.
Q. 종이 자료나 카톡 상담은 5단계 어디서 처리하나요?
4단계 "신선도 점검"에서 처리합니다. 종이는 스마트폰 스캔 앱으로 PDF화 후 ChatGPT·Claude에 올리면 OCR까지 자동이고, 카톡은 PC 카톡 "대화내용 내보내기"로 텍스트 추출 후 AI에게 표 변환을 시키세요. 둘 다 그대로는 AI가 못 움직입니다.
Q. 직원 30명 미만 작은 회사도 5단계가 의미 있나요?
오히려 작을수록 효과가 큽니다. 데이터가 적으니 메뉴 정하고 고르고 합치는 전 과정이 하루이면 끝납니다. 대기업처럼 거창한 데이터 거버넌스 프로젝트를 할 필요 없이, 구글시트 한 장으로 AI 1호 프로젝트 시작 가능합니다.
Q. 데이터 정리, AI가 다 해주지 않나요?
절반은 맞고 절반은 틀립니다. 표기 통일·카테고리 분류·요약은 AI가 압도적으로 잘합니다. 그러나 "무엇이 우리 회사에 의미 있는 데이터인가"는 대표·실무자만 정할 수 있습니다. 5단계 중 1단계(메뉴)·5단계(ID·국악)는 사람이, 4단계는 AI와 사람이 분담하는 것이 정석입니다.
이 주제로 강의 문의

우리 조직에 맞는 AI 교육을
설계해드립니다.

위 자료의 내용을 기반으로 맞춤형 강의 커리큘럼을 구성해드립니다. 기업·공공기관·임원 대상 프로그램 모두 가능합니다.

강의 소개 보기강의 문의하기

조회수·다운로드 카운트 등 인터랙티브 기능은 자료실 인터랙티브 페이지에서 이용하실 수 있습니다.