AI 데이터2026.05.20

데이터는 어디에 숨어 있나요? — AI아카데미 2강

데이터는 어디에 숨어 있나요? —  AI아카데미 2강
📖 약 8분 분량 ✍️ 약 2,800자 📚 AI 데이터 리터러시 시리즈 2/8강
대표님, 어제 하루 동안 데이터를 몇 개나 만나셨을까요? 출근길 교통카드, 카카오톡 답장, 점심 결제, 사무실 CCTV 1초당 30프레임, 회의 녹음, 거래처 이메일 첨부, 퇴근길에 본 유튜브 알고리즘 추천… 평범한 한국인 한 명이 하루에 남기는 데이터 흔적은 약 47개. 1년이면 1만 7천 개입니다. 문제는, 우리는 그 흔적이 데이터인 줄 모른다는 점입니다. "우리 회사엔 데이터가 없다"고 말씀하시는 대표님이 많은데, 사실은 데이터가 없는 게 아니라 데이터를 찾는 눈이 없는 것입니다. 1강에서 데이터가 뭔지 배웠으니, 2강에서는 그 데이터들이 어디에 숨어 있는지 찾아봅니다. 집안 살림 인벤토리 만드는 마음으로요.

01하루에 47개 — 우리는 매일 데이터를 흘리고 있습니다

일상의 데이터 흔적을 종류별로 정리하면 다음과 같습니다.

  • 통신 데이터: 카톡·문자·이메일 — 한국인 평균 하루 23건
  • 결제 데이터: 신용카드·간편결제·교통카드 — 하루 평균 7건
  • 위치 데이터: GPS·교통카드 태그·블랙박스 — 출퇴근만으로도 수십 회
  • 영상·음성 데이터: CCTV·회의 녹음·고객 응대 통화
  • 행동 데이터: 유튜브 시청 기록·쇼핑 클릭·검색어

이 47개 중 우리가 "데이터를 만들었다"고 의식하는 것은 손에 꼽습니다. 카드 결제하면서 "방금 매출 데이터가 한 줄 쌓였다"고 생각하지 않으니까요. 그런데 AI는 이 무의식적 흔적을 가장 좋아합니다. 가공되지 않은 진짜 행동이 거기에 있기 때문입니다.

02일터에 숨은 데이터 — 5대 카테고리

대표님 회사 안 데이터 인벤토리는 다음 5개로 분류됩니다.

카테고리어디에 있나보통 어떻게 쓰이나
소통 데이터사내 메신저(슬랙·카톡), 이메일, 회의록거의 안 봄
고객 데이터CRM 명단, 콜센터 녹음, 카카오톡 채널 대화명단만 봄
거래 데이터POS 매출, ERP 입출고, 회계 장부월말에 한 번 봄
공간 데이터CCTV, 출입 카드, 와이파이 접속 로그사고 났을 때만 봄
마케팅 데이터홈페이지 방문, SNS 댓글, 광고 클릭광고 대행사가 봄

가장 적게 활용되는 것은 소통 데이터공간 데이터입니다. 김지백 강사에 따르면 "1년 치 사내 메신저 대화만 AI에 요약시켜도 부서별 업무 부담·갈등 포인트가 한눈에 보이는데, 99%의 회사가 이걸 안 한다"고 합니다.

035분 데이터 인벤토리 — 책상에서 그리는 지도

지금 종이 한 장 꺼내서 따라 해보세요. 5분이면 충분합니다 (아래 항목을 클릭하면 체크표시됩니다).

  • 우리 회사가 쓰는 디지털 도구 5개 적기 — 메신저·메일·POS·회계·CRM 등
  • 각 도구가 어떤 데이터를 만드는지 한 줄로 적기
  • 그 데이터를 마지막으로 본 게 언제인지 적기 — 어제·지난주·1년 전·본 적 없음
  • 정기적으로 보는 데이터에 ✔, 안 보는 데이터에 ✗ 표시
  • ✗가 가장 많은 카테고리 = AI 1호 프로젝트 후보

이 다섯 줄짜리 종이가 앞으로 6개월간 우리 회사 AI 도입의 지도가 됩니다. 외부 컨설턴트나 비싼 분석 도구보다 먼저 와야 할 단계입니다.

04AI 1호 프로젝트 후보 고르는 3가지 기준

데이터를 찾으셨다면 그중 하나를 골라야 합니다. 망하지 않는 1호 프로젝트의 3대 조건은 다음과 같습니다.

기준왜 중요한가
1. 이미 데이터가 충분히 쌓여 있는가데이터를 새로 6개월간 모으는 프로젝트는 100% 중간에 멈춥니다
2. 사람이 매주 반복하는 일인가영수증 정리, 견적서 요약, 주간 보고처럼 빈도가 높을수록 효과 큼
3. 결과가 사장님 의사결정에 보탬이 되는가단순 자동화보다 "화요일 아침에 보면 다음 결정을 빨리 내릴 수 있는" 것

이 셋 모두 맞는 단 1개를 골라야 합니다. 둘이 맞으면 보류, 하나만 맞으면 다음 후보로 넘기세요. 욕심내서 여러 개 동시에 시작하면 어느 것도 끝까지 가지 못합니다. 1호 프로젝트는 "성공시켜야 2호가 생기는" 단 하나의 프로젝트입니다.

📝 5분 체크포인트

본문을 잘 이해하셨는지 점검해보세요. 답을 고르고 [정답 확인]을 누르면 즉시 채점됩니다.

Q1. 다음 중 비정형 데이터가 아닌 것은?

정답: B — 표·숫자처럼 행과 열로 정리된 데이터는 정형 데이터입니다. 영상·음성·통화는 비정형 데이터로, 회사에 가장 많이 쌓이지만 가장 안 보는 데이터이기도 합니다.

Q2. 데이터 인벤토리를 만들 때 가장 먼저 해야 할 일은?

정답: B — 이미 쓰고 있는 도구를 먼저 적어야 그 도구가 어떤 데이터를 만들고 있는지 보입니다. 새 데이터를 모으거나 새 도구를 사는 건 그다음입니다.

Q3. AI 1호 프로젝트 후보 3가지 기준 중 가장 우선되는 것은?

정답: C — 데이터부터 모으는 프로젝트는 6개월 안에 멈춥니다. 이미 데이터가 쌓여 있는 일을 골라야 첫 프로젝트가 살아남습니다.

🎯 내 회사 데이터 인벤토리 체크

해당되는 항목을 모두 클릭해 체크하세요. 마지막에 [내 점수 보기]를 누르면 등급이 나옵니다.

  • 사내 메신저(슬랙·카톡 등) 1년치 보관 중
  • CRM 또는 고객 명단 정리되어 있음
  • POS·ERP 매출·재고 데이터 있음
  • CCTV 30일 이상 보관 중
  • 카카오톡 채널 또는 SNS 운영 중
  • 콜센터 또는 고객 응대 녹음 있음
  • 홈페이지 방문·검색 데이터 있음

오늘 한 가지만 기억하세요. 데이터가 없는 회사는 없습니다. 데이터를 찾는 눈이 없는 사장님이 있을 뿐입니다. 일상에 47개, 회사에 다섯 카테고리. 종이 한 장에 우리 회사 데이터 지도를 그리시고, AI 1호 프로젝트 후보 3가지 기준(이미 쌓인 데이터 · 매주 반복 업무 · 의사결정 보탬)에 모두 맞는 단 하나를 고르세요. 그 한 개가 우리 회사 AI 시대의 첫걸음입니다.

다음 강 — 데이터는 마트 장보기처럼: 많이가 아니라 '필요한 것만'

데이터를 무작정 다 모으면 망합니다. 진짜는 목적에서 시작해 필요한 데이터만 골라 담는 것. 3강에서는 사장님이 마트 장바구니를 채우듯 데이터를 선별하는 5단계 프레임을 배웁니다.

#데이터 리터러시#AI 데이터#데이터 인벤토리#AI 1호 프로젝트#사장님 가이드#김지백#AI 시리즈

자주 묻는 질문

Q. 우리 회사는 작은데 정말 데이터가 있을까요?
직원 3명 회사도 카카오톡 단톡방, POS 영수증, 거래처 이메일이 다 데이터입니다. 작아서 없는 게 아니라, 작아서 모아두고도 안 본 것입니다.
Q. CCTV 같은 영상도 데이터인가요?
네, 비정형 데이터 중 가장 큰 비중을 차지합니다. AI 시대에는 영상도 텍스트로 자동 요약·분석이 가능해서 매장 동선 분석, 이상 행동 감지 같은 활용이 가능합니다.
Q. 데이터가 흩어져 있는데 다 모아야 하나요?
아닙니다. 1호 프로젝트는 한 종류만 봅니다. 5강에서 AI에게 묻는 법을 배울 때, 한 종류만으로도 의미 있는 답이 나옵니다.
Q. 직원들 메신저 대화도 데이터로 써도 되나요?
가능합니다만 동의가 먼저입니다. 개인정보보호법 위반 가능성이 있어 7강에서 자세히 다룹니다. 2강에서는 '있다'는 사실만 인지하시면 됩니다.
Q. 데이터 인벤토리는 누가 만드나요?
사장님이 직접 하시는 게 정석입니다. 30분이면 충분하고, 직원에게 시키면 '이미 보고 있는 것만' 적어서 진짜 숨은 데이터를 못 찾습니다.
이 주제로 강의 문의

우리 조직에 맞는 AI 교육을
설계해드립니다.

위 자료의 내용을 기반으로 맞춤형 강의 커리큘럼을 구성해드립니다. 기업·공공기관·임원 대상 프로그램 모두 가능합니다.

강의 소개 보기강의 문의하기

조회수·다운로드 카운트 등 인터랙티브 기능은 자료실 인터랙티브 페이지에서 이용하실 수 있습니다.