현대 경영은 데이터 기반 의사결정(Data-Driven Decision Making)을 강조한다. 데이터 분석 역량 함양을 목적으로 직원들에게 '파이썬' 'R' 등 프로그래밍을 교육하는 사례도 많다. 문제는 컴퓨터공학 전공자가 아닌 일반 직원이 프로그래밍을 배우는 것은 쉬운 일은 아니라는 점이다.
하지만, 챗GPT를 이용한다면? 저자는 "챗GPT와의 대화로 코딩의 장벽을 넘고 일반 실무자들이 전문가 수준의 데이터 분석까지 하는 일이 가능해졌다"고 말한다. 책의 부제가 '굿바이 파이썬! 코딩 없이 말로만!'이다.
이 책은 인사 데이터 분석, 생산, 마케팅, 고객 리뷰, 수요 예측, 고객맞춤 상품 추천 등에 이르기까지 실제 비즈니스 사례를 중심으로 챗GPT를 활용한 데이터 분석 방법을 알려준다.
기자도 책을 바탕으로 실전 연습을 해봤다. 인사 데이터 분석을 통해 '이직 가능성이 높은 직원'을 분석해 보는 작업에 도전했다. 월 20달러를 내야 하는 챗GPT 4.0에 접속하고 GPTs 메뉴에서 'Data Analysis' 챗봇을 선택했다.
IBM이 연습용으로 만들어 놓은 데이터(https://bit.ly/IBM_HR_train)를 다운받아 대화창에 올리고 이렇게 말했다.
"우리 회사 과거 현재 전 직원 인사데이터야. 한번 살펴보고 어떤 분석을 할 수 있겠는지 확인해줄래? 한국어로 대화하자."
챗봇은 "이 데이터를 바탕으로 이직률 분석, 부서-직무별 분석,직원 만족도 분석,근무 조건과 성과의 관계, 이직 예측 모델링 등이 가능하다"고 답했다.
다음 순서는 데이터 탐색(EDA: Exploratory Data Analysis). 그런데 명령문이 "일단 기본적인 EDA부터 해볼래?"였다. 챗봇은 다음과 같은 데이터에 대한 기본 개요를 알려준다.
나이(Age): 평균 약 36.9세, 최소 18세에서 최대 60세로 분포일일 급여(DailyRate): 평균 약 803.2, 최소 102에서 최대 1499로 분포집에서부터의 거리(DistanceFromHome): 평균 약 9.2, 최소 1에서 최대 29로 분포월급(MonthlyIncome): 평균 약 6500, 최소 1009에서 최대 19999로 분포총 근무 연수(TotalWorkingYears): 평균 약 11.3년, 최소 0에서 최대 40년으로 분포
다음 명령어는 "이직률 분석, 직원 만족도 및 근속 연수 분석, 부서별 및 직무별 분석, 출장 빈도와 직원 성과의 관계 분석 해줘"였다.
책에서는 "출장과 직무 만족도 차이가 좀 이해가 안가는 데, 그래프로 다시 그려서 설명해줄래?" "평균 말고 분포도 좀 파악해서 알려줄래?"라는 명령구도 썼다. 그야말로 인턴 직원을 데리고 하나하나 업무를 지시하는 식으로 챗봇에게 명령하면 된다.
다만, GPT4나 DATA Analysis 사용량(질문수)에는 제한이 있다. 사용량 제한에 넘어서면 에러 메시지가 뜬다. 책 집필 당시 기준으로 챗GPT Plus의 경우 3시간에 40번 질문할 수 있다.
저자는 "데이터 분석의 시작은 언제나 데이터 탐색인데, 챗봇한테 데이터 탐색을 시키면서 어떤 분석을 해볼 수 있는 지 함께 물어보면 여러가지 아이디어를 얻을 수 있다"면서 "결과가 마음에 들지 않으면 챗봇한테 개선할 방법을 물어보는 것도 좋다"고 조언한다.