Data Integrity란 무엇인가?
- Data Integrity란, 데이터의 "정확성" 그리고 "일관성"이다.
HR에서의 Data Integrity 범위
- HR시스템에 저장되어 있거나, 기타 HR적 업무를 할 때 필요한 모든 인사 데이터
- 때에 따라서 재무데이터 + 외부 서베이/산업군 내 데이터 포함할 수 있음.
용어 정리
- 로컬 HR (Practitioner) : 나라단위/리전 단위로 해당 국가 HR업무를 수행하는 사람
- 데이터는 HRIS, Organization Development, 보상 설계 를 근간으로, ER, compensation & Benefit으로 흐른다.
글로벌 데이터 통합의 중요성
- HR데이터의 신뢰성 측면에서: Payroll, Benefit, Recruitment등 핵심(코어) 기능에서의 HR데이터는 더 높은단계 (Planning등) 의 HR에 영향을 끼치며, 이는 결국 전략 자체의 신뢰성에 영향을 끼칠 수 있다. (Turnover Analysis, Advising, Staff Reduction등). 따라서 신뢰성 있는 데이터를 수집해야 한다. 이는 직원으로부터, 해당 직원의 people 매니저로부터, 투자자로부터, 비즈니스 리더로부터 신뢰받는 데이터여야 한다.
- HR데이터의 영향력 측면에서: 영향력 분석 해보아야 한다. (데이터가 정확하며 믿을만 한지? 현실적으로 수집 가능한 데이터인지? 올바르게 해석 되었는지?)
당신 조직 내의 데이터가 체계적이며, People Analytics 를 위해 쓰일만 하다고 생각하십니까?
- 네 (30%) , 아니오 (70%)
- 아니라면, 그 이유는?: 데이터가 여기저기 흩어져 있다. (77%) 믿을만하지 않다 (58%)
데이터의 질적 평가 (Qualitative Data Assessment)
- 대상 데이터: 비 형식적 데이터 (관찰 가능한 데이터 수집 방법에 의해 얻어짐)
- 문제의 원인을 찾기 위해서 관찰하는 것
- 어떤 이슈를 찾아내는 데 도움을 준다는 것을 전제로 하는 업무
- 따로 형식이 없거나 semi-structure (비정형데이터, 반정형데이터)
데이터의 양적 평가 (Quantitative Data Assessment)
- 대상 데이터: 통계학에서 사용하는 숫자/연속형Numeric데이터
- 어떤 이슈나 에러를 측정하는 것
- 해당 데이터에 패턴이 있다는 것을 전제로 하는 업무
- 자세하고 정확한 데이터 평가 방법임
- 구체적인 단계*
- 1차 시스템 (주로HRIS)과 2차적인 데이터 소스를 대조함
- effective/entry date in system 사이에 시간차가 얼마나 있는지 확인
- 이외 필드 내 outlier나 missing data도 측정
평가의 목적
- improvement가 필요한 영역 찾아내기
- 비즈니스 케이스 찾아내기
- 프로젝트 중 진행 상황을 척도화하기
Data Integrity를 평가 하기 위한 질문들
- 전체적인 data의 integrity는 어느정도 인가?
- 기록을 위한 시스템으로 어떤 시스템이 가동되고 있는가?
- 사업부 비즈니스 리더들의 HR데이터 metrics에 대한 신뢰도는 어느정도인가?
- 어떤 metrics가 가장 요구되는가(필요한가)?
- qualitative 질적인 보고서 작성을 위해 해당 데이터가 어느정도 사용될 수 있는가?
- Local HR이나 과거 감사에서 어떤식으로 측정된 데이터인가?
Compliance Risk 관리
- 예시
- 유럽: Privacy officer 필요, 동의서, 암호화 과정, 사용 범위 등 다양한 규제 확인 (참고: GDPR)
- 중국: Cyber security관련 법령 확인
- 리스크 분석 예시
예상되는 Risk | 적용범위 | 다음 단계 | |
Ex1 | GDPR 관련 (벌금 등) |
EU 소속 국가 |
변호사와 함께 동의 서류, 데이터 저장장치 및 전사 범위의 프로세스 리뷰 실시. HR시스템벤더와 시스템 암호화 컴플라이언스 관련 가이드 체크. 시스템 데이터 접근 가능한 모든 사람들에 대한 전수조사 |
Ex2 | 미국의 근무시간 관련 법 |
미국 각 주 |
OT, 점심 휴식등과 관련해 적용 가능한 교대근무 법률을 리뷰, 이용 가능한 Time writing 데이터를 비교함 |
(참고자료 출처: AIHR Academy)
'재미난 공부들 > People Analytics 공부 기록' 카테고리의 다른 글
생존분석: 시간에 따른 사건 발생(하지 않을)확률 모델(Survival Analysis for Modeling Singular Events Over Time) (1) | 2024.01.10 |
---|---|
AI인터뷰 - 사용자 경험(Candidate Experience)의 연계 (1) | 2023.06.06 |
퇴사 예측 Basic (LogisticRegression을 활용한 Attrition Prediction) (3) | 2022.06.06 |
[논문 읽기] 조직 내 '뇌과학적' 다양성 확립 Building a Neurodiverse Workforce (0) | 2022.05.29 |
회귀분석 Regression, HR에서의 활용 예시 (0) | 2022.04.19 |