클래스: 데이터 분석에서의 경력 기술 소개

기존 데이터 탐색 및 해석

클래스: 데이터 분석에서의 경력 기술 소개

기존 데이터 탐색 및 해석

- 사람 주변에 얼마나 많은 데이터가 있는지 생각해 본 적이 있습니까? 당신이 생각하는 것보다 더 많은 것이 있습니다. 생년월일, 이름, 인종, 민족과 같은 데이터가 있습니다. 직원 ID, 직책, 고용 날짜 또는 부서와 같은 업무 데이터가 있습니다. 이러한 데이터 포인트는 사람과 관련된 데이터를 다룰 때 고려하는 항목입니다. 이 데이터 중 일부는 생일과 같은 단일 값입니다. 그것은 그 자체로 가치이며 변하지 않습니다. 그런 다음 직장에서 새로운 승진을 할 때 변경될 수 있는 직책과 같은 다른 항목이 있습니다. 또한 심박수, 혈당, 혈압, 심지어 온도와 같은 실시간 데이터가 항상 발생합니다. 위치와 같은 지리적 데이터도 있습니다. 소셜 데이터뿐만 아니라 우리가 팔로우하는 브랜드, 구매하는 브랜드, 음식을 배달받는 빈도와 외식하러 나가는 빈도를 상상해 보십시오. 데이터는 항상 일어나고 있습니다. 데이터 분석가로서 우리가 직면한 과제는 잠재적인 데이터가 많고 모든 데이터를 실제로 사용할 수 없다는 것입니다. 또한 많은 동일한 데이터가 중복되며 경우에 따라 불완전하거나 부정확할 수도 있습니다. 우리 모두는 우리가 작업하는 데이터에서 신뢰할 수 있는 단일 소스를 찾고 있습니다. 우리는 실제로 데이터에 대해 보고할 때 정확하기를 원합니다. 몇 가지 예를 들어 보겠습니다. 회사에는 다양한 유형의 정보를 처리하는 데 사용되는 여러 소프트웨어 패키지가 있습니다. 그리고 그들은 종종 연결이 끊어집니다. 직원 데이터인 HR 유형 정보를 위한 인력 관리 소프트웨어가 있습니다. 우리는 마케팅 및 영업 관리 데이터를 가지고 있습니다. 이는 몇 가지 다른 시스템에 있을 수 있으며 판매와 관련된 직원 정보뿐만 아니라 고객 정보도 처리합니다. 고객이 영업 팀과 대화하는 것에서 회사에서 구매로 이동할 때 시작되는 소프트웨어도 있습니다. 해당 데이터는 구매에서 웨어하우스로 흐릅니다. 또한 손익과 같은 보고를 지원하는 트랜잭션을 처리하기 위해 회계 팀으로 전달되는 데이터도 있습니다. 이것이 의미하는 바는 데이터가 서로 다른 시간에 조직을 통해 흐른다는 것입니다. 시스템이 단절되는 경우가 많기 때문에 가장 정확한 정보를 가진 시스템을 찾는 것이 첫 번째 과제 중 하나입니다. 실제로 알 수 있는 유일한 방법은 조사를 시작하고 그 과정에서 질문하는 것입니다. 우리는 때때로 권한과 데이터의 민감성으로 인해 장애물에 부딪히게 됩니다. 예를 들어, 값을 확인하는 데 필요할 수 있는 데이터는 회계 소프트웨어에 저장되며 회계 팀만 해당 데이터에 액세스할 수 있습니다. 직접 액세스할 수 없다고 해서 완료된 것은 아닙니다. 그들에게 값을 제공할 수 있으며 해당 팀은 유효성을 검사하는 데 도움이 됩니다. 실제로 시스템이 연결되어 있든 없든 동일한 정보 기록을 보유해야 합니다. 영업 팀이 이번 달에 인보이스를 발행할 10만 달러가 있다고 보고하면 회계 소프트웨어는 10만 달러 상당의 인보이스를 반영해야 합니다. 균형이 맞지 않으면 고장이 발생한 위치를 파악해야 합니다. 데이터 분석가는 찾을 수 있는 데이터 유형에 대해 신중해야 합니다. 그런 다음 액세스할 수 있는 데이터를 찾고 보고서를 검증하기 위한 전략을 개발해야 합니다. 데이터는 모든 것에 나타나지만 데이터를 정확하게 취합하는 것이 우리의 임무라는 것을 기억하십시오.

목차