시민 데이터 과학자가 되기 위한 4가지 쉬운 단계

게시 됨: 2022-05-07

시민 데이터 과학자란 무엇입니까?

데이터 과학자의 훈련 없이 (일부) 데이터 과학자 수준의 작업을 수행할 수 있는 사람.

통계학 박사 학위가 없더라도 비즈니스 인텔리전스 소프트웨어를 사용하여 클러스터링, 세분화 및 고급 데이터 혼합을 수행할 수 있는 작업자.

다시 말해? 시민 데이터 과학자는 모든 비즈니스의 친근한 이웃 유니콘입니다.

공식적인 정의를 원할 경우 Gartner는 시민 데이터 과학자(CDS)를 "고급 진단 분석 또는 예측 및 처방 기능을 사용하지만 주요 업무 기능이 통계 및 분석 분야가 아닌 모델을 생성하거나 생성하는 사람"으로 정의합니다. "

많은 경우에 "통계 및 분석 분야 외부"는 CDS가 비즈니스 분석가임을 의미합니다. 수익을 증가시킬 수 있음) 및 필요(우리 데이터 과학자들은 계획 기간이 없는 교사만큼 과중함).

데이터 과학자들은 비즈니스를 보다 데이터 중심적으로 만들라는 요청에 점점 더 많은 부담을 가짐에 따라 시민 데이터 과학자는 다음 두 가지 주요 방법으로 비즈니스를 도울 수 있습니다.

  • 올바른 비즈니스 인텔리전스 소프트웨어를 사용하여 더 간단한 데이터 과학 작업을 수행함으로써 데이터 과학자의 부담을 줄일 수 있습니다.
  • 그들은 데이터 과학에 외부인의 비즈니스 측면 관점을 가져올 수 있습니다.

다행히도 시민 데이터 과학자가 되는 데 학위 또는 1년의 교육이 필요하지 않습니다. 작업이 필요하지만 이점이 작업을 가치 있게 만듭니다. 시민 데이터 과학자가 되는 데 관심이 있다면 그 길을 시작할 수 있는 4단계가 있습니다.

1. 더 많은 새로운 데이터 소스에 대한 액세스를 요청합니다.

동일한 오래된 보고서의 동일한 오래된 데이터를 처리하는 데 지쳤다면 시민 데이터 과학자가 가려움을 느낄 수 있습니다. 이제 감독자에게 일반 보고서에 포함되지 않은 데이터에 대한 액세스 권한을 요청할 때일 수 있습니다. 및 정보.

데이터 과학자가 아닌 사람들에게 데이터에 대한 액세스를 공개하면 시민 데이터 과학에서 파생되는 강점과 이점을 볼 수 있습니다. 데이터를 매우 독특한 시민 데이터 과학자 그룹으로 확장함으로써 IBM은 2016년 Wimbledon 토너먼트를 정보 라이브러리로 만들었습니다. 이 컴퓨터 대기업은 테니스 전문가들이 데이터 분석 프로그램인 Watson Analytics를 사용할 수 있도록 지원했습니다. 그 결과 선수들의 경기력에 대한 전례 없는 통찰력을 얻을 수 있었습니다. Watson Analytics는 공이 떨어진 위치만큼 작은 데이터 포인트를 사용하여 선수의 스타일이 변경되었는지 여부를 확인할 수 있었습니다.

데이터 과학 학위가 없는 사람들에게 접근 권한을 확장하는 것도 놀라울 정도로 쉬웠습니다. 실제로 데이터 과학자가 프로 수준 테니스의 복잡성을 이해하도록 훈련하는 것보다 데이터 과학 소프트웨어를 사용하도록 프로 운동 선수를 훈련시키는 것이 더 쉬웠습니다. 더군다나 전문가 수준의 지식을 가진 사람들이 접근하기 어려웠던 데이터 과학 분야에 기여할 수 있다는 의미였습니다.

2. 고급 분석 기능 및 스마트 데이터 검색과 함께 비즈니스 인텔리전스 소프트웨어를 사용하는 방법을 배웁니다.

새로운 통찰력을 위한 새로운 데이터 소스를 얻은 후에는 데이터 과학이나 통계 박사 학위가 없는 사람도 높은 수준의 데이터 과학을 가능하게 하는 도구를 사용하는 방법을 알아야 합니다.

시민 데이터 과학자가 될 수 있도록 소프트웨어에서 어떤 종류의 기능을 찾아야 합니까?

  • 고급 셀프 서비스 데이터 준비
  • 행동 분석
  • 그래프 분석
  • 위치 분석
  • 웹 분석
  • 스마트 데이터 검색

고급 셀프 서비스 데이터 준비는 이미 Sears가 비즈니스 인텔리전스 분석가를 시민 데이터 과학자로 전환하는 데 도움이 되었습니다. Sears는 Platfora의 빅 데이터 검색 소프트웨어 솔루션에 투자하여 400명의 분석가에게 액세스 권한을 부여했습니다. 결과적으로 분석가는 고객 세분화(일반적으로 고급 데이터 과학 작업)를 사용하여 Sears 웹 사이트에서 고객을 위한 제품 권장 사항을 개선할 수 있었습니다.

비즈니스 인텔리전스 공급업체 Alteryx는 복잡한 데이터 혼합을 수행하는 사용하기 쉬운 시각적 도구를 제공합니다. 다른 유형의 데이터(예: Excel 파일 및 Oracle 파일)를 통합하기 위해 새 데이터 세트를 생성하는 대신 Alteryx의 끌어서 놓기 기능을 사용하여 긴 데이터 과학 작업을 몇 번의 클릭으로 줄일 수 있습니다. 생쥐.

Platfora 및 Alteryx와 마찬가지로 Paxata의 소프트웨어는 고급 데이터 분석을 현실로 만듭니다. 나는 Paxata의 Farnaz Erfan과 이야기를 나누었습니다. 그는 고객 중 하나인 소비재 회사가 어떻게 분석가에게 박사 수준의 활동을 제공했는지 설명했습니다.

Paxata는 데이터 과학자의 도움이 필요 없는 "분석가를 위한 완전한 셀프 서비스 패러다임"을 만들었습니다. 이 회사는 재고, 공급 및 마케팅을 개선하기 위해 셀프 서비스 솔루션을 사용했습니다. 예를 들어 Paxata를 사용하면 "비즈니스 분석가가 운송 시간 데이터를 준비하는 데 걸리는 시간이 한 달에 5시간에서 1시간 미만으로 단축되었습니다." 비용 절감의 또 다른 원천은 "문제가 되는 이메일 주소를 식별하고 일치시켜 쿠폰 사기를 감지"하는 기능이었습니다.

고급 분석을 사용하는 방법을 배우면 많은 이점을 얻을 수 있지만 학습 곡선도 있습니다. 그렇다고 너무 압도적인 것은 아닙니다. Gartner의 추정에 따르면 속도를 내는 데 1~2주가 소요됩니다. 대부분의 공급업체는 일반적인 질문에 대한 답변이 포함된 교육, 자습서 및 커뮤니티 포럼을 제공합니다.

3. 거버넌스가 설정되었는지 확인

Mo' 액세스, mo'(데이터 거버넌스) 문제. 또는 거버넌스를 우선 순위에 두지 않는 한 그럴 있습니다. 더 많은 시민 데이터 과학자가 더 많은 데이터 세트에 액세스함에 따라 데이터가 잘못된 사람의 손에 들어갈 기회가 더 많아졌습니다.

데이터 과학 컨설팅 회사 Acculation의 CEO인 Werner Krebs는 "데이터 거버넌스가 절대적으로 중요합니다. "데이터가 가치 있다는 것을 이해하고 데이터 수집에 도움이 되는 도구와 프레임워크를 제공하도록 직원을 교육해야 합니다."라고 그는 말합니다. 다행스럽게도 Total Quality Management에서 ISO 9001, "다양한 6시그마 프레임워크"에 이르기까지 데이터를 구성하기 위한 여러 프레임워크가 있습니다.

Gartner는 데이터 거버넌스에 대해 유사한 강조점을 두고 있습니다. "데이터, 데이터 관계 및 적절한 사용을 이해하는 방법에 대한 지침과 마찬가지로 적절한 거버넌스가 중요합니다."

더 많은 사람들이 더 많은 데이터에 액세스할 수 있도록 하는 것은 많은 가치가 있지만 그러한 사람들은 데이터에 액세스하는 방법과 보안을 유지하는 방법을 이해해야 합니다(예: 보안되지 않은 공용 Wi-Fi가 있는 지역에서 민감한 문서를 읽지 마십시오 ).

4. 조직에 데이터 사용 방식을 감독하는 "보호자"가 있는지 확인하십시오.

시민 데이터 과학자와 같은 새로운 역할에는 이를 관리하기 위한 새로운 규칙과 역할이 필요합니다. 고급 데이터 준비를 통해 얻을 수 있는 이점은 확실히 비즈니스 전반에 걸쳐 재고하고 재구성할 가치가 있습니다. 즉, 이전 데이터 관리 역할을 제거하고 싶지 않습니다.

시민 데이터 과학자 시대의 데이터 관리에 대한 경험 법칙 중 하나는 걸스카우트의 오래된 노래로 요약됩니다. 다시 말해, 데이터 관리자 및 데이터베이스 관리자와 같은 역할을 유지하고 Gartner의 보호자 개념과 같은 새로운 역할을 추가하여 시민 데이터 과학자가 필요한 것을 책임감 있게 사용할 수 있도록 합니다.

Gartner는 "보호자" 역할을 "데이터가 산업화되고 안전하며 확장 가능하도록 보장하는" 사람으로 정의합니다. 다시 말해, 그들은 데이터 보안을 감독하고 시민 데이터 과학의 성공적인 사례가 전체 비즈니스에 채택될 수 있도록 하는 사람들입니다. 그들은 또한 전통적인 데이터 관리 역할(Gartner는 이들을 "운영자"라고 부름)과 새로운 방식으로 데이터를 사용하는 시민 데이터 과학자("혁신가") 간의 격차를 해소합니다.

시민 데이터 과학을 어떻게 활용했습니까?

시민 데이터 과학자의 역할을 하고 있습니까? 비즈니스가 비용을 절약하거나 수익을 창출하는 데 도움이 되는 고급 데이터 분석을 사용해 보셨습니까? 그렇다면 아래 의견에 알려주십시오!