Start wrangling your data by following the 6 steps of the process

​|  Trifacta Wrangling Steps

트리팩타는 데이터 저장 및 처리 환경과 해당 시스템에서 운영되는 시각화, 통계 또는 머신-러닝 도구 사이에 위치합니다. 트리팩타 플랫폼은 이들 환경에서 운영되는 제품 및 기술이 변화하여도 변화된 기술을 활용할 수 있도록 개방적이고 적응력이 있도록 설계되었습니다.
  • 데이터 타입, 컬럼-단위 프로파일, 인터렉티브 퀄리티-바 및 히스토그램 등으로 데이타 형상 및 품질 이슈를 시각적으로 바로 표시하며 변형 프로세스에 대한 가이드 제공 

  • 데이터 포맷 또는 스키마 변경과 관련된 내용으로써, 칼럼 분할, 피벗팅 및 필드 삭제 등의 기능 포함 

  • Predictive Transformation을 사용 시 작업중인 데이터와 데이터에 적용된 상호 작용 유형을 기반으로 제시된 최적 변환방법 이용 가능

  • 누락되거나 비정상적인 값 또는 데이터 포맷이 일치하지 않는 값 등, 데이터 품질 문제를 자동으로 식별

  • 이들 값을 수정하거나 삭제하기 위한 적절한 변환을 마우스 클릭으로 실행 가능

  • 통상적으로 분석을 중단시키는 null 값을 단 한 번의 클릭으로 분리하고 다른 값으로 대체 가능

  • 비즈니스 의사 결정에 필요한 대부분의 데이터는 여러 파일에 분산 될 수 있으며, 따라서 필요한 모든 인-사이트 생성을 위해 여러 데이터 소스를 결합하고 집계하여 기존 데이터 셋을 보완.

  • 트리팩타의 데이터 보강 기능을 사용하면 데이터 사전에 대한 조회를 쉽게 실행하거나 서로 다른 데이터 세트를 매우 쉽게 조인 가능.

  • 트리팩타의 지능형 조인추론은 명령을 입력하는 대신 머신-러닝을 사용하여 다양한 데이터 세트에서 적절한 조인 키를 신속하게 식별 함.

  • 변형과정에서 수정되지 않은 데이터가 있거나 일치하지 않는 경우 등 결과물을 배포하기 전  데이터 세트가 의도 한 구조와 내용을 가지고 있는지 검증

 

  • 사용자는 트리팩타 랭글링 작업 결과보기를 이용하여 전체 데이터 변형과정에서 데이터 셋에 적용된 최종 변형 결과를 미리 확인

  • 앞서 기술된 5단계의 랭글링 단계 완료 후 분석에서 사용하기 위해  랭글링 결과물 배포. 

  •  

  • 배포가 완료되면 비즈니스 분석가는 랭글링된 데이터를 활용하여 보다 다양한 통계, 분석 및 데이터 시각화 응용 프로그램으로 의사결정 및 인-사이트 생성.

  • 조직 전체 데이터 사용이 확대되고 비즈니스 데이터의 잠재적 가치 향상.

개인정보 보호 정책 준칙 | Terms of Use | 

데이터브릭 주식회사 

06234 서울특별시 강남구 역삼로 234 (뉴튼플라자 빌딩 4층)

전화 : 02. 553.5230, 팩스: 02.553.5235 ,사업자 등록번호 : 672-81-00181

www.databrick.co.kr