수질 고문 – 분석 유추가 너무 먼 다리가 됨

물방울 분석

물과 같은 데이터는 다양한 형태로 제공됩니다. 인간의 마음은 우리에게 오는 대부분의 데이터를 걸러 내도록 진화했습니다.

눈과 귀를 열면 데이터가 어디에나 있습니다. 벽의 색, 에어컨 소리, 이웃 커피의 냄새는 마치 습기처럼 취급됩니다. 물은 항상 공기 중에 있지만 그것에 많은 관심을 기울이는 것은 유용하지 않습니다.

물이 안개로 응축되면 눈에 띄게 만들고 주변 세계를 이해하기가 더욱 어려워집니다. 불완전한 데이터 세트, 손상된 데이터, 잘못된 과학, 잘못된 결론 및인지 적 편견은 모두 당신을 안개 속에서 길을 잃게 만듭니다.

데이터는 비처럼 떨어집니다. 조금만 있으면 매우 만족스럽지 않습니다. 차를 더럽 히고 대화를 혼란스럽게 할만큼 충분합니다. 누군가가 모호한 출처에서 수집 한 임의의 데이터 포인트를 뿜어 내면서 안경의 얼룩을 지우는 자신을 발견합니다.

  • 부실한 물 얕은 연못에서는 위험합니다. 신뢰할 수없는 공급원에서 수집 된 데이터는 정리되거나 정규화되지 않고 정체 상태로 남아 있으면 쉽게 잘못된 결론을 내릴 수 있습니다.
  • A 꾸준한 물방울 물은 수통을 채우거나 삼림 생태계를 유지하기에 충분할 수 있습니다. 단 XNUMX 개의 데이터 포인트 (보낸 이메일 수, 열림 수, 클릭 수)만으로 마케팅 프로그램을 유지할 수 있습니다.
  • A 건강한 흐름 작은 개울 형태의 데이터가 목욕에 사용될 수 있습니다. 지속적인 데이터 흐름을 통해 벤치마킹 및 기록 비교가 가능합니다. 방문 페이지 최적화는 안정적인 전환 데이터로 달성 할 수 있습니다.
    A 겸손한 강 제 분소에 동력을 공급하여 나무를 자르거나 밀을 갈 수 있습니다. 추천 엔진은 쇼핑 카트의 가치를 높이기 위해 소수의 지류로부터 신뢰할 수있는 기여 만 필요합니다.
  • A 폭포 의 거대한 물레 방아를 추진할 수 있으며 충분한 정보의 유입이 실시간 동적 콘텐츠 시스템을 구동 할 수 있습니다.
  • A 충분히 넓고 깊으면 전체 운송 산업을 지원할 수 있습니다. 충분한 데이터는 광고 네트워크, 로열티 카드 프로그램 데이터 애그리 게이터 및 데이터 브로커의 쿠키 모음 형태로 바지선과 화물선을 떠 다닐 수 있습니다.

데이터가 예상 된 시간에 예상 된 양으로 도착하면이를 캡처하고 채널링하여 사용할 수 있습니다. 관개 시스템, 댐 및 저수지는 통제 감을 제공하고 운하, 자물쇠 및 댐이있는 지속적으로 확장되는 인프라 건설을 허용합니다. 데이터웨어 하우스는 덜 신뢰할 수있는 흐름을 기반으로 구축되었습니다.

청결 함은 경건함 옆에있다

깨끗한 물은 삶의 성공, 관개, 발전소 운영 등에 필수적입니다. '깨끗한'의 정의는 목적에 따라 바뀔 수 있습니다. 발전소를 냉각시키는 해조류가 물에 있으면 괜찮고 식수에 비소가 10 억분의 XNUMX 이상이면 허용되지 않습니다.

데이터는 동일합니다. DM 신청서에서, 당신이 의사에게 우편을 보내지 않는 한, 당신이 그 사람의 직함 (Mr., Mrs., Ms.)을 가지고 있는지 여부는 중요하지 않습니다. 그러나 더러운 데이터는 매번 당신을 넘어 뜨릴 것입니다.

미국 최고 데이터 과학자로서 DJ 파틸, XNUMX 차 CTO Summit에서“처음부터 데이터를 깨끗하게 유지하는 방법에 대해 생각하고 있지 않다면 f ^ ¢ & ed입니다. 보증합니다. 사실 후에 그것을 정리하는 것은 적어도 몇 달이 걸릴 것입니다.”

물을 끓는점까지 가열하면 전체 산업 혁명을 일으킬 수 있습니다. 데이터도 같은 일을하는 것 같습니다. 컴퓨터가 저장하고 계산할 수있는 순간부터 데이터는 저장 장비가 생성 될 수있는만큼 빠르게 수집되었습니다.

데이터 레이크

이러한 지류의 데이터가 제 분소 엔진을 통해 흘러 나오면 모든 데이터가 댐 뒤의 호수에 저장됩니다. 데이터가 통제 된 방식으로 유출됨에 따라 데이터 산업의 터빈에 동력을 제공합니다. 구글과 페이스 북과 같은 이름을 가진 거대한 데이터 처리 엔진. 여기에는 가뭄이 없을 것입니다.

그리고 마지막으로, 분석가가 잠수하기를 기다리는 깊은 물 웅덩이가 있습니다. 스쿠버 장비와 창총을 손에 들고 분석가는 깊은 곳을 조사하고 새로운 땅을지도하고 새로운 종을 발견합니다. 데이터 탐색기가되는 것은 매우 흥미로운시기입니다.

그래서 그들 중 많은 사람들이 이메트릭 서밋 다음 기회는 보스턴에서 2002 년 27 월 1 일부터 2015 월 XNUMX 일까지입니다.

eMetrics Summit 등록

다리 너무 멀리

다음 그랜드 캐년을 개척하는 데 데이터의 힘은 ​​어떻습니까? 구조화 된 데이터의 빙하가 녹는 것은 어떻습니까? 점점 더 프라이버시를 의식하는 세상에서 폐수를 어떻게 처리할까요?

이것들은 다른 시간에 대한 질문이며 다리 아래의 물입니다.

당신은 어떻게 생각하십니까?

이 사이트는 Akismet을 사용하여 스팸을 줄입니다. 댓글 데이터 처리 방법 알아보기.