경기나 스포츠가 있는 곳에는 항상 데이터가 존재합니다. 그것도 아주 많은 양의 데이터가 있죠.
슈퍼볼 경기를 예로 들면 미국인 2,320만 명(영문자료)이 베팅에 참여합니다. 영국 그랑프리 F1의 경우, 2018년에서 2022년 사이 베팅 참여율이 두 배 이상(영문자료) 늘었습니다. 종합 격투기를 비롯해 모든 경기에서 승률이 몇 번이나 바뀌는지 생각해보세요. 경기가 시작될 때 리드하던 팀이 2라운드에서는 질 확률이 높아져 새로운 베팅 금액이 쏟아져 들어옵니다.
매년 3월이면 미국 전역을 농구의 열기로 몰아넣어 ‘3월의 광란’이라 불리는 대학 농구 챔피언십(영문자료)이 열립니다. 미국의 성인 17% 이상에 해당하는 4,500만 명이 올해 대회에30억 달러 이상(영문자료)의 베팅을 할 것이라는 관측이 나오기도 했는데요.
누군가가 토너먼트 63개 경기의 승자를 모두 맞출 확률은 얼마나 될까요?
9.2경분의 1(영문자료)입니다. (1경은 0이 18개입니다.)
모든 스포츠 기반의 비정형 데이터(영문자료)에는 매우 견고하고 유연한 데이터 스토리지가 필요합니다. 이에 대해서는 나중에 설명하겠습니다. 먼저, 스포츠 베팅의 이면에 존재하는 데이터와 씨름하는 것이 왜 어려운지 살펴봅니다.
스포츠 베팅의 막대한 GDP
스포츠는 수십억 달러 규모의 산업으로, 영국의 DraftKings(영문자료), 인도의 Dream11(영문자료) 등 세계적으로 인기 있는 스포츠 베팅 플랫폼과 판타지 스포츠 리그를 포함하고 있습니다. 2022년 DraftKings는 전년도보다 10억 달러 증가한 20억 달러 이상의 수익(영문자료)을 올렸습니다.
글로벌 스포츠 베팅 시장은 총 836억 5천만 달러(영문자료)에 달하며, 2022년부터 2030년까지 연평균 10% 이상 성장해, 에너지 드링크 시장 규모와 맞먹을 전망입니다. 참여율이 매우 큰 시장이며 엄청난 기회를 제공합니다. 그러나 이를 완전히 활용하려면, 스포츠 기업은 빠르게 변화하며 유입되는 엄청난 양의 비정형 데이터를 처리할 수 있어야 합니다. 이는 슬램덩크처럼 호쾌한 일은 아닙니다.
스포츠와 비정형 데이터
골프를 생각해보세요. 골프는 ‘데이터’라는 단어를 들었을 때 바로 연상되는 스포츠는 아닙니다. 대부분의 사람들이 그린에서 얼마나 많은 일이 벌어지는지 깨닫지 못하기 때문입니다. 골프 토너먼트는 피치 각도, 피치 속도, 샷 정확도, 샷 거리, 날씨 데이터 등 모든 종류의 비정형 데이터를 사용해 퍼포먼스를 추적하고 확률을 실시간으로 계산합니다.
그리고 F1(Formula 1)이 있습니다. F1은 지구상에서 가장 데이터 중심적인 스포츠 중 하나(영문자료)입니다. 일반적인 F1 레이스 경기 막후에 존재하는 데이터의 양은 엄청납니다. 메르세데스-AMG 페트로나스(Mercedes-AMG Petronas) F1 팀 리더인 토토 울프(Toto Wolff)는 이렇게 말합니다.
“최고의 드라이버는 신뢰할 수 있는 데이터에 액세스할 수 있을 때만 역량을 발휘할 수 있습니다.”
일반적인 F1 레이스카에는 약 300개의 온보드 센서가 있으며 레이스가 열리는 주말당 1.5테라바이트의 데이터가, 시즌당 약 118억 개의 데이터 포인트가 생성됩니다. 이 방대한 데이터 풀은 예측 모델을 생성(영문자료)하는 데 사용됩니다. 이 모델은 과거 데이터를 종합하여 궁극적으로 차량(및 드라이버)의 성능을 향상시킬 수 있는 미세한 조정 사항을 권장해줍니다.
비정형 데이터는 스포츠 베팅 사용자들에게도 유용합니다. 브래드 피트가 주연을 맡은 머니볼(Moneyball)이라는 영화가 있습니다. 영화에서 야구 팀의 단장 브래드 피트는 순전히 경기 데이터만 가지고 선수의 가치를 수치화하여 팀의 성과를 향상시키는 방법을 알고 있는 천재적인 데이터 분석가를 영입합니다. 스포츠 베팅을 하는 사람들도 같은 데이터에 기반해 베팅을 할 수 있습니다. 예를 들어 특정 골프 선수의 6미터 퍼팅 정확도가 5.8미터 퍼팅 정확도 보다 현저히 낮을 수 있습니다. 야구에서는 선수들의 출루율, 안타 및 오류율에 대한 데이터를 모두 사용하여 경기 결과 예측의 정확도를 개선할 수 있습니다.
스포츠 베팅 플랫폼의 데이터 도전과제
베팅과 승률 외에도 스포츠와 관련해 많은 유형의 데이터가 있습니다. 이 모든 데이터는 미리 설정된 데이터 모델에 맞게 정렬되어 있지 않았기 때문에 ‘비정형’으로 간주됩니다. 따라서 기계가 읽고 분석에 사용할 수 있도록 열과 행으로 정렬해야 합니다.
비정형 데이터를 신속하게 처리하고 안전하게 저장하는 것은 매우 중요합니다. 예를 들어, 스포츠 베팅 플랫폼에서 참가자는 배당금을 받습니다. 이러한 배당금 지급은 빠르고 정확해야 합니다. 그렇지 않으면 스포츠 베팅 경험이 손상될 것입니다.
또한 스포츠 베팅 플랫폼에서 맞춤화된 실시간 할인 등을 제공할 수 있는 많은 기회가 존재합니다. 그 기회를 활용하려면 방대한 비정형 데이터를 처리하고 저장할 수 있어야 합니다.
이 모든 비정형 데이터를 처리하려면 견고하면서도 유연한 플래시블레이드//E(FlashBlade//E) 같은 데이터 스토리지 인프라가 필요합니다. 데이터를 제대로 보관하지 못하면 사용할 수 없고, 사용할 수 없으면 스포츠 데이터를 수익화 하거나 기회를 활용할 수 없습니다. 좋은 기회를 놓칠 수 있습니다.
고객 성공 사례: 스포츠레이더
스포츠레이더(Sportradar)는 출판사, 국내 및 국제 스포츠 연맹, 미디어 기업을 위해 스포츠 데이터를 수집하고 분석하는 스위스 기업입니다. 이 기업은 자사의 플랫폼을 위한 스토리지 인프라의 성능과 관리를 개선하기 위해 퓨어스토리지의 플래시 스토리지 솔루션을 사용했습니다.
플래시어레이(FlashArray)는 서버에 데이터를 신속하게 전달해주고, 퓨리티 액티브클러스터(Purity ActiveCluster)는 데이터 보호를 위한 동기식 미러링을 제공하여 비즈니스 연속성 요구사항을 충족해줍니다. 이를 통해 스포츠레이더는 특히 새로운 고객을 추가할 때 상당한 시간과 노력을 절약할 수 있었습니다.
샌프란시스코 자이언츠가 데이터를 활용하는 방법
야구는 방어율에서 홈런율, 출루율에 이르기까지 많은 데이터가 거론되는 경기입니다. 샌프란시스코 자이언츠는 퓨어스토리지를 사용해 경기장의 여러 중요 시스템에서 경쟁력을 확보하고 있습니다. 이 팀은 또한 선수의 생체 역학 분석 데이터를 사용해 오프 시즌에도 선수들의 건강을 관리하고 있습니다(영문자료).
프로 스포츠에서 데이터가 사용되는 또 다른 영역이 있습니다. 바로 고객 경험 개선(영문자료)입니다. 자이언츠는 또한 퓨어스토리지로 이력 데이터 분석을 최대한 활용하여 맞춤화된 티켓 할인, 인센티브, 테마 나잇 및 이벤트 참여 등 팬 경험을 개선하고 있습니다.
자이언츠가 퓨어스토리지로 어떻게 경기장 안팎에서 혁신을 이루는지 보다 자세히 알아보세요..
퓨어스토리지: 스포츠 애플리케이션을 위한 슬램 덩크
경제적이고 유연하며 안전하고 확장 가능한 퓨어스토리지의 플레시블레이드//E는 모든 스포츠 애플리케이션에 필요한 데이터 스토리지를 제공합니다. 플레시블레이드는 파일 및 오브젝트 저장소 워크로드와 관련된 디스크의 복잡성을 제거하고, 장기적으로 가장 낮은 비용으로 업계 최고의 사용자 경험을 제공합니다.
플래시블레이드//E의 이점
- 뛰어난 효율성: 증가하는 비정형 데이터를 쉽게 관리하고 에너지, 공간 및 비용을 절약하면서 비정형 데이터의 가치를 극대화할 수 있습니다.
- 편리한 확장성: 플래시블레이드의 스케일 아웃 데이터 저장소는 페타바이트급 워크로드에 최적화되어 있어 복잡성이나 추가 관리 리소스를 추가하지 않고 운영 오버헤드를 줄일 수 있습니다.
- 지속적인 혁신: 제어 기능이 추가된 플래시블레이드는 클라우드와 같은 간단함과 유연성을 제공하므로 선도적인 하드웨어와 소프트웨어를 원활하게 통합할 수 있습니다.