누가 (또는 무엇이) 3월의 광기 우승자를 가장 잘 예측합니까?

March Madness 승자를 예측할 때 전문가, 알고리즘 또는 군중 중 누가 가장 잘 알 수 있습니까?

누가 (또는 무엇이) 3월의 광기 우승자를 가장 잘 예측합니까?

추정 미국인의 45% 올해 NCAA 토너먼트 브래킷을 채울 것입니다. 투표한 사람 수보다 많다. 2010년 중간선거 . 그리고 시계가 밤 12시 15분을 가리킬 때까지. 3월 15일에 실제 공이 실제 바구니에 던지기 시작하면 우리 각자는 3월의 광기 예측을 할 때 가장 똑똑한 남자 또는 여자인 척 할 수 있습니다.



그러나 누가 (또는 무엇을) 가장 잘 알고 있습니까? 지난 달에 우리는 오스카 수상자를 예측하는 알고리즘, 사회 및 전문가 접근 방식을 살펴보고 전문가 의견과 알고리즘 분석의 조합이 가장 성공적인 전술이라는 결론을 내렸습니다. 이제 미국이 가장 좋아하는 예측 난교인 March Madness 전날에 우리는 다시 질문을 던집니다. 최고의 예측자는 로봇인가, 작가인가, 아니면 일반 대중인가?

돈 주고 대학농구 보는 사람들은 자기들이 뭘 하는지 알겠죠? 그러나 CBS Sports의 전문 분석가 중 한 명을 제외하고는 모두 켄터키주가 모든 것을 이길 것으로 기대 , 예측은 챔피언십 게임을 넘어서 크게 다릅니다. 게다가, 전문가들은 화를 선택할 가능성이 더 높을 수도 있습니다. 왜냐하면 그들은 세상의 나머지 부분이 알지 못하는 것을 알고 돈을 받기 때문입니다. 그리고 그것을 증명하는 더 좋은 방법은 벽에 이상한 화를 던지고 무엇이 붙어 있는지 확인하는 것입니다.
문제는 화를 내기 마련이지만 일반적으로 우리가 예측하는 화는 아니라는 것입니다. 에 의해 수행된 연구에 따르면 인디애나대학교(남부지역 4번째 시드) , 그건 그렇고), 스포츠 전문 지식에 관계없이 선발위원회의 시드를 신뢰하고 제로 업셋을 선택하면 동등하거나 더 나은 성공률을 얻을 수 있습니다. 하지만 재미가 없기 때문에 몇 가지 다른 접근 방식을 살펴보겠습니다.



두 번째 옵션은 군중의 지혜를 신뢰하는 것입니다. 에서 블로거 후피즘 베팅 정보 서비스에서 데이터를 수집했습니다. 스포츠 인사이트 각 팀에 대한 실제 베팅의 백분율을 표시합니다. 그러나 데이터는 실제 베팅을 기반으로 하기 때문에 사이트에는 이미 팀이 결정된 초기 게임에 대한 예측만 포함됩니다.



그래서 알고리즘 접근 방식을 사용할 수 있으며 Danny Tarlow와 Lee-Ming Zen보다 더 많은 컴퓨터 기반 예측 모델을 본 사람은 거의 없습니다. 많은 사람들과 마찬가지로 Tarlow와 Zen은 연간 NCAA 토너먼트 풀을 운영합니다. 그러나 그들의 독특한 점은 각 항목이 기계로 컴파일해야 함 인간의 판단을 고려하지 않고.

토론토 대학의 컴퓨터 공학 박사 과정 학생인 Tarlow는 3년 전 두 가지 생각을 했습니다. 먼저 Netflix 챌린지에서 사용된 것과 유사한 추천 시스템을 구축하는 작업을 하고 있었습니다. 둘째, 나는 그 해에 대학 농구에 관심을 기울이지 않았지만 몇 명의 친구들과 함께 수영장에 대한 브래킷을 채워야했습니다. 어느 시점에서 내가 코딩한 것과 똑같은 추천 알고리즘을 사용하여 브래킷 예측을 할 수 있다는 사실에 놀랐습니다.

Tarlow는 계속해서 작년 경쟁에서 컴퓨터가 인간과 어떻게 경쟁했는지 설명했습니다. 우리는 세 가지 인간적인 기준선을 포함했습니다. 항상 더 높은 시드를 선택하는 것, Nate Silver가 예측한 브래킷, Lee의 개인 브래킷입니다. 그 분야에서 기계가 이겼습니다. (초보자의 경우, 뉴욕 타임즈 ' Nate Silver는 까치발 매년 인간과 컴퓨터 기반 시스템을 결합합니다.)



Tarlow와 Zen 모두 각 알고리즘 접근 방식의 성공률은 크게 다를 수 있지만 컴퓨터는 매년 개선되고 있다는 데 동의합니다. 접근 방식과 설정이 확실히 더 정교해지고 있다고 Zen은 말했습니다. 그러나 그때에도 우리는 표면을 긁고 있을 뿐입니다.

Tarlow는 아직 갈 길이 멀다는 데 동의했습니다. 나는 은행 계좌를 개설하지 않고 아직 라스베가스로 향하지 않았다고 말하겠다”고 말했다.

브래킷에 대한 약간의 로봇 지원을 받기 위해 고유한 알고리즘을 만들 필요가 없습니다. 무료 컴퓨터 기반 예측 모델이 많이 있습니다. 숫자불 NS 파워 랭크 (매력적인 시각화로 예측을 표시합니다). 그러나 인간이든 아니든 대부분의 예측가가 동의하는 한 가지가 있다면 스마트 머니가 챔피언십 트로피를 집으로 가져갈 전체 1위 켄터키주에 있다는 것입니다. 그런 다음 다시 ESPN은 전체 1위 시드가 한 번만 이겼다 위원회가 8년 전에 그 구분을 나눠주기 시작했기 때문입니다.



이 모든 것이 우리가 이미 비밀리에 알고 있었던 것을 드러냅니다. 토너먼트 전 자존심이 우리에게 다르게 말하려고 해도 말입니다. 스포츠 예측에는 사람이 아무리 지식이 풍부하고 알고리즘이 얼마나 발전했더라도 완벽한 방법은 없습니다. 그러니 미국이여, 당신의 브래킷에 대한 고뇌를 멈추고 일을 다시 시작하십시오.

[ 이미지: Flickr 사용자 에릭 찰튼 ]