NYC Taxi Data Blunder는 어떤 유명인이 팁을 주지 않는지 그리고 누가 스트립 클럽을 자주 방문하는지 알려줍니다.

익명의 여행 데이터를 파파라치 사진과 상호 참조함으로써 개인 정보 보호 조사에서 Bradley Cooper가 운전자에게 지불한 금액을 알 수 있습니다.

NYC Taxi Data Blunder는 어떤 유명인이 팁을 주지 않는지 그리고 누가 스트립 클럽을 자주 방문하는지 알려줍니다.

뉴욕시 택시 및 리무진 위원회는 일반적으로 데이터를 공개하지 않습니다. 그러나 정보의 자유 요청 덕분에 자칭 데이터 중독자 크리스 훙 하차 시간, 픽업 위치, 요금, 팁 금액 등을 포함하여 1억 7,300만 택시 여행에 관한 20GB의 데이터를 얻을 수 있었습니다. 모든 종류의 멋진 데이터 시각화 프로젝트 . Uber와 같은 민간 회사는 이러한 종류의 정보를 사용하여 고객이 어디에서 내리기를 원하는지 정확하게 예측할 수도 있습니다.



그런데 택시위원회가 실수한 것 같은데, Vijay Pandurangan이 지적한 바와 같이 . 그들이 택시 메달과 면허 번호를 익명화하려고 시도한 것으로 보이지만 Pandurangan은 약 1시간 만에 간과된 취약점 덕분에 전체 데이터 세트의 익명화를 해제할 수 있었습니다. (그는 그가 어떻게 이것을 할 수 있었는지에 대해 설명합니다. 이 게시물에서 .)

별도의 실험에서 Neustar 개인 정보 보호 연구원 Anthony Tokar는 데이터를 사용하여 으스스한 개인 정보 실험-슬래시-주의 이야기에서 어떤 종류의 피해가 발생할 수 있는지 보여주었습니다. 예를 들어 Tocker는 특정 시간에 특정 택시를 탔던 유명인을 식별할 수 있었습니다. 택시에서 내리는 스타의 사진을 Google에 공개하기만 하면 됩니다. 유명 가십 블로그에 게시된 사진과 택시 위원회의 데이터를 상호 참조함으로써 그는 별이 찍은 놀이기구에 제로 인 Bradley Cooper와 Jessica Alba처럼 그들이 지불한 금액과 같은 정보를 수집합니다. 토카는 다음과 같이 씁니다.

좋아하는 일을 하면서 돈을 버는 것

브래드 쿠퍼의 경우, 우리는 그의 택시가 그를 그리니치 빌리지로 데려갔으며, 아마도 멜리베아에서 저녁을 먹기 위해 그를 데려갔고, 기록된 팁 없이 .50를 지불했다는 것을 알고 있습니다. 아이러니하게도 그는 사진가들을 피하기 위해 택시에 탔습니다! 우리는 또한 Jessica Alba가 자신의 호텔인 Trump SoHo 밖에서 택시에 탔으며 다소 놀랍게도 9달러 요금에 팁을 추가하지 않았다는 것도 알고 있습니다. 이제 이 정보는 비교적 무의미하고 특히 1년 후이지만 이전에는 공개되지 않은 정보를 공개했습니다. 일반적으로 이러한 사진과 함께 제공되는 추측성 충동을 고려할 때(저를 믿으세요, 저도 압니다!), 유명 저널리스트는 이 추가 정보를 알게 되어 매우 기쁠 것입니다.



이제 유명인의 팁이든 아니든 무해한 블로그 사료가 될 수 있습니다. 시스템에 기록되지 않은 현금 팁을 남겼을 수도 있습니다. 그러나 Tocker는 이 기회를 통해 이 데이터가 당신과 나 같은 평범한 사람들을 어떻게 노출시킬 수 있는지 보여주었습니다.

Tocker는 GPS 좌표를 사용하여 자정과 오전 6시 사이에 Hell's Kitchen에 있는 스트립 클럽을 오가는 택시 트래픽을 추적할 수 있었습니다. Larry Flynt의 Hustler 클럽 고객이 거주할 수 있습니다. 이 분석의 잠재적 결과는 아무리 강조해도 지나치지 않다고 Tokar는 말합니다. 무료로 얻을 수 있고 쉽게 만들 수 있는 이 지도를 사용하면 각 지점에 대해 가능한 위치가 소수에 불과하기 때문에 많은 Hustler 고객이 어디에 거주하는지 알 수 있습니다.

숫자 666 의미

여기에서 더 읽어보세요.



업데이트: 이 기사는 Pandurangan이 유명인의 택시 여행을 식별하는 데 관여하지 않았음을 명확히 하기 위해 업데이트되었습니다. 그의 실험은 택시 위원회의 데이터가 어떻게 익명화될 수 있는지를 보여주었을 뿐입니다.

[시간/시간: 학제간 인터넷 연구소 ]