Concours national d’études de cas de l’INCASS 2019

> English

Offrir une meilleure expérience aux clients de BC Ferries par analyse de données et prévision des retards

Élargissez vos compétences en statistique, en collaboration et en résolution de problèmes en vous inscrivant au concours national d’études de cas de l’Institut canadien des sciences statistiques (INCASS) ! Ce concours invite les étudiants à mettre leurs connaissances à l’épreuve pour résoudre un problème réel à l’aide d’un ensemble de données sur les activités de la société BC Ferries. Les organisations sont à la recherche d’étudiants qui possèdent des compétences en résolution de problèmes réels. Ce concours vous permettra d’acquérir une expérience précieuse qui vous permettra d’être en meilleure position pour entreprendre une fructueuse carrière en statistique.

À propos du concours

Le concours national d’études de cas de l’INCASS est un projet destiné aux étudiants inscrits à des programmes de premier cycle et des programmes de cycle supérieur dans des universités canadiennes. Le concours entre les étudiants consistera à établir des prévisions statistiques. Les données à utiliser pour le concours seront accessibles le 3 septembre, et les étudiants pourront soumettre leurs solutions en ligne jusqu’au 3 octobre. Les étudiants peuvent s’inscrire au concours de l’INCASS à compter du 3 septembre. L’inscription en ligne sera possible jusqu’au 27 septembre. L’Université Carleton, l’Université Concordia, l’Université MacEwan, l’Université Simon Fraser et l’Université du Nouveau-Brunswick organiseront des concours régionaux comportant des prix en argent attribués au sein de leur corps étudiant respectif aux étudiants dont la solution sera jugée gagnante. Les gagnants des compétitions régionales seront invités à participer au concours national annoncé par affichage à l’Université Simon Fraser à Burnaby, en Colombie-Britannique, au siège national de l’INCASS, le 2 novembre.

Inscrivez-vous ici : https://docs.google.com/forms/d/e/1FAIpQLSfTF2nIlMfp2RmWjsRycuZdLEeIuzTtiYZtueuYbaUB7ZiwiA/viewform
et rejoignez le concours à Kaggle https://www.kaggle.com/t/8c754ed3314b4fe2a9d34e0659d3c383

Pourquoi participer?

Ce marathon d’analyse de données vous offre une occasion unique de perfectionner vos compétences en résolution de problèmes et d’élaborer des solutions créatives à un problème réel, des compétences qui sont grandement recherchées par toutes les organisations. En plus de pouvoir travailler en équipe, vous perfectionnerez vos compétences en présentation lorsque vous présenterez vos solutions à nos juges. Sans oublier que les gagnants se voient offrir une entrevue avec Statistique Canada pour un poste à temps plein ou un poste d’étudiant dans le cadre du programme coopératif, de même qu’un prix en argent.

Prix

  • Les deux équipes gagnantes de chaque concours régional gagneront $300.
  • Au concours national, les prix en argent seront : première place – $600, deuxième place – $300, troisième place – $150.
  • Les gagnants se verront offrir une entrevue avec Statistique Canada pour un poste à temps plein ou un poste d’étudiant dans le cadre du programme coopératif.

Dates à retenir

  • 3 septembre 2019 : Diffusion de l’ensemble de données et début de la période d’inscription en ligne
  • 27 septembre 2019 : Inscription des équipes pour les concours régionaux se termine
  • 2 octobre 2019 : Date de remise des prévisions en ligne
  • Concours régionaux :
    • Université Carleton – 9 octobre 2019, 16 h 00 à 19 h 00
    • Université Concordia – 9 octobre 2019, 15 h 30 à 19 h 00
    • Université MacEwan – 4 octobre 2019, 15 h 30 à 19 h 00
    • Université du Nouveau-Brunswick – 9 octobre 2019, 16 h 00 à 19 h 00
    • Université Simon Fraser – 8 octobre 2019, 16 h 00 à 19 h 00
  • 2 novembre 2019 : Concours national à l’Université Simon Fraser

Admissibilité

Tous les étudiants inscrits à un programme de premier cycle et de cycle supérieur d’une université ou d’un collège canadien peuvent participer à ce concours. Les personnes qui ne sont pas inscrites à un programme de premier cycle ou de cycle supérieur peuvent tout de même participer au concours, mais elles ne seront pas admissibles aux prix en argent ou au processus de sélection des gagnants dans le cadre des concours régionaux ou du concours national annoncé par affichage.

Le défi

Les participants à ce concours national d’études de cas auront pour défi de prévoir les retards dans les horaires des traversiers de la société BC Ferries aux ports de Vancouver. L’ensemble de données comprend 61 880 traversées en mer effectuées entre les mois d’août 2016 et de mars 2018. L’ensemble de données est divisé en un ensemble de données d’entraînement comprenant 80 % des traversées en mer (soit 49 504 traversées entre août 2016 et novembre 2017) et un ensemble de données d’essai comprenant 20 % des traversées (soit 12 376 traversées entre novembre 2017 et mars 2018). La tâche consiste à établir des prévisions de façon à déterminer si chaque traversée de l’ensemble de données d’essai a été retardée ou non. Diverses covariables sont fournies pour chaque traversée (date, heure de départ, port de départ, port d’arrivée, nom du navire, etc.). Ces covariables sont décrites plus en détail dans la section Données ci-dessous. En plus de ces covariables, certaines données sur la météorologie et le trafic sont fournies.

Dans le cadre des concours régionaux et du concours national annoncé par affichage, les étudiants seront jugés en fonction de la précision de leurs prévisions des retards (pourcentage exact), ainsi que d’un rapport dans lequel ils présenteront leurs méthodes et leurs résultats, et d’autres renseignements sur les données découlant de leur analyse.

Les données

L’ensemble de données sur les traversiers comprend des enregistrements sur 61 880 traversées effectuées entre les mois d’août 2016 et de mars 2018 en provenance et à destination de l’un des ports suivants : Horseshoe Bay, Swartz Bay, Tsawwassen et Departure Bay. Les renseignements suivants sont fournis pour chaque traversée :

  • Nom du navire
  • Heure de départ prévue
  • Port de départ
  • Port d’arrivée
  • Date (y compris le jour de la semaine et le jour de l’année)

Pour les 49 504 traversées des données d’entraînement, la durée réelle de la traversée est fournie, de même qu’un indicateur indiquant si la traversée a été retardée ou non. Pour les 12 376 traversées des données d’essai, la durée réelle de la traversée et l’indicateur de retard ne sont pas fournis; il revient aux participants de prévoir l’indicateur de retard (c.-à-d. si la traversée a été retardée ou non).

Une série chronologique sur la température et l’humidité au port de Vancouver est également fournie, ainsi qu’une série chronologique sur la température, l’humidité, la pression, la vitesse du vent et la direction du vent au port de Victoria. Une série chronologique de données ordinales sur le volume de trafic provenant du pont Lions Gate est également fournie (le trafic étant mesuré en fonction d’une échelle de 1 à 5). Ce pont relie le centre-ville de Vancouver à North Vancouver, et constitue une artère importante vers la gare maritime de Horseshoe Bay.

De plus amples détails sur ces données seront publiés au moment de la diffusion des données le 3 septembre. Ces données sont du domaine public et peuvent être redistribuées ou modifiées.

Règlements du concours

  • Les participants peuvent s’inscrire en équipe d’au plus trois personnes.
  • Vous pouvez utiliser des ressources bibliothécaires, des logiciels, des langages de programmation ou toute autre méthode dans le cadre de ce concours.
  • Vous pouvez utiliser du code que vous trouvez sur Internet, pourvu que vous respectiez les critères suivants :
    • le code est accessible en vertu d’une licence ouverte (p. ex., vous pouvez utiliser tout ce qui provient de http://stackoverflow.com);
    • vous mentionnez les sources externes que vous avez utilisées en commentaire dans votre code.
  • Vous pouvez utiliser du code écrit par d’autres participants qui ne font pas partie de votre équipe, pourvu que vous respectiez les conditions suivantes :
    • vous avez obtenu l’autorisation de ces personnes d’utiliser le code;
    • vous mentionnez ces personnes comme une source que vous avez utilisée en commentaire dans votre code.
  • Vous pouvez demander de l’aide et des conseils à des professeurs, à des superviseurs ou à d’autres personnes externes au concours, mais l’intégralité de votre travail doit être exécutée par votre équipe.

Partenaires

Comments are closed.