Bulletin INCASS
Faire progresser la recherche en sciences statistiques au Canada
Institut canadien des sciences statistiques
CANSSI
Retraite INCASS à Banff, septembre 2015 (Crédit photo : Elyssa Bingham)


Retraite INCASS à Banff

Un groupe de personnes concernées de près par les activités de l'INCASS s'est réuni du 25 au 27 septembre à BIRS pour discuter et planifier les orientations scientifiques futures de l'institut. L'ordre du jour pr&ecaute;voyait des présentations et des séances de remue-méninges. La réunion s'est conclue par une session dans laquelle la voie à suivre a été tracée, avec l'identification des objectifs à court, moyen, et long terme. Un rapport sur cet atelier sera bientôt disponible.


Dates d'échéances à venir

  • le 5 janvier 2016 : RSVP pour la séance d'information en ligne pour les PRCs
  • le 20 janvier 2016 : Séance d'information en ligne pour les PRCs
  • le 31 janvier 2016 : Appel de candidatures pour les bourses postdoctorales INCASS
  • le 15 février 2016 : Date limite de réception des propositions de conférences ou d'ateliers
  • le 30 avril 2016 : Date limite pour les lettres d'intention pour les PRCs


Nouveaux membres du Conseil d'administration de l'INCASS

L'INCASS accueille Jiguo Cao et Liqun Wang au Conseil d'administration. Ils sont les premiers représentants des membres institutionnels. Jiguo Cao est titulaire de la Chaire de recherche du Canada en sciences des données et professeur agrégé au Département de statistique et sciences actuarielles à l'Université Simon Fraser. Liqun Wang est professeur de statistique à l'Université du Manitoba. Les deux siègeront au Conseil jusqu'à juin 2016.

Parmi les nouveaux visages au Conseil,on compte aussi Martin Barlow de UBC et Directeur intérimaire de PIMS, Yogendra Chaubey de l'Université Concordia, Charmaine Dean de l'Université Western (Vice-présidente du Conseil), Arnoldo Frigessi de l'Université d'Oslo et directeur de BigInsight, Chad Gaffield de l'Université d'Ottawa et ancien président du Conseil de recherches en sciences humaines (CRSH), Ian Hambleton de l'Université McMaster et directeur de l'Institut Fields, ainsi que Wesley Yung, directeur de la Division des méthodes d'enquêtes auprès des entreprises à Statistique Canada.

Les administrateurs demeurant en poste sont Michael S. Kramer de la Faculté de médecine de l'Université McGill, Alexandre Leblanc de l'Université du Manitoba, Nancy Reid de l'Université de Toronto (Directrice de l'INCASS), Richard L. Smith de l'Université de la Caroline du Nord et directeur de SAMSI (Président du Conseil d'INCASS), Mary Thompson de l'Université de Waterloo (ancienne Directrice scientifique de l'INCASS), Luc Vinet de l'Université de Montréal et directeur du CRM, ainsi que Francis Zwiers, directeur du Consortium pacifique sur les impacts climatiques.

Automne 2015


Réservez la date

Le 28 mai 2016:  L'assemblée annuelle 2016 de l’INCASS aura lieu de 15 h 30 à 18 h 00 à Brock University la veille du congrès annuel SSC.

Veuillez voir notre nouveau calendrier d'évènements. Si vous voulez voir votre évènement ici, envoyez nous un courriel avec les détails!

Mary Thompson transfère la direction à Nancy Reid. (Crédit photo : Jeff Picka)

Nouvelles des Projets de recherches en collaboration


Avancées en modèles espace-état des sciences halieutiques

Le Projet de recherche en collaboration INCASS « Avancées en modèles espace-état (MEEs) des sciences halieutiques » s'est réuni en juin 2015 à l'Université Dalhousie, Halifax, N.-É. L'atelier a démontré avec succès les récents développements théoriques et logiciels pour l'ajustement des MEEs. Il a aussi établi des nouvelles collaborations avec des chercheurs de Pêches et Océans Canada (MPO) ainsi que le Northwest Fisheries Science Center (NWFS-NOAA) sur les données d'évaluation des stocks complexes. En novembre, les membres de ce PRC ont présenté leurs dernières recherches sur l'estimation robuste des paramètres fixes des MEEs à l'atelier à BIRS « Current and Future Challenges in Robust Statistics ». À la fin de novembre, le chef de projet a été examinateur scientifique pour la Réunion d'examen du cadre sur la morue du Nord du MPO à St. John's, T.-N.-L. La prochaine réunion de ce PRC aura probablement lieu à l'Institut Maurice Lamontagne en mai 2016.

Modélisation de la dépendance à l'aide de copules : théories et applications

L'équipe a été fortement représentée à un atelier de copule à Oberwolfach Allemagne en avril 2015. E.F. Acar, C. Genest, J.G. Nešlehová, B. Rémillard et L.-P. Rivest ont assisté et ont fait des présentations sur leurs recherches actuelles. E.F. Acar a aussi organisé une séance invitée en vue de présenter les récents travaux de ce PRC au Congrès SSC à Halifax en juin 2015. Les conférenciers ont été B. Rémillard, L.-P. Rivest, et E.F. Acar. Harry Joe a été conférencier invité au Colloque international sur la dépendance et les copules 2015 à l'Institut de mathématiques statistiques, Tachikawa Japon en juin 2015.

Un concours de bourses postdoctorales s'est déroulé et deux candidats ont reçu les bourses de $ 40 000 pour un an. Caren Hasler travaillera avec R.V. Craiu à Toronto (L.-P. Rivest sera co-directeur) et Yue Zhao sera basé à McGill, où il travaillera avec C. Genest et J.G. Nešlehová. Un étudiant du deuxième cycle, Simon Chatelain, a complété un stage de trois mois à l'Institut de recherche d'Hydro-Québec (IREQ), sous la supervision de Luc Perreault. Ses recherches portaient sur la validation des prévisions hydro-météorologiques.

Les membres de l'équipe ont écrit trois articles liés au PRC qui ont été publiés ou acceptés pour publication en 2015 :

  • M.-P. Côté & C. Genest (2015). A copula-based risk aggregation model. The Canadian Journal of Statistics, 43, 60-81.
  • F. Tounkara & L.-P. Rivest (2015). Mixture regression models for closed population capture-recapture data. Biometrics, 71, 721-730.
  • J.-F. Quessy, L.-P. Rivest & M.-H. Toupin (2015). Semi-parametric pairwise inference methods in spatial models based on copulas. Spatial Statistics, 14, 472-490.

Méthodes modernes d'analyse spectrale des séries temporelles : science physique, science environnementale et modélisation informatique

Au printemps, quelques membres de cette équipe se sont réunis à AGU en vue de discussions informelles. L'atelier initial a eu lieu les 18 et 19 octobre, immédiatement après l'Atelier solaire canadien au Centre touristique la Petite Rouge (St. Émile de Suffolk, QC). Alan Chave (C. Stat, WHOI/MIT) et Frank Vernon (Scripps, UCSD) ont été parmi les conférenciers. Le programme a déjà établi des collaborations; Keith Thompson (Dal), Frank Vernon (UCSD) et David Thomson (Queen's) travaillent ensemble. Un autre groupe inclut J.-P. St-Maurice, Sasha Koustov, tous deux de l'Université de Saskatchewan, et Robyn Fiori de RNCAN. Il y a deux nouveaux étudiants de cycle supérieur et un étudiant de premier cycle (Mark Tamming) à Queen's. Mark est un étudiant BRPC qui a passé l'été à améliorer le programme pour transformer les magnétogrammes scannées en séries temporelles. Il a réussi à obtenir une série temporelle complète de 90 jours avec une résolution d'une minute des années 1890. Il a été méticuleux avec l'exactitude de l'heure. Les modes-P solaires sont évidentes dans le spectre (il a tellement appris sur l'estimation à fenêtres pour calculer un spectre - très bien pour un étudiant qui commence sa troisième année!). L'importance de ses recherches est que les fréquences de modes-P dépendent de l'irradiation solaire, créant une nouvelle façon de vérifier les estimations des reconstructions d'irradiance qui ont été faites à partir des observations des tâches solaires. Évidemment, le travail de cette équipe est bien engagé!

L'inférence statistique d'enquêtes complexes en présence de données manquantes

Cette équipe a organisé son premier atelier au CRM les 25 et 26 octobre. L'objectif de l'atelier a été de faire le point sur les nouveaux développements dans le domaine des données d'enquêtes manquantes, de rassembler les chercheurs les plus actifs dans le domaine, et d'identifier les défis actuels. Le but global était d'obtenir une vue collective des avancées récentes dans le domaine, de générer de nouvelles idées et possibilités de formation, ainsi que de favoriser des interactions entre les membres de l'équipe.

Prix de la Conférence étudiante annuelle de la SSC commandité par l'INCASS

Mohammad Ehsanul Karim de UBC reçoit le prix des statistiques sur pellicule pour son vidéo intitulé « The Performance of Statistical Learning Approaches to Construct Inverse Probability Weights in Marginal Structural Cox Models: A Simulation-based Comparison ». (Crédit photo : Peter Macdonald) Keelin Greenlaw de UVic (4ième de la droite) reçoit le prix du meilleur article pour son article intitulé « Empirical Bayes Multivariate Group-Sparse Regression for Brain Imaging ». (Crédit photo : Peter Macdonald)


International Symposium in Statistics (ISS) 2015 sur les avancées en analyse paramétrique et semi-paramétrique de données multivariées, en séries temporelles, spatio-temporelles et familiales longitudinales

L'International Symposium in Statistics (ISS) 2015 a été organisé par le Département de mathématiques et statistique à l'Université Memorial, et a eu lieu au Holiday Inn, St. John's, T.-N.-L. du 6 au 8 juillet 2015. L'Institut canadien des sciences statistiques (INCASS) a coparrainé ce colloque, entre autres. Cette réunion portait sur cinq thèmes de recherche spécialisés : l'analyse de données multidimensionnelles des configurations continues; l'analyse multivariée de données longitudinales catégoriques; les séries temporelles avec applications financières et environnementales; l'analyse de données spatio-temporelles; et l'analyse de données familiales longitudinales avec configurations semi-paramétriques. 46 délégués de nombreux pays parmi lesquels le Brésil, la France, l'Inde, la Suisse, les États-Unis et le Canada étaient présents. La réunion a été un grand succès avec un excellent programme académique complété par deux activités sociales : le banquet du symposium et une excursion d'observation de baleines et de macareux.

L'allocution de bienvenue a été prononcée par Charmaine Dean, ancienne présidente de la SSC et doyenne de la Faculté de sciences de l'Université Western. Alwell Oyet, directeur adjoint, a accueilli les délégués au nom de son département à Memorial. Brajendra Sutradhar, président de ce symposium, a souhaité la bienvenue à tous les invités et a fourni un bref historique des deux derniers symposiums (ISS-2009, ISS-2012) et leurs rapports avec le présent symposium (ISS-2015). Il a remercié tous les commanditaires, en particulier l'Université Memorial, l'INCASS et AARMS (Atlantic Association for Research in the Mathematical Sciences) pour leur soutien.


Récapitulation du programme thématique Big Data


L'inférence, les modèles et l'apprentissage statistique pour le « big data »

De janvier à juin 2015, l'Institut Fields accueillait un programme thématique sur l'inférence, les modèles et l'apprentissage statistique pour le « big data ». L'étude et l'avancement des techniques d'inférence pour l'apprentissage statistique en « big data » étaient au centre de ce programme. La priorité accordée sur l'inférence s'explique par le besoin urgent des nouvelles recherches statistiques, informatiques et mathématiques pour répondre aux demandes toujours croissantes du « big data ».

Le comité du programme a été nommé par l'INCASS, et les évènements connexes sur le même sujet ont eu lieu partout au pays, à PIMS, CRM et AARMS. Le programme scientifique avait deux volets complémentaires. Un soulignait l'inférence et les données dans les domaines particuliers de fond : la politique sociale, la politique de santé, les réseaux et la science environnementale. L'autre portait sur les domaines intersectoriels des sciences mathématiques, informatiques et statistiques, y compris l'apprentissage statistique, la visualisation, l'optimisation et les nouveaux paradigmes de l'inférence.

Plusieurs autres activités à l'Institut Fields ont également été axées sur l'inférence pour le « big data », y compris les deux conférences (2014 et 2015) de la Série des conférenciers éminents (données par Bin Yu et Terry Speed), les Conférences Coxeter données par Michael Jordan, un atelier sur les structures de données spatio-temporelles complexes, un atelier sur le « big data » dans le domaine des banques de détail et des banques commerciales, une conférence de prestige publique donnée par Andrew Lo, un atelier sur la résolution de problèmes industriels, et une journée très populaire et sur-souscrite de recherche pour les étudiants de cycles supérieurs, qui a mis en vedette Robert Bell de ATT, Alekh Aggarwal de Google et Kevin Murphy de Microsoft.

Ancré par deux cours de cycles supérieurs, le programme de formation comprenait aussi l'atelier initial et le camp d'entraînement (9 à 23 janvier); donnant aux étudiants de cycles supérieurs et aux stagiaires postdoctoraux une exposition unique à la recherche de pointe dans un large éventail de domaines. Pendant toute la durée du programme, il y avait six stagiaires postdoctoraux en résidence; Einat Gil, stagiaire postdoctorale et spécialiste des environnements d'apprentissage et de la technologie, a développé un programme très intéressant sur le « big data » pour les étudiants de 12e année, qui a été mis à l'essai dans une école secondaire locale pendant cinq semaines. Toutes les activités à l'Institut Fields ont été diffusées utilisant FieldsLive, qui a été largement utilisé pendant les ateliers et après : l'archive est une ressource de recherche inestimable.

Un certain nombre de défis communs ainsi que des méthodes communes ont été identifiés dans un rapport détaillé de la Conférence d'ouverture du programme et du camp d'entraînement, préparé par les stagiaires postdoctoraux et les scientifiques invités à long terme. Un ensemble de défis résulte de la quantité : la plupart des méthodes statistiques et informatiques se prêtent mal à des applications à plus grande échelle et s'échouent simplement sur les très grandes séries de données. Certaines infrastructures spécifiques, tel que les grappes d'ordinateurs combinées avec le traitement en parallèle, l'échantillonnage sélectif et ce que l'on appelle les techniques de diviser et recombiner, ont tous un rôle à jouer. « Big data » peut être « long », impliquant un très grand nombre d'observations individuelles, ou « large », impliquant un très grand nombre de mesures sur un nombre relativement faible d'individus. Les deux soulèvent des difficultés : le premier soulève le besoin de modeler les dépendances possiblement complexes et le deuxième démontre l'échec des théories et méthodes traditionnelles de statistique. Les solutions communes à beaucoup de ces problèmes comprennent la construction des modèles plus complexes, l'hypothèse de parcimonie sous-jacente, le développement des techniques d'optimisation non-convexe, le développement des outils nouveaux de visualisation et le développement des nouveaux théories asymptotiques. Toutes ces approches ont été développées et étendues aux différents ateliers.

Le Bulletin d'été de l'Institut Fields présent un résumé détaillé des cinq ateliers qui y ont eu lieu :

  • « Big data » et l'apprentissage machine statistique
  • L'optimisation et les méthodes matricielles
  • Visualisation pour le « big data » : stratégies et principes
  • « Big data » en matière de politiques de santé
  • « Big data » pour la politique sociale

L'Institut pacifique pour les sciences mathématiques accueillait des ateliers sur L'inférence statistique pour les données à grande échelle, et « Big data » en science environnementale, et le Centre de recherches mathématiques accueillait un atelier sur les Défis statistiques et computationnels dans les réseaux et la cybersécurité, et une école d'été sur l'Apprentissage profond.

Le 12 et 13 juin, Dalhousie a accueilli l'atelier de clôture, L'analytique statistique et computationnel pour le « big data ». Cet atelier était organisé conjointement avec l'Institut pour l'analytique « big data » (IBDA) à l'Université Dalhousie. Les conférences présentées par Chipman, Gil, Grosse, Plante, Lix et Shipp ont été des aperçus de recherches présentées aux ateliers sélectionnés pendant le programme thématique de L'inférence, les modèles et l'apprentissage statistique pour le « big data ». Les autres conférences ont présenté les recherches à IBDA sur la fouille de textes, l'informatique de haute performance, la visualisation, la bioinformatique et la vie privée.

Comme les autres évènements du programme thématique « Big data », la diversité des domaines impliqués à la recherche du « big data » était évidente à cette conférence. Une application importante de sciences des données se trouvait au cœur de presque toutes les conférences. Par exemple, Stephanie Shipp montrait une application intéressante comprenant les données sur les appels des premiers intervenants des services d'incendie et la répartition optimale des services. Bien que les applications étaient assez diverses, un nombre de thèmes communs apparaissaient. Dans ce contexte, la discussion portait sur les questions telles que les renseignements personnels présents dans les banques de données, la faisabilité du calcul, y compris l'informatique de haute performance, la combinaison de différentes banques de données (par exemple, en recherches sur les politiques de santé), y compris diverses sources de données (géolocalisation, texte, opérations, média social) et la visualisation des données.

Dans une table ronde sur l'éducation en science des données, participants Chipman, Gil, Reid, Matwin et Plante ont abordé une série de questions sur le programme idéal de science des données :

  • comment modifier les diplômes universitaires traditionnels en statistique ou en informatique pour fournir aux étudiants suffisamment de compétences pour travailler avec le « big data »
  • l'importance des compétences non techniques comme l'exploration des données, les projets en collaboration et la communication en science des données
  • l'éducation des élèves des écoles primaires et secondaires en science des données
  • l'interdisciplinarité et les partenariats avec les spécialistes du sujet en applications de science des données
  • les « stratèges des données » contre les « scientifiques des données »
  • faire de la place dans le programme universitaire pour les nouveaux sujets : que devrions-nous en enseigner moins?

Un but de l'atelier de clôture était de présenter les chercheurs de l'IBDA au communauté de sciences statistiques, et vice versa. Le deuxième but était de donner un aperçu de haut niveau du programme thématique aux chercheurs intéressés. Nous croyons que les deux buts ont étés atteints par cet atelier. La table ronde était très utile pour les statisticiens académiques qui y assistaient, car beaucoup d'eux participent dans leurs propres institutions avec l'introduction des programmes ou des cours de science des données. Les présentations sont disponible sur la site web de l'INCASS.

Offres d'emploi

Notre site web comprend maintenant une page d'offres d'emploi. Nos membres institutionnels sont invités à nous envoyer leurs annonces.
Aimez nous sur Facebook

Données.Découvertes.Décisions

Suivez-nous!
Aimez notre page facebook et suivez-nous sur Twitter pour les mises à jour importantes.
Copyright © 2015 CANSSI / INCASS, Tous droits réservés.