block by ThomasG77 35ecb55d0032aa0f18777aaa15b9247d

Athletes fr JO 2024

Récupération des données de l’API des athlètes français JO 2024 derrière https://data.equipedefrance.com

Le plus intéressant, ce sont les athlètes qui sont exposés. Il manque quelques coordonnées géographiques (correspondant au lieu de naissance, 29 lors de mes tests). Nous avons dû les déduire en passant les slugs des athlètes car les lieux de naissance sont renseignés dans les pages HTML du type https://www.equipedefrance.com/athlete/guylaine-marchand bien que la géolocalisation du lieu de naissance soit absente.

Il y a eu quelques cas où:

Les athlètes dont la propriété birthPlace est remplie sont ceux qui ont été géocodés. Ceux avec une valeur null sont ceux dont je n’ai rien touché car déjà avec des coordonnées.

On produit un fichier GeoJSON en entrée.

Chaque “feature” GeoJSON est du type

{
  "type": "Feature",
  "properties": {
    "gender": "homme",
    "firstname": "Alexandre",
    "lastname": "Lloveras",
    "slug": "alexandre-lloveras",
    "type": "paralympic",
    "birthdate": "2000-06-26",
    "pictureUrl": "https://medias.equipedefrance.com/root/6fc2f70b-1edb-47d3-a0a8-a34b6016b323.jpg",
    "isMedalist": false,
    "olympicMedals": {
      "gold": 1,
      "silver": 0,
      "bronze": 2
    },
    "olympicGames": [
      {
        "year": 2020
      },
      {
        "year": 2024
      }
    ],
    "disciplines": [
      {
        "objectID": 62,
        "slug": "para-cyclisme"
      }
    ],
    "objectID": "967",
    "birthPlace": null
  },
  "geometry": {
    "coordinates": [
      4.836284906729304,
      45.7710938512817
    ],
    "type": "Point"
  }
}

On montre le cas pour que vous compreniez qu’on a des atributs imbriqués qu’il vous faudra extraire ci-nécessaire.

Si vous voulez des entrées par sport, passez plutôt par des URLS du type https://data.equipedefrance.com/api/sport/67 après avoir listé les identifiants de sports via https://data.equipedefrance.com/api/init

Il y aussi une entrée par région mais le problème est qu’elle ne permet pas d’avoir tous les gens car tous les athlètes de l’équipe de France ne sont pas nés que sur sol français et il n’y a pas de cas pour avoir tous ceux nés à l’étranger alors que pas de problème côté entrée https://data.equipedefrance.com/api/init.

cache.json

extract_jo_2024_athletes.py