Résumé : Cet article présente une nouvelle approche mathématique pour la construction des zones de chalandise économiques. L'économétrie spatiale repose sur le principe général que l'économie des territoires est conditionnée par leurs contraintes géographiques. Dans le domaine du géomarketing, il existe deux approches théoriques majeures : les modèles de localisation-allocation et les modèles gravitaires. Le Modèle d'Allocation Gravitaire s'inspire de ces deux interprétations pour construire les zones de chalandise économiques d'un réseau de magasins décrits par un nombre quelconque de paramètres. Dans ce papier, nous présentons cette construction ainsi que la calibration du modèle. Cette description économétrique du territoire permettra de prédire les chiffres d'affaires futurs ou bien l'emplacement optimal d'un nouveau magasin.

Mots-clés : zone de chalandise, taux de transport des richesses, taux intrinsèques, condition de besoin, recuit simulé.

1) Zones de chalandise économiques
1.1) Description du territoire

Pour un territoire donné et découpé en \(I\) unités géographiques quelconques, nous étudions un réseau de \(M\) magasins, chacun décrit par \(K\) paramètres arbitraires. Ces magasins proposent des biens ou des services qui répondent tous à un besoin identique. Le chiffre d'affaires \(CA_{i\rightarrow m}\) est la richesse totale apportée par l'unité \(i\) au magasin \(m\) ; les variables à notre disposition pour calculer ces chiffres d'affaires sont les distances \(d_{im}\) de chaque unité géographique à chaque magasin, la richesse \(R_{i}\) de chaque unité géographique et son nombre \(P_{i}\) d'habitants. À chaque magasin \(m\), nous associons également une grandeur \(\tau_{m}\) appelée taux intrinsèque du magasin qui ne dépend que des \(K\) paramètres arbitraires et donne l'attractivité absolue du magasin, indépendamment des contraintes géographiques.

Afin d'identifier chaque individu à son unité géographique, nous faisons l'hypothèse d'homogénéité : chaque unité géographique est assez petite pour être considérée comme homogène économiquement et sociologiquement. La richesse apportée par un individu \(p\) au magasin \(m\) s'écrit \(CA_{p\rightarrow m} = \tau_{pm}r_{p}\) où \(r_{p}\) est la richesse de l'individu \(p\) et \(\tau_{pm}\) la proportion de cette richesse dépensée dans le magasin \(m\). Nous avons alors : $$CA_{i\rightarrow m} = CA_{p\rightarrow m}\times P_{i} = \tau_{pm}r_{p}\times P_{i} = \tau_{pm}\frac{R_{i}}{P_{i}}\times P_{i}=\tau_{pm}R_{i}$$ Le chiffre d'affaire \(CA_{i\rightarrow m}\) est proportionnel à la richesse contenue dans \(i\) et, grâce à l'hypothèse d'homogénéité, le coefficient \(\tau_{pm}\) ne dépend que de l'unité géographique à laquelle appartient l'individu \(p\) : $$CA_{i\rightarrow m}=\tau_{pm}R_{i} = T_{im}R_{i}$$ La grandeur \(T_{im}\) est appelée taux de transport des richesses.

Les magasins que nous considérons proposent un bien ou un service correspondant à un besoin particulier. Nous supposons qu'en amont de l'étude géographique, une étude comportementale (enquêtes, sondages...) a été effectuée auprès des consommateurs (individus ou ménages) afin d'évaluer la part allouée à ce besoin dans leur budget. Cette étude va permettre d'exprimer la dépense \(\Delta(r_{p})\) consacrée au besoin considéré en fonction de la richesse du consommateur. La richesse qu'un individu \(p\) apporte à l'ensemble des \(M\) magasins s'écrit : $$CA_{p\rightarrow M}=\sum_{m=1}^{M}CA_{p\rightarrow m}=\left[\sum_{m}T_{im}\right]r_{p}$$ La quantité \(CA_{p\rightarrow M}\) n'est autre que la richesse consacrée par \(p\) au besoin couvert par l'ensemble des \(M\) magasins c'est-à-dire $$CA_{p\rightarrow M}=\Delta(r_{p})$$ En comparant les deux égalités, et grâce à l'hypothèse d'homogénéité, nous donnons alors la condition de besoin : $$\boxed{\forall i\mbox{ , }\sum_{m}T_{im}=\frac{\Delta(r_{p})}{r_{p}}=\frac{P_{i}}{R_{i}}\times\Delta\left(\frac{R_{i}}{P_{i}}\right)=B_{i}}$$ Le comportement des individus donne donc une condition nécessaire sur le taux de transport pour chaque unité géographique. Afin de vérifier que le territoire étudié est bien calibré par rapport au réseau de magasins, c'est-à-dire vérifier que nous prenons bien en compte la zone de chalandise globale du réseau et non un territoire bien plus grand ou bien plus petit, nous devons avoir : $$\sum_{m}CA_{m}^{h}=CA_{T}\simeq \sum_{i}P_{i}\times\Delta\left(\frac{R_{i}}{P_{i}}\right)=\sum_{i}B_{i}R_{i}$$ où \(CA_{m}^{h}\), le chiffre d'affaires historique du magasin \(m\), est une donnée du problème. Cette condition, appelée condition globale de chalandise nous servira, en début d'étude, à déterminer le bien-fondé des frontières du territoire autours du réseau de magasins.

1.2) Taux de transport des richesses

Pour exprimer la forme générale du taux de transport, nous commençons par introduire les distances de normalisation \(D_{i}\) et \(\alpha\) le paramètre d'ajustement. Comme dans le modèle gravitaire classique, nous faisons l'hypothèse que le paramètre d'ajustement est l'exposant de la distance \(d_{im}\) localement normalisée par \(D_{i}\) et, en tenant compte des taux intrinsèques, nous obtenons : $$CA_{i\rightarrow m}=T_{im}R_{i}=T(\tau_{m},d_{im},D_{i},\alpha)R_{i}=T\left(\tau_{m},\left(\frac{d_{im}}{D_{i}}\right)^{\!\alpha}\right)R_{i}$$ Les \(D_{i}\) dépendent de la répartition des magasins ainsi que de leur accessibilité par rapport aux unités géographiques tandis que \(\alpha\) est une constante globale attachée au territoire et au besoin étudiés.

Tout d'abord, pour une unité géographique à distance égale de deux magasins, le choix entre ces deux magasins ne dépendra que de leurs taux intrinsèques qui mesurent l'attractivité propre des points de vente. Si nous supprimions l'effet de la distance, seules ces grandeurs seraient déterminantes. Ensuite, si nous faisons varier \(\tau_{m}\) à distance constante, nous pouvons supposer que le taux de transport des richesses variera dans le même sens ; en effet, plus un magasin sera attractif, plus les richesses auront tendance à le choisir. Enfin, un magasin déjà très attractif aura un gain de richesse moindre en augmentant son taux intrinsèque qu'un magasin moins important qui possèderait donc un potentiel de développement supérieur. Ces conditions sur les taux intrinsèques nous donnent donc : $$T(\tau_{m},0)=\tau_{m}\quad\mbox{;}\quad\frac{\partial T}{\partial \tau_{m}}>0\quad\mbox{;}\quad\frac{\partial^{2} T}{\partial \tau_{m}^{2}}<0$$ Maintenant, nous remarquons que le taux de transport de richesses décroit avec la distance pour tendre vers zéro ; en effet, un magasin éloigné ne sera pas fréquenté par les habitants d'une unité géographique donnée. De plus, la diminution de \(T\) associée à une augmentation donnée de la distance sera d'autant plus faible que la distance sera déjà grande. Ces conditions sur les distances nous donnent donc : $$\lim_{d>>D_{i}}T=0\quad\mbox{;}\quad\frac{\partial T}{\partial d}<0\quad\mbox{;}\quad\lim_{d>>D_{i}}\left(\frac{\partial^{2} T}{\partial d^{2}}\right)>0$$ À partir de ces considérations, nous voyons tout d'abord la nécessité de non-linéarités due aux conditions sur les dérivées secondes de \(T\). Une expression possible du taux de transport est alors : $$\boxed{T(\tau_{m},d_{im},D_{i},\alpha)=\frac{1}{\frac{1}{\tau_{m}}+\left(\frac{d_{im}}{D_{i}}\right)^{\alpha}}=\frac{\tau_{m}}{1+\tau_{m}\left(\frac{d_{im}}{D_{i}}\right)^{\alpha}}}$$ Elle respecte toutes les conditions énoncées ci-dessus pour \(\alpha>0\). Nous utiliserons cette forme par la suite mais nous aurions pu aussi prendre pour \(T\) une fonction de type Weibull : $$T(\tau_{m},d_{im},D_{i},\alpha)=\tau_{m}e^{-\tau_{m}\left(\frac{d_{im}}{D_{i}}\right)^{\alpha}}$$ Pour les richesses à proximité des magasins, les deux fonctions possèdent le même développement limité à l'ordre 1 et le comportement de ces richesses sera pareillement décrit. La fonction de type Weibull possède néanmoins une décroissance plus rapide au-delà d'une distance caractéristique : elle servira plutôt à décrire les zones de chalandise piétonnes tandis que la première décrira les zones de chalandise véhiculées.

1.3) Taux intrinsèques des magasins

Jusque-là, nous avons seulement fait intervenir les taux intrinsèques de chaque magasin qui ne sont pas directement accessibles. En revanche, nous disposons des valeurs \(\left(V_{1(m)},...,V_{K(m)}\right)\) de \(K\) paramètres arbitraires pour les \(M\) magasins. Étant donné un magasin \(m\), nous posons : $$\overrightarrow{P_{m}}=\left( \begin{array}{c} \frac{V_{1(m)}}{\langle V_{1}\rangle}\\ \vdots \\ \frac{V_{K(m)}}{\langle V_{K}\rangle} \end{array} \right)\mbox{ avec }\langle V_{k}\rangle=\frac{1}{M}\sum_{m}V_{k(m)}$$ Chaque élément du vecteur \(\overrightarrow{P_{m}}\) permet de comparer l'importance du paramètre \(k\) du magasin \(m\) avec la moyenne de ce paramètre sur tous les magasins. Ces vecteurs sont des données d'entrée du problème. Maintenant, si nous faisons l'hypothèse que la réaction à chaque paramètre arbitraire est identique pour chaque individu du territoire étudié, nous pouvons relier les \(M\) vecteurs \(\overrightarrow{P_{m}}\) aux \(M\) taux intrinsèques par une fonction analytique : $$\tau_{m}=\tau\left(\overrightarrow{P_{m}}\right)$$ où la fonction \(\tau:\mathbb{R}^{K}\rightarrow[0,1]\) est donnée par le territoire et ses individus.

Afin de pouvoir interpréter les interactions entre les \(K\) paramètres arbitraires, nous associons à \(\tau\) la matrice de corrélations \(\overline{\overline{Q}}\) symétrique réelle de dimension \(K\times K\) telle que : $$\boxed{\tau_{m}=\sqrt{\,^{t}\overrightarrow{P_{m}}\;\overline{\overline{Q}}\;\overrightarrow{P_{m}}}}$$ si la condition \(0\leq\,^{t}\overrightarrow{P_{m}}\;\overline{\overline{Q}}\;\overrightarrow{P_{m}}\leq1\) est nécessaire, elle ne signifie pas que la matrice \(\overline{\overline{Q}}\) doit être définie positive partout mais seulement pour les \(\overrightarrow{P_{m}}\). Concrètement, les éléments non-diagonaux de \(\overline{\overline{Q}}\) donnent les corrélations entre les paramètres arbitraires, ses éléments diagonaux donnent leurs contributions principales c'est-à-dire leur importance dans la description du réseau de magasins. La fonction \(\tau\) dépend donc de \(\frac{K(K+1)}{2}\) constantes fixées par le territoire. Il nous faut maintenant calibrer le modèle afin d'accéder à ces constantes ainsi qu'au paramètre d'ajustement. La calibration va permettre de calculer les zones de chalandise selon les caractéristiques particulières du territoire.

2) Calibration du modèle
2.1) Erreurs relatives et conditionnement

Le critère de convergence permettant de contrôler la progression de l'algorithme s'appuie sur l'écart relatif entre les chiffres d'affaires estimés \(CA_{m}\) et les chiffres d'affaires historiques \(CA_{m}^{h}\). Pour chaque magasin \(m\), nous avons : $$E_{m}=\frac{|CA_{m}-CA_{m}^{h}|}{CA_{m}^{h}}\;\mbox{ avec }\; CA_{m}=\sum_{i}CA_{i\rightarrow m}$$ Comme nous souhaitons tenir compte de la qualité des résultats et donc de la dispersion des erreurs, nous considérons l'erreur relative globale : $$\mathcal{E}=\overline{E}+z\frac{\sigma}{\sqrt{M}}$$ avec \(\overline{E}\) la moyenne des \(E_{m}\), \(\sigma\) leur écart-type et \(z\) une constante. Pour fixer cette constante, nous nous inspirons de la loi gaussienne : dans ce cas-là, pour un intervalle de confiance à 95%, la valeur de \(z\) est 1.6. Bien que les hypothèses gaussiennes ne soient pas réunies, nous utilisons tout de même cette valeur qui nous assure un bon ordre de grandeur pour un intervalle de confiance convenable sur la moyenne des erreurs. C'est cette grandeur \(\mathcal{E}\) que nous allons devoir minimiser.

Lorsque nous nous donnons \(M\) taux intrinsèques et un paramètre d'ajustement, les distances de normalisation sont immédiatement données par la condition de besoin. De plus, cette condition impose différentes contraintes supplémentaires. Tout d'abord, pour chaque unité géographique \(i\), la décroissance du taux de transport avec la distance permet d'écrire : $$\sum_{m}T\left(\tau_{m},\left(\frac{d_{im}}{D_{i}}\right)^{\alpha}\right)\leq\sum_{m}T\left(\tau_{m},0\right)\Rightarrow\boxed{\max_{i}(B_{i})\leq\sum_{m}\tau_{m}}$$ En particularisant l'unité géographique aux magasins \(m\), nous obtenons : $$T\left(\tau_{m},0\right)+\sum_{n\neq m}T\left(\tau_{n},\left(\frac{d_{mn}}{D_{m}}\right)^{\alpha}\right)\geq T\left(\tau_{m},0\right)\Rightarrow\boxed{\tau_{m}\leq B_{m}}$$ Ces deux contraintes, associées à la positivité des taux, devront être respectées lors de chaque étape de l'algorithme. En ce qui concerne le paramètre d'ajustement, celui-ci doit être supérieur à 1 pour respecter les contraintes sur le taux de transport.

2.2) Algorithme de calibration

Le nombre \(M+1\) de dimensions et la non linéarité du modèle d'allocation gravitaire peuvent engendrer de nombreux minima locaux pour \(\mathcal{E}\) dont nous devons extraire le minimum global. Les taux intrinsèques et le paramètre d'ajustement n'étant pas de même nature, nous les traitons séparément dans l'algorithme. Pour un jeu \(\left(\tau_{1}^{t},...,\tau_{M}^{t}\right)\) de taux intrinsèques, une valeur de \(\alpha>1\) quelconque fixe les distances de normalisation et donc le critère de convergence. Pour trouver le paramètre d'ajustement \(\alpha_{t}\) qui minimise l'erreur relative globale, nous effectuons une recherche linéaire à taux intrinsèques constants.

La recherche linéaire, pour \(\alpha_{0}\) et \(\Delta\alpha\) bien choisis, consiste à calculer \(\min_{\pm}[\mathcal{E}(\alpha_{0}\pm\Delta\alpha)]\) puis, selon le signe, prolonger le calcul avec \(\alpha_{0}\pm p\Delta\alpha\) où \(p\) est une incrémentation d'entiers naturels. La recherche s'arrête lorsque la valeur de \(\mathcal{E}\) augmente. Lors de la calibration, pour l'étape \(t\) de l'algorithme, nous prendrons \(\alpha_{0}=\alpha_{t-1}\) pour paramètre d'ajustement initial. Le pas \(\Delta\alpha_{t}\) est alors calculé grâce aux critères de Wolfe : $$\left\{ \begin{array}{rcl} \mathcal{E}(\alpha_{t-1}\pm\Delta\alpha_{t}) & \leq & \mathcal{E}(\alpha_{t-1})\pm\varepsilon_{1}\frac{\partial\mathcal{E}}{\partial\alpha}(\alpha_{t-1})\Delta\alpha_{t} \\ \pm\frac{\partial\mathcal{E}}{\partial\alpha}(\alpha_{t-1}\pm\Delta\alpha_{t}) & \geq & \pm\varepsilon_{2}\frac{\partial\mathcal{E}}{\partial\alpha}(\alpha_{t-1}) \\ \end{array} \right.$$ avec \(0<\varepsilon_{1}<\varepsilon_{2}<1\). Cette recherche linéaire permet d'ajuster le paramètre \(\alpha_{t}\) à chaque étape pour obtenir une erreur relative globale minimale à taux intrinsèques donnés.

Ces valeurs de taux intrinsèques sont déterminées par recuit simulé, méthode d'optimisation statistique qui consiste à admettre des augmentations transitoires dans la minimisation de \(\mathcal{E}\) afin d'éviter de converger vers un minimum local. À chaque étape, nous tirons aléatoirement des taux intrinsèques sur \(]0,B_{m}]\) de manière uniforme en nous assurant que leur somme respecte bien la condition de besoin ; la recherche linéaire permet alors d'associer le paramètre d'ajustement optimal à ce tirage. Nous notons \(\mathcal{E}_{+}\) l'erreur relative globale obtenue et la probabilité pour que le jeu de variables soit accepté pour l'étape \(t\) est alors : $$\mathbb{P}\left(\mathcal{E}_{t}=\mathcal{E}_{+}\right)=\min\left(1,\exp\left(-\frac{\mathcal{E}_{+}-\mathcal{E}_{t-1}}{\theta}\right)\right)$$ où \(\theta>0\) est un paramètre de contrôle. Cette probabilité d'accepter des augmentations de l'erreur relative globale, appelée taux d'acceptation, sera d'autant plus grande que \(\theta\) sera grand. La convergence de l'algorithme dépendra fortement du comportement du paramètre de contrôle : pour \(\theta\sim\infty\) tous les tirages sont acceptés et l'algorithme ne convergera pas tandis que pour \(\theta\sim 0\) la convergence vers le minimum global sera extrêmement lente.

La grandeur \(\mathcal{E}\) que nous calculons représente une moyenne d'erreurs relatives. Pour une bonne calibration, sa valeur doit être très inférieure à \(1\) et nous commençons donc la calibration avec \(\theta=2^{k}\) où \(k\) est un entier positif tel que le taux d'acception empirique soit proche de \(1\). Nous mesurons alors le taux d'acceptation empirique pour chaque palier de décrementation de \(k\) et nous stoppons cette étape lorsque ce taux passe sous un seuil arbitraire. À partir de là, nous fixons une décroissance linéaire pour \(\theta\) tout en continuant à mesurer le taux d'acceptation empirique. Lorsque ce taux se met à chuter brutalement, nous stoppons la calibration sur le minimum trouvé. La probabilité de trouver le minimum global en un temps donné déterminera la qualité des zones de chalandise. Cette probabilité augmente avec les ressource de calculs disponibles permettentant d'évaluer les taux d'acceptation.

2.3) Traitement des taux intrinsèques

Pour construire \(\overline{\overline{Q}}_{opt}\), la matrice optimale des corrélations entre paramètres arbitraires, nous possédons l'ensemble \(\left\{\tau_{m}^{opt}\right\}_{1\leq m\leq M}\) des taux intrinsèques optimaux dont l'expression pour chaque magasin s'écrit : $$\left(\tau_{m}^{opt}\right)^{2}=\;^{t}\overrightarrow{P_{m}}\,\overline{\overline{Q}}_{opt}\,\overrightarrow{P_{m}}=\sum_{k,l}Q_{kl}P_{k(m)}P_{l(m)}$$ Comme la matrice \(\overline{\overline{Q}}_{opt}\) est symétrique et les \(\overrightarrow{P_{m}}\) connus, cette définition nous donne le système suivant : $$\overline{\overline{S}}=\left( \begin{array}{ccccccc} P_{1(1)}P_{1(1)} & ... & P_{1(1)}P_{K(1)} & P_{2(1)}P_{2(1)} & ... & P_{2(1)}P_{K(1)} & ... \\ \vdots & & \vdots & \vdots & & \vdots & \\ P_{1(M)}P_{1(M)} & ... & P_{1(M)}P_{K(M)}& P_{2(M)}P_{2(M)} & ... & P_{2(M)}P_{K(M)}& ... \\ \end{array} \right)$$ $$\overrightarrow{Q}=\left(Q_{11},2Q_{12},...,2Q_{1K},Q_{22},...,2Q_{2K},...,2Q_{(K-1)K},Q_{KK}\right)$$ $$\Rightarrow\mbox{ } \overline{\overline{S}}.\overrightarrow{Q}=\overrightarrow{\tau^{2}}= \left( \begin{array}{c} \left(\tau_{1}^{opt}\right)^{2} \\ \vdots \\ \left(\tau_{M}^{opt}\right)^{2} \end{array} \right)$$ Il s'agit d'un système de \(M\) équations à \(\frac{K(K+1)}{2}\) inconnues qui ne possède qu'une solution approchée dans le cas général. Cette approximation est donnée par la méthode des moindres carrés qui minimise l'erreur \(\|\overline{\overline{S}}.\overrightarrow{Q}-\overrightarrow{\tau^{2}}\|\) pour aboutir au vecteur \(\overrightarrow{Q}\) recherché : $$\boxed{\overrightarrow{Q}=\left(\;^{t}\overline{\overline{S}}\overline{\overline{S}}\right)^{-1}\times\;^{t}\overline{\overline{S}}.\overrightarrow{\tau^{2}}}$$ Cette pseudo-solution permet alors de construire la matrice \(\overline{\overline{Q}}_{opt}\) donnant les taux intrinsèques optimaux du réseau de magasins.

Afin d'obtenir une unique pseudo-solution, le système d'équations doit être sur-déterminé. Ainsi, le nombre de paramètres arbitraires que l'on peut considérer est limité par le nombre de magasins du réseau c'est-à-dire que \(\frac{K(K+1)}{2}\leq M\) et les valeurs maximales de \(K\) selon \(M\) sont donc :

Nombre de magasins 1,2 3,4,5 6,7,8,9 10,11,12,13,14 ...
Nombre de paramètres 1 2 3 4 ...

Cette contrainte reste acceptable dans la mesure où le nombre de paramètres arbitraires doit être faibles pour que ceux-ci restent significatifs. Finalement, supposons que les magasins deviennent tous identiques pour nos paramètres arbitraires. Leurs taux intrinsèques seront alors tous égaux à \(\tau_{id}\) avec : $$\tau_{id}^{2}=\sum_{k,l}Q_{kl}>0$$ Il s'agit de la dernière condition qui validera ou non notre modèle.

Conclusion

En conclusion, après calibration, nous obtenons un couple \(\left(\overline{\overline{Q}}_{opt},\alpha_{opt}\right)\) composé de constantes liées au territoire et à ses individus. C'est grâce à ce couple que nous pourrons connaitre l'impact d'un changement du territoire sur les différentes zones de chalandise et ainsi prédire les chiffres d'affaires futurs de magasins existants ou repèrer les meilleurs emplacements pour de futurs magasins.