See discussions, stats, and author profiles for this publication at: https://www.researchgate.net/publication/336498317 Actuariat Book · October 2019 CITATIONS READS 0 7,548 1 author: Jmaii Amal University of Tunis El Manar 10 PUBLICATIONS 7 CITATIONS SEE PROFILE All content following this page was uploaded by Jmaii Amal on 13 October 2019. The user has requested enhancement of the downloaded file. Techniques Financières et Actuarielles (Introduction à l’Actuariat) Dr. Amal JMAII dramaljmaii@gmail.com 2 Prérequis : Mathématiques financières, Statistiques mathématiques et Probabilités, Installation du langage R avec les documentations (Racine and Hyndman (2002), Paradis (2005)). Objectif du cours : L’actuariat se spécialise dans l’analyse et la gestion du risque et des effets du hasard dans toutes les questions d’assurance. Concrètement, c’est une application des outils de statistiques et de probabilités aux questions d’assurances. Ainsi, l’objectif de l’actuaire est alors l’analyse de l’impact financier du risque et la prédiction de certains évènements tels que par exemple le nombre des sinistres et l’ampleur des ses pertes en fonction du coût. Au terme de ce cours l’étudiant doit être capable à maitriser la modélisation actuarielles et à saisir l’importance de la gestion des risques dans toute stratégie d’investissements. Auditoire : 3ème Année Licence Appliquée en Ingénierie des Risque (LAIR) et 2ème Année Licence Appliquée en Techniques Bancaires et Financières (LATBF) Table des matières 1 Introduction générale 7 1.1 Avant propos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 1.2 Objectif et plan du cours 8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 Eléments de mathématiques financières 2.1 2.2 2.3 11 Notions de base : Actualisation et Capitalisation . . . . . . . . . . . . . . . . . . . . . 11 2.1.1 Valeur du temps . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 2.1.2 Valeur capitalisée . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 2.1.3 Valeur actualisée . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 Emprunts indivis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 2.2.1 Généralités . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 2.2.2 Cas particuliers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 2.2.3 Le coût de l’emprunt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 Les emprunts obligataires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 2.3.1 Les caractéristiques des obligations . . . . . . . . . . . . . . . . . . . . . . . . . 17 2.3.2 Les différents types d’obligations . . . . . . . . . . . . . . . . . . . . . . . . . . 17 2.3.3 Détermination du rendement total des obligations . . . . . . . . . . . . . . . . 17 2.3.4 Evaluation des obligations 19 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 La gestion de risque et les courbes de taux 3.1 3.2 21 Structure par terme des taux d’intérêt . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 3.1.1 La courbe des taux : yield curve . . . . . . . . . . . . . . . . . . . . . . . . . . 21 3.1.2 Étude de cas 1 : Courbe des taux de la Tunisie . . . . . . . . . . . . . . . . . . 23 Théories explicatives de la structure par terme des taux d’intérêt . . . . . . . . . . . . 25 3.2.1 Hypothèse des anticipations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 3.2.2 La théorie des primes de liquidité . . . . . . . . . . . . . . . . . . . . . . . . . . 25 3 4 3.3 3.4 Table des matières 3.2.3 La théorie de la segmentation de marché . . . . . . . . . . . . . . . . . . . . . . 25 3.2.4 La théorie des habitats préférés . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 La duration de Macaulay . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 3.3.1 La convexité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 Les risques obligataires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 3.4.1 Le risque de taux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 3.4.2 Le risque de crédit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 3.4.3 La notation (rating) des emprunts obligataires . . . . . . . . . . . . . . . . . . 30 4 Les sinistres 4.1 4.2 4.3 31 Rappels sur les notions de probabilité et de statistique . . . . . . . . . . . . . . . . . . 31 4.1.1 Limites d’une fonction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 4.1.2 Théorème des grands membres . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 4.1.3 Variable aléatoire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 4.1.4 Estimation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 Modélisation des sinistres . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 4.2.1 Données . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 Modélisation non paramétrique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 4.3.1 Statistiques descriptives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 4.3.2 Fonctions de répartition et de probabilité empiriques . . . . . . . . . . . . . . . 37 4.3.3 Estimateurs de la fonction de survie : Installation du package "survival" dans R (Therneau and Lumley (2014) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.4 4.5 4.6 Modélisation paramétrique 37 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 4.4.1 Méthode des moments . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 4.4.2 Méthode des quantiles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 4.4.3 Méthode du maximum de vraisemblance . . . . . . . . . . . . . . . . . . . . . . 43 4.4.4 Estimation par intervalle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 Tests . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 4.5.1 Tests graphiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 4.5.2 Test de Kolmogorov-Smirnov . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 4.5.3 Test du khi deux de Pearson . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 4.5.4 Test du ratio des vraisemblances . . . . . . . . . . . . . . . . . . . . . . . . . . 45 Critères de choix d’un modèle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 4.6.1 Critère d’information de Akaike . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 4.6.2 Critère bayesien de Schwarz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 Table des matières 5 5 Modélisation actuarielle des risques et assurances 5.1 5.2 5.3 5.4 5.5 5.6 47 Aperçu sur la théorie de l’utilité et assurance . . . . . . . . . . . . . . . . . . . . . . . 47 5.1.1 Le modèle d’utilité espérée . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 5.1.2 Les classes de la fonction d’utilité . . . . . . . . . . . . . . . . . . . . . . . . . . 48 Le modèle de risque individuel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 5.2.1 Distribution mixtes et risques . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 5.2.2 Convolution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 5.2.3 Transformations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 5.2.4 Approximations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 Les modèles de risques collectifs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 5.3.1 Distributions composées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 5.3.2 Utiliser la formule de convolution pour déterminer la fonction de répartition composée . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 Hétérogénéité des risques au sein d’un portefeuille . . . . . . . . . . . . . . . . . . . . 54 5.4.1 Modèle de crédibilité de Buhlmann . . . . . . . . . . . . . . . . . . . . . . . . . 55 5.4.2 Estimation des paramètres de structure . . . . . . . . . . . . . . . . . . . . . . 56 Introduction à la théorie de la ruine . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 5.5.1 Définitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 5.5.2 Modèle classique de la théorie de la ruine : le modèle de Cramer-Lundberg . . 57 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 Conclusion Annexe A : Tableau récapitulatif des principales lois de probabilité . . . . . . . . . . 63 Annexe B : Introduction au langage R . . . . . . . . . . . . . . . . . . . . . . . . . . . 64 Annexe C : Installation du langage R . . . . . . . . . . . . . . . . . . . . . . . . . . . 64 Annexe D : Estimation non paramétrique de "Kaplan-Meier" sous R . . . . . . . . . . 66 .1 Avant de commencer : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 .2 L’estimateur de "Kaplan-Meier" . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 6 The actuarial profession is recognized worldwide as a major player in the decision-making process within the financial services industry, the area of social protection and in the management of risk, contributing to the well-being of society as a whole. [International Actuarial Association] Chapitre 1 Introduction générale 1.1 Avant propos La science actuarielle est le domaine d’étude relatif à la quantification du risque en utilisant les mathématiques, les probabilités et les statistiques. Ces compétences hautement spécialisées sont principalement utilisées dans le secteur des assurances pour assurer la stabilité financière des sociétés d’assurance, aujourd’hui et pour des décennies à venir. Le mot "actuariat" apparaît au XV III ème siècle (en anglais "actuary") 1 . Les actuaires utilisent des concepts mathématiques et statistiques afin de déterminer la probabilité que certains événements vont se produire (et quand ils se produiront), ainsi que l’impact financier attendu de ces événements. À l’aide de cette information, l’actuaire peut calculer une somme d’argent raisonnable qui devrait être mise de côté maintenant afin de s’assurer que suffisamment d’argent sera disponible plus tard pour payer l’événement si et quand il se produira à l’avenir. Par exemple, lorsqu’une personne souscrit une police d’assurance automobile, elle s’attend à ce que les dommages causés à son véhicule soient indemnisés au cas où elle subirait un accident dans le futur. En effet, les mêmes algorithmes, outils et modèles utilisées dans une analyse actuarielle peuvent tout autant être utiliser à l’étude de l’épargne,la finance et l’assurance. Généralemet c’est le marché de l’assurance qui est considéré comme le plus grand consommateur d’actuaires et d’analyse actuarielle, c’est pourquoi on définit souvent l’actuariat à travers l’assurance. Le spécialiste en actuariat est chargé de plusieurs, à savoir la tarification, le provisionnement, Solvabilité et règlementation, proposition de l’assurance, Réassurance. 1. malgré que l’étymologie du mot "actuaire" est d’origine latine (comptable, rédacteur des livres de comptes -acta-) 7 8 Chapitre 1. Introduction générale La Tarification : Cette étape est primordiale dans l’analyse et l’étude de l’assurance. Elle nécessite l’utilisation des données liées à l’historique de sinistralité afin de déterminer la prime d’assurance. Ensuite, on doit mesurer la rentabilité des opérations d’assurance pour s’assurer que les contrats sont juste-tarifés (ni sur-tarifés ni sous-tarifés. Le provisionnement : Les provisions sont des réserves que l’assureur garde de côté pour pallier un manque de fonds et être toujours capable de remplir ses engagements auprès de ses assurés. Donc le spécialiste en actuariat doit estimer le besoin en capital pour les provisions techniques. Il peut aussi faire des simulations de scénarios économiques sur les sinistres pour évaluer l’impact sur les réserves. La solvabilité et règlementation L’assurance est une activité qui suit des lois et des règles rigoureuses qui exige l’existence d’une autorité qui s’en charge de vérifier que les assureurs restent solvables et suivent les normes en vigueur : c’est le rôle de l’actuaire Proposition de l’assurance Le rôle fondamental de l’actuaire est d’étudier la demande d’assurance et participer à la création et au lancement de produits (assurance vie, assurance non-vie, réassurance). • L’assurance vie : ce type d’activité est dédiée pour sur le très long terme. En effet, l’assureur fait des placements avec l’argent des primes dans le but de les faire fructifier et pour pouvoir tenir ses engagements auprès de ses assurés. Ainsi, l’actuaire pourra adapter la stratégie financière aux normes en vigueur. De plus, il peut faire des prévisions afin de fournir des orientations sur l’allocation stratégique des placements (cf. voir chapitre 6 pour plus de details). • Réassurance : Quand les sinistres ont une forte fréquence et intensité (comme dans les catastrophes naturelles) même l’assureur a besoin de s’assurer. C’est là qu’intervient le l’actuaire : il peut travailler tant dans la réassurance du côté assureur que dans la réassurance du côté ré-assureur. 1.2 Objectif et plan du cours L’actuariat se spécialise dans l’analyse et la gestion du risque et des effets du hasard dans toutes les questions d’assurance. Concrètement, c’est une application des outils de statistiques et de probabilités aux questions d’assurances. Ainsi, la suite de ce cours est divisé en 5 chapitres. Le deuxième chapitre sera consacré à un rappelle sur les mathématiques financières (la notion du temps, les emprunts indivis, les emprunts obligataires, etc. ). Dans le troisième chapitre, nous introduisons la notion de gestion de risque et les courbes de taux dont des études de cas seront présentées. La modélisation des sinistres (coût et nombre des sinistres) sera évoquée dans le quatrième chapitre. Lors du cinquième chapitre nous exposerons la modélisation actuarielle des risques et assurances. Finalement, le dernier chapitre discute la problématique de l’assurance (Assurance Vie, Assurance non-Vie, Réassurance). 1.2. Objectif et plan du cours 9 Tout au long de ce cours, des applications sur le langage R (Racine and Hyndman (2002), Paradis (2005)) vont être utilisées. Chapitre 2 Eléments de mathématiques financières Ce chapitre introductif est un important leçon des mathématiques financières qui concerne l’investissement, le crédit et les taux d’intérêts. Son objectif principale est la présentation des concepts fondamentaux de l’actuariat : l’actualisation et la capitalisation. 2.1 Notions de base : Actualisation et Capitalisation 2.1.1 Valeur du temps Le taux d’intérêt est un élément crucial dans la théorie quantitative de la monnaie. La théorie keynésienne du taux d’intérêt suppose que (Poulon (1980) "Mais étant donné que le taux d’intérêt n’est jamais négatif, pourquoi aime-t-on mieux détenir la richesse sous une forme qui rapporte un intérêt faible ou nul que sous une forme qui rapporte un certain intérêt (bien entendu nous supposons pour l’instant qu’un avoir en banque et une obligation sont exposés au même risque de non paiement ? (Keynes, 1936, p. 179) " Pour le courant monétarisme ( Milton Friedman) ce débat théorique met en valeur le rôle du taux d’intérêt 2.1.2 Valeur capitalisée Notions de Capitalisation Le principe de base de la capitalisation est qu’un Dinar Tunisien aujourd’hui n’est pas égal à un Dinar Tunisien demain mais qu’il vaudra alors (un peu) plus : c’est ce que l’on appelle la valeur temps 11 12 Chapitre 2. Eléments de mathématiques financières de l’argent. Selon cette approche, un montant "X" placé durant une période σt Table 2.1 – Capitalisation Période 1 2 2 n Capitalisation début de période C C(1 + i) C(1 + i)2 C(1 + i)n−1 Intérêt Ci C(1 + i) ∗ i C(1 + i)2 ∗ i C(1 + i)n−1 ∗ i capitalisation fin de période C + Ci ou C(1 + i) C(1 + i)2 C(1 + i)3 C(1 + i)n Exemple Valeur acquise Exercice d’application Un investisseur place des annuités de fin de période d’un montant de 10000 Dinars au taux trimestriel de 1,467 1. Calculer le patrimoine acquis au bout de 8 ans et 3 mois. 2. Déterminer le nombre d’échéances pour qu’il se constitue à la fin de la durée du placement un capital de 548 645, 12 Dinars. 2.1.3 Valeur actualisée On définie généralement, la valeur actuelle d’une série de paiements p1 , p2 , . . . , pn à la fin des années 1, 2, . . . , n comme suit : j n Y X (1 + ik )−1 pj (2.1) j=1 k=1 avec ik représente le taux d’intérêt effectif de l’année k. Cependant, quand ik constant au cours des n années de placement, cette formule devient : n X (1 + i)−1 pj j=1 (2.2) 2.1. Notions de base : Actualisation et Capitalisation 13 Valeur actuelle Exercice d’application 1 Un individu emprunte aujourd’hui 10.000 dinars ; 1. Quel montant constant devrait-il verser à la banque à chaque fin d’année durant 10 ans, sachant que le taux d’intérêt annuel constant est de 8 % ? 2. Etablir le tableau d’amortissement sur 10 ans. 3. Calculer le coût de l’emprunt, interpréter le résultat trouvé. Exercice d’application 2 : calcul sur R Soit un prêt remboursé par une série de cinq paiements, le premier étant dû dans un an. On cherche à trouver le montant du prêt dans chacun des cas suivants : 1. Paiement annuel de 1 000 d, un taux d’intérêt de 6 % effectif constant et annuel. dans ce cas le paiement change d’une année à une autre mais le taux d’intérêt reste constant, donc on peux réutiliser la même formule. Solution sur R (L’utilisation de la formule Pn j=1 (1 + i)−1 pj ) avec pj = 1000 = p : > 1000 ∗ sum((1 + 0.06)( − (1 : 5))) [1] 4212.364 2. Cas où on a un paiement annuel variable : 500, 800, 900, 750et1000, avec le même taux d’intérêt. Solution sur R (L’utilisation de la formule Pn j=1 (1 + i)−1 pj ) avec p1 = 500, p2 = 800, p3 = 900, p4 = 750 p5 = 1000 : > sum(c(500, 800, 900, 750, 1000) ∗ (1 + 0.06)( − (1 : 5))) [1] 3280.681 3. Maintenant si on change le paiement annuel et le taux effectif annuel comme suit : 500, 800, 900, 750et1000, avec 5 %, 6 %, 5,5 %, 6,5 % et 7 %. Solution sur R 14 Chapitre 2. Eléments de mathématiques financières >sum(c(500, 800, 900, 750, 1000)/ +cumprod(1 + c(0.05, 0.06, 0.055, 0.065, 0.07))) [1] 3308.521 4. Calculer le montant du prêt lorsque le taux d’intérêt change 5 %, 6 %, 5,5 %, 6,5 % et 7 % et le montant de paiement reste constant (1000d) 2.2 2.2.1 Emprunts indivis Généralités Dans le cas d’emprunts indivis nous supposons la présence d’emprunts ”K” à intérêts composés au taux nominal "i" et qui implique un préteur et un emprunteur. Le remboursement ou l’amortissement (”m”) est effectué à travers ”n” annuités A1 , A2 , ..., An aux dates t = 1, 2, .... , n. La somme des amortissements, est par définition, égale au montant emprunté : K= n X mi (2.3) k=1 avec : Table 2.2 – Capitalisation Période 1 2 ... p ... n KDP K = D0 D1 = D0 − m1 ... Dp−1 = Dp−2 − mp−1 ... Dn−1 = Dn−2 − mn−1 Intérêt D0 ∗ i D1 ∗ i ... Dp−1 ∗ i ... Dn−1 ∗ i Amortissement m1 m2 ... mp ... mn Annuités A1 A2 ... Ap ... An KRD D0 − m1 D1 − m2 ... Dp−1 − mp ... Dn−1 − mn • KDP :represente le capital debut de période • KRD : le capital restant dû ou bien le capital de fin de période Si nous examinons la première ligne de ce tableau nous remarquons que la dette de la première période c’est le capital remboursé puisque nous n’avons encore rien à rembourser (K = D0 ). Pour remplir correctement ce tableau nous devons suivre la formule-règle qui exige que l’annuité est composée de deux partie. Une première partie qui est l’amortissement du capital correspondant à la période t plus les intérêts de la même période : At = mt + It (Annuités = amortissements + intérêts) (2.4) 2.2. Emprunts indivis 2.2.2 15 Cas particuliers Amortissement par annuités constantes le tableau d’amortissement dans le cas des annuités constantes obéi à toutes les règles du cas général. A l’aide de la formule-règle nous pouvons construire notre tableau d’amortissement en prenant en considération que les annuités ne changent pas en passant d’une période à une autre : Nous pouvons remarquer évidement que le remplissage de ce tableau nécessite le calcul de l’annuité Table 2.3 – Capitalisation Période 1 2 ... p ... n KDP K = D0 D1 = D0 − m1 ... Dp−1 = Dp−2 − mp−1 ... Dn−1 = Dn−2 − mn−1 Intérêt D0 ∗ i D1 ∗ i ... Dp−1 ∗ i ... Dn−1 ∗ i Amortissement m1 m2 ... mp ... mn Annuités A A ... A ... A KRD D0 − m1 D1 − m2 ... Dp−1 − mp ... Dn−1 − mn ainsi : Calcul de l’annuité : Dans le cas où les annuités sont constantes, la formule de la valeur actuelle devient sous la forme d’une suite géométrique de raison (1+i) : V0 = A ∗ 1 − (1 + i)− n i (2.5) d’où nous pouvons simplement déduire la valeur de l’anuité A : A= V0 ∗ i K ∗i = − 1 − (1 + i) n 1 − (1 + i)− n (2.6) avec : A1 = A2 = ... = An = A (2.7) Table 2.4 – Capitalisation Période 1 2 ... p ... n KDP K = D0 D1 = D0 − m1 ... Dp−1 = Dp−2 − mp−1 ... Dn−1 = Dn−2 − mn−1 Intérêt D0 ∗ i D1 ∗ i ... Dp−1 ∗ i ... Dn−1 ∗ i Amortissement m m ... m ... m Annuités A1 A2 ... Ap ... An KRD D0 − m1 D1 − m2 ... Dp−1 − mp ... Dn−1 − mn Amortissement par série égales Pareillement que le cas président, dans ce tableau on ne change que la colonne des amortissements ( qui sont devenu constants pour toutes les périodes). Il suffit donc 16 Chapitre 2. Eléments de mathématiques financières de calculer le montant d’amortissement puis remplir le tableau normalement : m1 = m2 = ... = mp = ... = mn = m = Amortissement in fine K n (2.8) Le remboursement in fine ne nécessite pas le paiement des amortissements dans les n − 1 périodes, mais simplement le paiement de la dette à la ni ème période. Ce cas est rarement utilisé dans la réalité puisque il apporte un montant d’intérêt très élevé : Puisque ce tableau est basé Table 2.5 – Capitalisation Période 1 2 ... p ... n KDP K = D0 D0 ... D0 ... D0 Intérêt D0 ∗ i D0 ∗ i ... D0 ∗ i ... D0 ∗ i Amortissement 0 0 ... 0 ... D0 Annuités A1 A2 ... Ap ... An KRD D0 D0 ... D0 ... 0 sur la formule règle (formule qui garantie l’équilibre du tableau), nous pouvons en déduire que pour les (n − 1)i ème périodes les montant des intérêts égale le montant des annuités. 2.2.3 Le coût de l’emprunt Le coût de l’emprunt (CˆE ) n’est autre que la charge financière supportée par l’emprunteur. Cette charge représente la somme des annuités (intérêts + amortissement). Comme évoqué précédemment, le calcul de l’intérêt de l’emprunt se fait en appliquant un taux d’intérêt de l’emprunt. Bien entendu, le montant de l’intérêt contenu dans la première annuité de remboursement est calculé sur la base du montant global du prêt (ou encore le montant début de période). Le calcule du coût de l’emprunt ce fait alors à travers la formule suivante : CˆE = n X Aj (2.9) j=1 2.3 Les emprunts obligataires Les titres à revenu fixe sous forme d’intérêts appartiennent à ce type d’engagements financiers : obligations, certificats divers, actions privilégiées et autres titres sur lesquels un gain conditionnel est versé. Les investissements en valeurs mobilières appartiennent aux investissements financiers. Les obligations constituent le principal type de titres à revenu fixe. Le cautionnement est un titre qui atteste que son titulaire a consenti un prêt à son émetteur. En règle générale, l’obligation garantit à son détenteur de recevoir régulièrement un revenu fixe sous forme d’intérêts sur la valeur nominale et à la fin du mois - d’un certain prix de rachat, généralement identique à la valeur faciale. 2.3. Les emprunts obligataires 2.3.1 17 Les caractéristiques des obligations Les principaux paramètres de l’obligation sont : 1. le prix nominal ou le prix de rachat, s’il est différent de la valeur nominale. 2. La date du remboursement. 3. Le taux de rendement ou le taux du coupon. Il s’agit du taux d’intérêt sur lequel un gain est régulièrement versé au détenteur du lien. 4. Les conditions de paiement des intérêts La présence ou l’absence d’une interdiction de remboursement préalable des obligations revêt une certaine importance. La présence du droit de remboursement antérieur de l’émetteur réduit la qualité de l’obligation, car le degré d’incertitude augmente pour l’investisseur. Nous pouvons classer les obligations selon les méthodes de paiement des bénéfices et de libération des emprunts. 2.3.2 Les différents types d’obligations Comme déjà évoqué dans la section précédente, il existe différent types d’obligations selon plusieurs critères : 1. Les obligations sur lesquelles seuls des paiements d’intérêts sont versés et le capital n’est pas remboursé. L’émetteur indique seulement la possibilité de leur rachat sans se lier avec un certain terme. 2. Les obligations sur lesquelles les intérêts ne sont pas payés : Ce sont les obligations à zéro-coupon. 3. Les obligations sur lesquelles les intérêts sont calculés pour les détenteurs et payées avec la valeur nominale au moment du remboursement. 4. Les obligations permettant à leurs détenteurs d’obtenir un revenu régulièrement versé sous forme d’intérêts et le prix de remboursement futur à la décharge. Ce type de d’obligation est le plus répandu. 2.3.3 Détermination du rendement total des obligations Le rendement total des obligations est constitué de trois éléments : 1. le rendement du coupon régulièrement payé 2. l’évolution du prix de marché de l’obligation pendant une certaine période. Si l’obligation a été achetée avec un prix inférieur à la valeur nominale alors cet élément du rendement est une valeur 18 Chapitre 2. Eléments de mathématiques financières positive. Si l’obligation a été achetée à un prix supérieur à la valeur nominale cet élément du rendement sera une valeur négative. Si le prix d’achat est égal à la valeur nominale, alors cet élément du rendement est manquant ; 3. le rendement de la réinvestissant flux entrants des coupons Il existe quelques méthodes et indices pour mesurer le rendement des obligations. Par exemple, le rendement de l’obligation avec un paiement d’intérêts régulier peut être mesuré sous la forme du rendement du coupon, mais dans ce cas, le deuxième élément du rendement ne sera pas pris en compte. La méthode de calcul du rendement total des obligations repose sur la détermination de la valeur actuelle du flux de paiement acquis par le détenteur de l’obligation. Parallèlement, l’actualisation des paiements est effectuée au taux du rendement à l’échéance. Le rendement de l’obligation sans paiement d’intérêts Une telle obligation a une seule source de revenus pour l’investisseur - la différence entre le prix de rachat de l’obligation (valeur nominale) et le prix d’achat (prix du marché). Soit P le prix de marché de l’obligation (prix d’achat), N la valeur nominale, n la durée avant son échéance. A la fin du terme, le détenteur d’une telle obligation obtiendra un prix identique à la valeur nominale. Cette valeur doit être actualisée et sa valeur actuelle doit être assimilée au prix de marché de l’obligation. En conséquence, nous obtiendrons l’équation suivant : N vn = P avec v = 1 1+i , (2.10) et i le taux de rendement recherché, donc : i= N(1 )−1 P n Le rendement de l’obligation avec paiements d’intérêts à la fin de la durée (2.11) Pour ce type d’obligation, les intérêts sont facturés et payés à la fin de la période sous forme d’une somme unique, ainsi que de la valeur nominale. Cet obligation a deux sources de revenus : 1. les intérêts sur toute la période de l’emprunt ; 2. la plus-value, c’est-à-dire la différence entre la valeur nominale et le prix d’achat. À la fin du terme, le détenteur d’une telle obligation recevra la somme N (1 + g)n Si nous escomptons cette valeur et assimilons le résultat avec le prix d’achat. Nous allons obtenir l’équation suivante : N (1 + g)n v n = P (2.12) 2.3. Les emprunts obligataires 2.3.4 19 Evaluation des obligations l’un des principaux objectifs de l’analyse financière des valeurs mobilières est la publication des valeurs mal évaluées par le marché. Supposons qu’il soit possible de divulguer des titres évalués incorrectement par le marché sur la base des informations disponible. Pour cela, il est possible de disposer d’une procédure analytique permettant à l’investisseur de divulguer ces obligations et de prendre des décisions motivées en ce qui concerne la vente ou l’achat de ces obligations. Pour cela il existe deux approches pour résoudre le problème donné : 1. Le taux de rendement à l’échéance des obligations analysées par l’investisseur est comparé à la valeur du taux "juste", selon l’investisseur. L’investisseur forme leur avis sur la base de l’analyse des deux caractéristiques des obligations et la situation actuelle du marché. Si le rendement de l’obligation est supérieur à celui du taux juste, il est alors dit que l’obligation est sous-évaluée et est, dans ce cas, un candidat à l’achat. Si le rendement à l’échéance est inférieur à la juste, l’obligation est dite surévaluée et devient candidate à la vente. 2. L’investisseur évalue la valeur réelle ou intrinsèque de l’obligation et la compare au prix du marché. Si le prix du marché actuel est inférieur à la valeur intrinsèque, l’obligation est sous-évaluée par le marché et, inversement, si le prix du marché actuel est supérieur à la valeur intrinsèque, l’obligation est surévaluée. Les deux procédures d’analyse et d’évaluation de l’obligation reposent sur la méthode de la capitalisation des revenus, c’est-à-dire sur la réduction de tous les paiements sur l’obligation au moment présent. Pour la suite nous considérons la première approche. Quelle est la différence entre maturité et duration d’une obligation ? • La maturité d’une obligation désigne sa durée de vie. Autrement dit c’est le temps total nécessaire jusqu’à ce que le montant principal de l’obligation soit remboursé. Par exemple, une obligation à 20 ans génère un coupon tous les ans pendant 20 ans à partir de la date de l’émission. Au terme de la 20 ème année, le paiement des coupons cessera est le principal de l’obligation sera remboursé. • La duration est une notion importante pour pour l’analyse du risque lié au remboursement de la valeur de l’obligation. En effet, c’est une mesure de la sensibilité des obligation par rapport aux taux d’intérêts du marché. Quelle est l’impact d’une variation des taux d’intérêt ? Soient des obligations de valeur nominale qui vaut 1000d, elles sont émises le 15/10/N avec un pris d’émission qui vaut 990 d. Sachant que : 20 Chapitre 2. Eléments de mathématiques financières • le taux obligataire est de 5% ; • les coupons sont payés le 30 septembre de chaque année ; • les obligations sont remboursables in fine le 1er octobre N+5 au prix de 1020d ; • la durée de l’emprunt est de 5 ans. T.A.F : Prenons la date 1er octobre N+2 avec un taux de 6%, calculer à cette date la valeur actuelle des coupons annuels (50 d pendant 3 ans) et du prix de remboursement 1020d. Que se passe t-il si le taux d’intérêt passe à 7%. Réponse 1 • 1er cas : taux d’interet (i) = 6% c = (1000 ∗ 0.05) ∗ [ 1 − (1.06)− 3 + 1020(1.06)− 3 0.06 (2.13) 1 − (1.07)− 3 + 1020(1.07)− 3 0.07 (2.14) donc c = 990.06d • 2er cas : taux d’interet (i) = 7% c = (1000 ∗ 0.05) ∗ [ donc c = 963.83d Ces résultats nous montre qu’il existe une relation inverse entre le prix de l’obligation et le taux d’intérêt du marché. Ainsi, si le taux du marché augmente l’investisseur risque de percevoir un prix inférieur au prix de remboursement de l’échéance. Chapitre 3 La gestion de risque et les courbes de taux Pour tout investisseur désirant faire un placement, ce qui importe c’est le taux de rendement qu’il va l’appliquer sachant que celui-ci est fluctuation permanente sur le marché. Evidement, ces varaiations du taux d’intérêt affecte la rentabilité du placement. Ainsi, la courbe des taux est un bon outil visant à donner meilleur visibilité qui vise à aider les investisseurs à déterminer le taux de (d’intérêt) rendement des différents placements en fonction de la maturité. 3.1 Structure par terme des taux d’intérêt La structure par terme des taux d’intérêt est définie comme la façon dont ils varient entre obligations de mêmes risque, liquidité, fiscalité, mais de maturités différentes. Toutes choses égales par ailleurs, la représentation des taux d’intérêt d’obligations de maturités différentes s’appelle courbe des taux (yield curve). 3.1.1 La courbe des taux : yield curve La courbe des taux (Yield Curve ) est définit comme étant la représentation graphique des taux d’intérêts (rendements) offerts par les titres obligataires d’un même émetteur selon leur échéance de la plus courte à la plus longue. Concrètement, la courbe des taux et la fonction qui, à quelconque une date et pour toute maturité en abscisse, donne le niveau du taux d’intérêt associé en ordonnée. Cette courbe peut être : • croissante (taux à long terme supérieurs aux taux à court terme), 21 22 Chapitre 3. La gestion de risque et les courbes de taux • plate (taux à long terme égaux aux taux à court terme), • décroissante ou inversée (taux à long terme inférieurs aux taux à court terme). La forme de cette courbe est liée aux principalement aux anticipations des investisseurs concernant l’évolution des taux d’intérêts sur le marché. Généralement, les taux longs sont considérés comme porteur de risque puisqu’ils sont supérieurs aux taux courts. Selon cette hypothèse, le taux augmente chaque fois que la durée du placement augmente. En effet, la relation entre les taux longs et les taux courts a été l’objet de plusieurs études qui ont proposé la formulation suivante(Pluyaud (2006) : TL = X T C anticipés + (3.1) Implications : 1) Le taux long c’est une moyenne des taux courts anticipés et il est plus stable que le taux court. 2) Une variation du taux court a un impact sur le taux long uniquement si elle est perçue comme durable. 3)Si l’évolution des taux courts est parfaitement anticipée elle n’a pas d’effet sur les taux longs puisque ceux-ci incorporent déjà la variation des taux courts. 4) La forme de la courbe des taux est affectée directement par le SPREAD (S), qui représente la différence entre le taux long et le taux court (S = T L − T C). On outre, cette courbe peut nous aider à expliquer l’évolution du tout directeur de la banque centrale. En effet, nous pouvons classer les maturités en court terme et long terme : on parle alors de partie courte et longue de la courbe. Pour la partie longue c’est la prime de risque liée aux incertitudes sur la solvabilité et au défaut de l’émetteur qui est déterminante. Ce risque est évalué par les agences de notation. Une note élevée indique une probabilité de défaut faible et le taux d’intérêt de long terme exigé est faible. A. cas où la Courbe est croissante : Si S > 0 donc T L > T C. Une situation dite normale où la courbe des taux est croissante : Figure 3.1 – Yield Curve croissante 3.1. Structure par terme des taux d’intérêt 23 B. cas où la courbe est quasi plate : Si S = 0 donc T L = T C. Les deux taux ne varient pas selon la maturité, donc la courbe des taux est plate. Cette situation ne reflète pas les anticipations sur les taux à venir mais plutôt une situation de transition d’une courbe croissante vers une courbe décroissante. Figure 3.2 – Yield Curve plate C. cas où la Courbe est décroissante : Si S < 0 donc T L < T C. Contrairement au cas précèdent, cette courbe est liée directement aux anticipations sur les taux. Une situation dite anormale ou inversée : Figure 3.3 – Yield Curve Inversée 3.1.2 Étude de cas 1 : Courbe des taux de la Tunisie Dans cette section, nous nous somme basé sur l’article de Chakroun and Abid (2013) 1 pour discuter la courbe des taux tunisienne en période de crise. Les étudiants sont appelées à lire l’article et à préparer un résumé pour discuter les points importants en classe. • Objectif : L’objectif de cet article est de développer une méthodologie permettant d’estimer la 1. L’article utilise la classe Cubic spline. Cette classe de splines est la plus souvent utilisée pour définir des chemins pour les mouvements d’objet ou pour fournir une représentation d’un objet ou d’un dessin existant, mais des splines d’interpolation sont également parfois utilisées pour concevoir des formes d’objet (Hou and Andrews (1978)). 24 Chapitre 3. La gestion de risque et les courbes de taux Figure 3.4 – Courbe des taux de la Tunisie selon la méthode "cubic spline" courbe des taux d’intérêt et ses dynamiques sur le marché obligataire tunisien qui est considéré comme un marché illiquide avec un faible volume de transactions. • Le modèle utilisé :Les auteurs ont utilisé la méthode d’interpolation par splines cubiques pour résoudre le problème d’observation manquante. Ensuite, ils ont suivi les travaux de Vasicek (1977) et de Cox et al. (2005) pour estimer chaque modèle et discuter sa performance dans la prévision de la dynamique de la courbe de rendement des taux d’intérêt à l’aide des méthodes de moindres carrés ordinaires et de du maximum de vraisemblance. • Les données : L’échantillon de données comprend les prix des obligations du Trésor pour la période allant du 14 juillet 2004 au 10 septembre 2012, collectés sur le marché de gré à gré 2 . • Les principaux résultats :Les résultats suggèrent que la méthode du spline cubique est plus précise pour la construction de la courbe de rendement moyenne des taux d’intérêt. Ensuite, l’estimation des modèles Vasicek (1977) et Cox et al. (2005) génère des courbes de rendement à la hausse et le modèle Vasicek (1977) montre une plus grande capacité à reproduire les faits stylisés des taux d’intérêt à court terme sur le marché obligataire tunisien. Enfin, la prévision de la courbe de rendement prédit une croissance économique future caractérisée par une inflation plus élevée (voir figure 3.1). 2. C’est l’opposé du marché en bourse, c’est un endroit où les transaction entre acheteurs et vendeurs se fait directement sans intermédiaire 3.2. Théories explicatives de la structure par terme des taux d’intérêt 3.2 25 Théories explicatives de la structure par terme des taux d’intérêt 3.2.1 Hypothèse des anticipations - Le taux d’intérêt d’une obligation à long terme sera égal à la moyenne des taux d’intérêt à court terme auxquels on s’attend à ce que les gens se produisent au cours de la vie de l’obligation à long terme. - Les acheteurs d’obligations ne préfèrent pas les obligations d’une maturité à l’autre. ils ne détiendront aucune quantité d’une obligation si son rendement escompté est inférieur à celui d’une autre obligation avec une échéance différente. - Des obligations comme celles-ci sont considérées comme des substituts parfaits Exemple : Soit le taux actuel des obligations d’un an de 6%. L’année prochaine Vous vous attendez à ce que le taux d’intérêt d’une obligation soit de 8%. Ensuite, le rendement attendu de l’achat de deux obligations au bout d’un an est en moyenne (6% + 8%) / 2 = 7%. Le taux d’intérêt sur une obligation de deux ans doit être de 7% pour que vous soyez prêt à l’acheter. 3.2.2 La théorie des primes de liquidité La théorie de la prime de liquidité affirme que les détenteurs d’obligations préfèrent largement détenir des obligations à court terme plutôt que des obligations à long terme. Les obligations à court terme comportent un risque de taux d’intérêt moins élevé que les obligations à long terme, car leurs prix varient moins pour une variation donnée des taux d’intérêt. Ainsi, les investisseurs sont disposés à payer davantage pour les obligations à court terme que pour les obligations à long terme. En d’autres termes, les investisseurs ne sont disposés à détenir des obligations à long terme que s’ils reçoivent un taux d’intérêt plus élevé. Le taux d’intérêt supplémentaire demandé est la prime de liquidité. 3.2.3 La théorie de la segmentation de marché Selon cette théorieMishkin (2005) : - Les obligations de différentes échéances ne sont pas du tout des substituts. - Le taux d’intérêt pour chaque obligation ayant une échéance différente est déterminé par la demande et l’offre de cette obligation. - Les investisseurs ont des préférences pour les obligations d’une maturité par rapport à une autre. - Si les investisseurs ont de courtes périodes de détention souhaitées et préfèrent généralement des obligations à échéance plus courte comportant moins de risque de taux d’intérêt, cela explique pourquoi les courbes de rendement sont généralement à la hausse. 26 3.2.4 Chapitre 3. La gestion de risque et les courbes de taux La théorie des habitats préférés - Le taux d’intérêt d’une obligation à long terme sera égal à la moyenne des taux d’intérêt à court terme que l’on s’attend à obtenir pendant la durée de vie de l’obligation à long terme, plus une prime de liquidité qui correspond aux conditions de l’offre et de la demande pour cette obligation. - Les obligations de différentes échéances sont des substituts mais pas des substituts parfaits. Figure 3.5 – Relation entre l’hypothèse des anticipations et la théorie des habitats préférés source :Mishkin (2005) 3.3 La duration de Macaulay La duration peut être utilisée comme mesure de risque dans les investissements obligataires. Bien qu’il se présente sous de nombreuses formes, la plus utilisée est la duration de Macaulay Macaulay (1938). cette forme de durée mesure le nombre d’années nécessaires pour recouvrer le coût réel d’une obligation, en tenant compte de la valeur actuelle de tous les paiements de coupon et de principal reçus à l’avenir. Ainsi, c’est le seul type de durée "en années". On suppose que les taux d’intérêt sont composés de façon continue. Duration de M acaulay = DM = n X (P V )(CFt )t prix du marché de l0 obligation t=1 (3.2) avec (P V )(CFt ) = la valeur d’aujourd’hui du coupon à la date t t : temps à chaque cash flow (en années) n : nombre de périodes jusqu’à l’échéance. La durée modifiée . Cette mesure augmente ou modifie la durée de Macaulay afin de mesurer la réactivité du prix d’une obligation aux variations de taux d’intérêt. Il est défini comme la variation en pourcentage du prix pour une variation de 100 points de base des taux d’intérêt. La formule suppose que 3.3. La duration de Macaulay 27 les flux de trésorerie de l’obligation ne changent pas avec l’évolution des taux d’intérêt. Concretement c’est une extension de la durée de Macaulay car elle prend en compte les mouvements de taux d’intérêt en incluant la fréquence des paiements de coupon par an : DM La duration modif iée = D0 = 1+ rendement à l0 échéance nombre de périodes de coupon par an (3.3) La durée effective .La duration effective (parfois appelée duration ajustée des options) affine le calcul de la duration modifiée et est particulièrement utile lorsqu’un portefeuille contient des titres appelables. La durée effective nécessite l’utilisation d’un modèle complexe de tarification des obligations qui ajuste le prix de l’obligation afin de refléter les variations de la valeur des sera exercé. La durée effective incorpore les caractéristiques de rendement, de coupon, d’échéance finale et d’appel de l’obligation en un seul chiffre qui indique à quel point une obligation ou un portefeuille est sensible au prix. Par exemple, le prix d’une obligation d’une durée effective de deux ans augmentera (diminuera) de 2% pour chaque diminution (augmentation) de 1% du rendement. Plus la duration est longue, plus une obligation est sensible aux variations des taux d’intérêt. Le type de mesure de la durée utilisée dépendra de plusieurs facteurs, dont le type de placements analysés (par exemple, les titres bullet et les titres pouvant être appelés) et la préférence pour le calcul de la mesure à l’aide des outils internes généralement disponibles (pouvant être utilisés pour calculer Macaulay ou durée modifiée) par rapport à l’achat ou à l’utilisation d’un logiciel permettant de créer un modèle de simulation de divers scénarios de taux d’intérêt permettant de calculer la durée effective. Exemple : En utilisant la formule de Macaulay, calculer la duration de l’obligation ”B” avec les caractéristiques suivantes : taux d’intérêt effectif exigé de 7%, durée de vie égale à 3 ans, un coupon de 10% payé annuellement et une valeur nominal égale à 1000d (remboursement au pair). Réponse : Avant de calculer la duration, il faut calculer le prix de l’obligation : p= 100 100 1100 + + = 93.46 + 87.34 + 897.93 = 1, 078.73 1 2 (1.07) (1.07) (1.07)3 (3.4) Maintenant on peut calculer la duration selon la formule de Macaulay : D= 1 ∗ 93.46 2 ∗ 87.34 3 ∗ 897.93 + + = 2.7458 1, 078.73 1, 078.73 1, 078.73 (3.5) Il faut 2, 7458 ans pour récupérer le coût réel de l’emprunt obligataire. Calculons maintenant la duration modifiée avec les mêmes données : D0 = 2.7458 1+ 0.07 1 = 2.7458 = 2.566 1.07 (3.6) 28 Chapitre 3. La gestion de risque et les courbes de taux Pour chaque changement de 1% des taux d’intérêt du marché, la valeur de marché de l’obligation évoluera inversement de 2.566%. 3.3.1 La convexité L’une des limites de la duration en tant que mesure de la sensibilité au taux d’intérêt / prix est qu’il s’agit d’une mesure linéaire. C’est-à-dire qu’elle suppose que, pour une certaine variation en pourcentage des taux d’intérêt, une variation égale du pourcentage en prix se produira. Cependant, à mesure que les taux d’intérêt changent, le prix d’une obligation ne devrait pas changer de façon linéaire, mais plutôt sur certaines courbes fonctions convexes des taux d’intérêt. En effet, pour toute obligation donnée, un graphique de la relation entre le prix et le rendement est convexe. Cela signifie que ce graphique forme une courbe plutôt qu’une ligne droite (figure 3.3). Plus la relation est convexe, plus la duration n’est plus considérée comme une bonne mesure de la Figure 3.6 – Relation entre le prix de l’obligation et le taux de rendement sensibilité aux taux d’intérêt. La convexité d’une obligation est une mesure de la courbure de sa relation prix / rendement. Le degré de courbure du graphique montre dans quelle mesure le rendement d’une obligation varie en fonction d’un changement de prix. Utilisée conjointement avec la duration, la convexité fournit une approximation plus précise de la variation en pourcentage du prix résultant d’une modification spécifiée du rendement d’une obligation par rapport à l’utilisation de la duration seule. Outre l’amélioration de l’estimation des variations de prix d’une obligation en fonction de l’évolution des taux d’intérêt, la convexité peut également être utilisée pour comparer des obligations de même durée. Par exemple, deux liaisons peuvent avoir la même durée mais des valeurs de convexité différentes. Ils peuvent subir des variations de prix différentes en cas de variations extraordinaires des taux d’intérêt. Par exemple, si l’obligation A a une convexité supérieure à celle de l’Obligation B, son prix baisserait moins lors de la hausse des taux d’intérêt et s’apprécierait davantage lors de la baisse des taux d’intérêt par rapport à l’obligation B. 3.4. Les risques obligataires 3.4 29 Les risques obligataires Plusieurs facteurs peuvent avoir un impact sur le risque supporté par les obligataires. 3.4.1 Le risque de taux Tout le monde sont d’accord pour dire que la valeur d’une obligation évolue au sens inverse en fonction des variations du taux d’intérêt. Cependant la sensibilité de la valeur d’une obligation à ce paramètre n’est pas la même selon la maturité (date de remboursement) de l’obligation. Prenons le cas d’une obligation de valeur nominal 1000d, qui verse un coupon de 10% de sa valeur selon différents taux sur le marché, en distinguant deux cas, selon que l’obligation a une maturité résiduelle de 1 ou de 10 ans. Figure 3.7 – valeur d’une obligation selon sa maturité et le taux d’intérêt Ces valeurs nous donne le graphique suivant : On observe sur ce graphique que deux obligations ayant le même nominal (1000) et versant le même Figure 3.8 – valeur d’une obligation selon sa maturité et le taux d’intérêt 30 Chapitre 3. La gestion de risque et les courbes de taux coupon (100) vont réagir différemment à l’évolution des taux sur le marché. Plus la maturité de l’obligation est grande, plus l’obligation est sensible aux variations de taux d’intérêt. Graphiquement, cela se traduit par une courbe de valeur plus pentue. Une mesure du degré d’exposition de l’obligation au risque de taux est donnée par la duration de l’obligation, qui correspond à sa maturité moyenne pondérée. 3.4.2 Le risque de crédit Le détenteur d’une obligation, en plus du risque de taux, fait face à un risque de crédit. Ce risque peut prendre trois formes : 1. Le risque de défaut : C’est le cas l’émetteur ne paie pas les coupons ou la valeur de remboursement à l’échéance. Cependant, en cas de liquidation, les obligations seront remboursées avant les actionnaires et recevront, selon la valeur des actifs disponibles de l’émetteur, tout ou partie des sommes dues. 2. Le risque de spread :Le rendement attendu d’une obligation dépend d’une prime de risque dont l’objet est de compenser la prise de risque liée à l’investissement obligataire : cette prime s’appelle le spread. 3. Le risque de dégradation : C’est le cas où la note accordée par l’agence de notation à l’emprunt émis baisse. 3.4.3 La notation (rating) des emprunts obligataires La notation consiste à apprécier le risque de défaut de l’émetteur de l’obligation et la probabilité de non remboursement de cette dernière. En fonction de plusieurs critères les agences de notation vont attribuer une note sous la forme d’une lettre (A par exemple) à l’emprunt émis. La note attribuée est importante car elle détermine le taux auquel l’émission obligataire peut être réalisée. Chapitre 4 Les sinistres Les sinistres sont les bases de l’assurance. Afin de trouver le bon contrat d’assurance, il faut bien modéliser et calculer le montant d’un sinistre. 4.1 4.1.1 Rappels sur les notions de probabilité et de statistique Limites d’une fonction a. Théorème du «sandwich» : Ce théorème est très important pour le calcule de limite quand il n’est pas possible de calculer directement la limite d’une fonction ”f (x)” : selon ce théorème nous pouvons calculer indirectement cette limite. Énoncée du théorème : Soient f (x), g(x) et h(x) des fonctions et la relation g(x) ∗ f (x) ∗ h(x) valide pour tout x dans un intervalle ouvert contenant le point c. Si : alors : Exemple 1 : On pose la relation suivante : 31 32 Chapitre 4. Les sinistres Pour tout x ∼ 0, nous voulons déterminer la limite suivante : C’est difficile de le trouver, nous pouvons donc utiliser le théorème du sandwich, d’une part limx→0 1 = 1 et d’autre part limx→0 1 − x2 6 = 1 donc, b. Règle de l’Hôpital La règle de l’Hôpital permet de réaliser des calculs de limites lorsque des formes indéterminées (par exemple ; Énoncée du théorème : ∞ 0 ∞, 0, 0 ∗ ∞) sont rencontrées. La règle de L’Hôpital stipule que pour deux fonctions f et g qui sont différentiables sur un intervalle ouvert I, sauf éventuellement en un point c contenu dans I, si 0 0 limx→c f (x) = limx→c g(x) = 0 ou ∞, g (x) 6= 0 ∀x ∈ I avec x 6= c et limx→c f (x) g 0 (x) ∃, alors : Exemple 2 : Soit la fonction suivante : En cherchant sa limite nous obtiendrons la forme indéterminée nous obtiendrons : 0 0 en utilisant la règle de L’Hôpital 4.1. Rappels sur les notions de probabilité et de statistique 4.1.2 33 Théorème des grands membres En statistique, cette loi affirme que à mesure que le nombre de variables identiquement distribuées générées de manière aléatoire augmente, leur moyenne d’échantillon (moyenne) se rapproche de leur moyenne théorique. Enoncée du théorème : si X1 , X2 , ..., Xn sont des variables aléatoires indépendantes ayant une distribution commune avec la moyenne µ, alors pour tout nombre > 0, peu importe sa taille, comme n → ∞ alors : P [| n− (X1 , ..., Xn ) − µ |< ] → 1 L’assurance repose en grande partie sur la «loi des grands nombres». Dans les grandes populations homogènes, il est possible d’estimer la fréquence normale d’événements courants tels que les décès et les accidents. Les pertes peuvent être prédites avec une précision raisonnable, et cette précision augmente à mesure que la taille du groupe augmente. D’un point de vue théorique, il est possible d’éliminer tout risque pur si un groupe infiniment grand est sélectionné. Exemple 3 : Le lancement d’un dés à six faces produit l’un des nombres suivants : 1, 2, 3, 4, 5 ou 6, ayant la même probabilité d’apparaitre. Par conséquent, la valeur espérée d’un seul jet de dé est : 1+2+3+4+5+6 = 3.5 6 Selon la loi des grands nombres, si un grand nombre de dès à six faces sont lancés alors la moyenne de ses valeurs (la moyenne de l’échantillon) est susceptible d’être proche de 3.5, notons aussi que la précision augmente avec le nombre de dès lancé. 4.1.3 Variable aléatoire Soit X, une variable aléatoire. Il s’agit d’une fonction qui, à chaque élément de l’espace fondamental ω d’une expérience aléatoire, associe un nombre réel. a. Fonction de répartition La fonction de répartition F (x), également appelée fonction de distribution cumulative ou fonction de fréquence cumulative, décrit la probabilité qu’une variable X prenne une valeur inférieure ou égale à un nombre x : F (x) = P [X ≤ x] Cependant, pour que la fonction F (x) soit une fonction de répartition il faut la réunion des trois conditions suivantes : • F (x) soit non décroissante 34 Chapitre 4. Les sinistres • F (x) est continue par la droite, c’est-à-dire que pour tout point x0 , la valeur limite de F (x) lorsque x s’approche de x0 par la droite est F (x0 ) ; • limx→−∞ F (x) = 0 et limx→∞ F (x) = 1 Figure 4.1 – Fonction de répartition Remarque : il existe une fonction G(x) appelée fonction de survie et qui représente le complement de F (x). En effet, elle regroupe tous les X qui sont supérieur ou égale à x. c. Densité de probabilité : Soit f (x), la fonction de densité de probabilité de la variable aléatoire continue X. On considère f (x) comme une densité de probabilité si et seulement si elle satisfait les deux conditions suivantes : • f (x) ≥ 0 pour toutes les valeurs de X appartenant à Ω ; • R Ω 4.1.4 f (x)dx = 1 Estimation Échantillonnage Soit X1, ..., Xn des variables aléatoires mutuellement indépendantes et identiquement distribuées (i.i.d.) avec la fonction de répartition F (.). Alors ces variables aléatoires forment un échantillon aléatoire de la distribution F (.). Soit X1, ..., Xn un échantillon aléatoire. Alors : X̂ = 1 N Pn i=1 (Xi ) représente la moyenne de l’échantillon et P S 2 = N1 ni=1 (Xi − X̂)2 est sa variance. 4.1. Rappels sur les notions de probabilité et de statistique 35 Propriétés L’estimation nous permet de déterminer la valeur d’un ou plusieurs paramètres d’une distribution. On distingue : 1. l’estimation ponctuelle, où l’on cherche une valeur pour un paramètre ; 2. l’estimation par intervalle, où l’on cherche des limites à l’intérieur desquelles se trouve un paramètre. Notons que l’estimation est liée aux tests d’hypothèses. Ces tests peuvent déterminer si l’on accepte ou rejette une valeur ou un ensemble de valeurs d’un paramètre. En estimation ponctuelle, on utilise une statistique comme estimateur d’un paramètre de la distribution de la population. De manière générale, on considère la variable aléatoire X avec fonction de densité de probabilité fx (x; θ), où θ est le paramètre inconnu de la distribution. L’estimation de θ suit les étapes suivantes : 1. On définit X1 , ..., Xn , un échantillon aléatoire de f (x; θ). 2. On définit θ̂ = T (X1 , ..., Xn ) une fonction T (.) de X1 , ..., Xn comme estimateur de θ. En peut vérifier les propriétés de cet estimateur : s’il est sans biais (en moyenne, l’estimateur tombe-t-il sur la vraie valeur du paramètre ?), efficace (les valeurs de l’estimateur sont-elles concentrées autour de la moyenne ?), convergent, exhaustive. Quelques méthodes d’estimation 1. Méthode des moments : La méthode des moments est la plus simple et intuitive technique d’estimation et parfois la seule vraiment disponible. Pour avoir notre estimateur, nous devons égaler les moments de la population (moments «théoriques ») aux moments empiriques. Le k e moment empirique d’un échantillon x1 , ..., xn est : mk = 1 n Pn k i=1 xi . Si la distribution de la population compte r paramètres à estimer, on résout donc le système à r équations, on résout donc un système à r équations telque : mk = E[X k ], k = 1, ..., r 2. Méthode du maximum de vraisemblance : Si x1 , ..., xn sont les observations d’un échantillon aléatoire X1 , ..., Xn issu d’une distribution f (x; θ), alors la fonction de vraisemblance de l’échantillon est : L(θ) = f (X1 , ..., Xn ) = Qn i=1 f (xi ; θ) L’estimateur du maximumde vraisemblance maximise doncL(θ) ou, de manière équivalente, la logvraisemblance logL(θ) 36 4.2 Chapitre 4. Les sinistres Modélisation des sinistres Un modèle est une description plus ou moins simplifiée d’une réalité. Le modèles actuariels peuvent être de plusieurs types : • Coûts des réparation après incendie d’une maison, • Fréquence des accidents automobiles, • Décès de personnes dans une population, etc. Le modèle permet de prévoir les coûts futurs d’un système d’assurance et de mesurer le risque relatif à ces prévisions. En réalisant la modélisation, il faut toutefois trouver un certain équilibre entre simplicité et vraisemblance du modèle. Le processus de modélisation compte les étapes suivantes : 1. trouver un modèle (sous forme paramétrique ou non) décrivant «bien» les données disponibles, 2. calibrer le modèle, par exemple en estimant ses paramètres, 3. valider le modèle, par exemple en mesurant l’ajustement à l’aide de tests statistiques. 4.2.1 Données Les données en assurance dommages se présentent principalement sous deux formes : • Individuelles : Le montant individuel de chaque sinistre est connu : [141, 16, 46, 40, 351] • Groupées : Les montants de sinistres individuels sont inconnus. On ne dispose que d’un sommaire du nombre de sinistres par intervalle. Un jeu de données groupées révèle généralement qu’il y a eu nj sinistres dans l’intervalle de coûts 4.3 Modélisation non paramétrique Cette approche a comme avantages d’être flexible et de bien prendre en compte la disparité des données. De plus, elle peut être très précise lorsque le nombre de données est grand. Par contre, elle est souvent moins efficace qu’une approche paramétrique et l’inférence statistique qui en résulte est plus compliquée. 4.3.1 Statistiques descriptives Les moments : Le moment d’ordre r d’une variable aléatoire X n’est autre que l’espérance de cette variable élevée à la puissance r, tel que : µ0 r = E[X r ] = R inf ty r x dF (x) 0 4.3. Modélisation non paramétrique 37 Les moments centraux : Le moment central d’ordre r d’une variable aléatoire X n’est autre que l’espérance de la difference de cette variable et sa moyenne élevée à la puissance r, tel que : µr = E[(X − E[X])r ] = R inf ty 0 (xµ )r dF (x) => c’est la mesure de la dispersion de la variable x autour de sa moyenne. Les quantiles : Un quantile correspond à la division d’un échantillon en sous-groupes adjacents de taille égale. Il peut également être définit comme la division d’une distribution de probabilité en zones de probabilité égale. On dit que qp est le 100pème quantile d’une distribution F (X) ssi : limh→0 F (qp − h) ≤ p ≤ F (qp ) 4.3.2 Fonctions de répartition et de probabilité empiriques Pour commencer un processus de modélisation, la première étape consiste souvent à tracer des graphiques permettant de déterminer l’allure globale la distribution des données. Les fonctions sousjacentes à ces graphiques constituent en fait des estimateurs de la fonction de répartition et de la fonction de densité de probabilité. 1. Données individuelles : Ce sont les données non groupées, également appelées données brutes, sont des données qui n’ont pas été placées dans un groupe ou une catégorie après la collecte. Les données sont classées en chiffres ou en caractéristiques. Par conséquent, les données qui n’ont pas été classées dans aucune des catégories ne sont pas groupées. Par exemple, lorsque vous effectuez un recensement et que vous souhaitez analyser le nombre de femmes âgées de plus de 45 ans dans une région donnée, vous devez d’abord savoir combien de personnes résident dans cette région. 2. Données groupées : Les données groupées sont le type de données classées en groupes après la collecte. Les données brutes sont classées dans différents groupes et un tableau est créé. L’objectif principal du tableau est de montrer les points de données apparaissant dans chaque groupe. Par exemple, lorsqu’un test est effectué, les résultats sont les données de ce scénario et il existe de nombreuses façons de regrouper ces données. Par exemple, le nombre d’élèves ayant obtenu une note supérieure à 20 points peut être enregistré. 4.3.3 Estimateurs de la fonction de survie : Installation du package "survival" dans R (Therneau and Lumley (2014) L’analyse de survie (ou analyse de la durée) est un domaine de statistiques qui modélise et étudie le temps jusqu’à un événement d’intérêt a lieu. En effet, dans l’analyse de survie, l’objectif est de modéliser les «données de temps d’événement» de manière appropriée et faire une inférence correcte en prenant en compte ses caractéristiques spéciales. 38 Chapitre 4. Les sinistres j 1 2 3 4 5 6 yj 0.8 2.9 3.1 4.0 4.1 4.8 rj 8 7 5 4 2 1 sj 1 2 1 2 1 1 Données de survie : Considérons d’abord la situation des données de survie, où nous souhaitons étudier le délai avant décès (ou un autre événement) pour une population homogène avec une fonction de taux de risque α(t) et une fonction de taux de risque cumulé A(t) = Rt 0 α(s)ds. Supposons que nous ayons un échantillon de n individus de cette population. Notre observation des temps de survie de ces individus sera généralement soumise à une censure de droite, ce qui signifie que pour certains individus, nous savons seulement que leur temps de survie réel dépasse certains temps de censure. La censure est supposée indépendante en ce sens que la connaissance supplémentaire de la censure avant tout moment t ne modifie pas le risque d’échec en t. 1. Définition du groupe risque : Les estimateurs non paramétriques de la fonction de survie sont basés sur le nombre de sujets faisant toujours partie du groupe témoin à différents moments dans le temps. On suppose de tirer aléatoirement un échantillon, x1 , ..., xn de la variable aléatoire X et que y1 < ... < yk les k (avec k ≤ n)valeurs uniques et triées de l’échantillon. Également, on définit le nombre de fois que la donnée yi apparait dans l’échantillon (donc Pk j=1 = n). On défit alors la variable sj comme le nombre de décès de la durée yj . Finalement, on considère rj comme le nombre de sujets dans le groupe témoin juste avant les sj décès à la durée yj . Exemple : soient les données individuelles suivantes : [0.8; 2.9; 3.1; 4.0; 4.1; 4.8], on donne le tableau suivants : Selon cette distribution, la fonction de répartition empirique est : 4.3. Modélisation non paramétrique ∼ 39 ∼ 2. Estimateur de Nelson-Aalen : L’estimateur Nelson-Aalen est un estimateur non paramétrique qui peut être utilisé pour estimer la fonction de taux de risque cumulé à partir de données de survie censurées. Étant donnée aucune hypothèse de distribution n’est nécessaire, une utilisation importante de l’estimateur consiste à vérifier graphiquement l’ajustement des modèles paramétriques. On commence tout d’abord à calculer le taux d’incidence qui est définit comme suit : h(x) = f (x) s(x) 0 = s (x) s(x) = −d dx logs(x) (avec s(x) = 1 − F (x)) représente la fonction de survie de la variable aléatoire X). En effet, l’estimateur ∼ de Nelson-Aalen exploite ce lien pour estimer la fonction de survie. L’estimateur du taux d’incidence cumulé est : Un estimateur de la fonction de survie est alors comme suit : Evidement, nous pouvons déduire une estimation de la fonction de répartion F (x) : Exemple sur R : On considère les mêmes données de l’exemple précédent, l’estimation selon Nelson- ∼ Aalen de la fonction du taux d’incidence cumulé nous donne : Sous R : Nous pouvons aussi determiner une estimation de la fonction de survie : 40 Chapitre 4. Les sinistres Ces estimations donnent les graphiques ci-dessus : 3. Estimateur de Kaplan-Meier : L’estimateur de Kaplan-Meier est un estimateur non paramé- trique qui peut être utilisé pour estimer la fonction de distribution de la survie à partir de données censurées. Considérons la situation des données de survie dans laquelle nous souhaitons étudier le délai avant décès (ou un autre événement) pour une population homogène avec la fonction de distribution de survie S(t) représentant la probabilité qu’un individu soit en vie au moment t. Supposons que nous ayons un échantillon de n individus de cette population. Notre observation des temps de survie de ces individus sera généralement soumise à une censure à droite, ce qui signifie que pour certains individus, 4.3. Modélisation non paramétrique 41 nous savons seulement que leur temps de survie réel dépasse certains temps de censure. La censure est supposée indépendante en ce sens que la connaissance supplémentaire de la censure avant tout moment t ne modifie pas le risque d’échec en t. La logique de cet estimateur est simple. On pose qu’il y a r1 sujets dans le groupe témoin juste avant la durée y1 et que s1 décès surviennent à y1 , alors la probabilité (empirique) de survivre plus de y1 est : Nous pouvons ainsi déterminer la probabilité de survivre plus de y2 : Avec cette logique, nous pouvons même déterminer la probabilité de y3 , y4 ,...,yk . Maintenant, nous ajoutons dj , le point de troncature ou de censure du point (donnée) j, à la formule du groupe risque (voir le paragraphe précédent ) qui devienne : L’estimation de le fonction de survie selon Kaplan-Meier est définit comme suit : Exemple : (Pour calculer l’estimateur de Kaplan-Meier nous pouvons utiliser la fonction "survfit" du package "survival" sur R.) Posons les données de survie suivantes : 42 Chapitre 4. Les sinistres On souhaite calculer les groupes risques de ces données : j 1 2 3 4 5 6 7 8 9 10 11 12 yj 0.1 0.5 0,8 1,8 2,1 2,5 2,8 3,9 4,0 4,1 4,8 5,1 sj 1 1 1 2 1 1 1 2 1 1 3 17 rj 30 31-1=30 32-2=30 33-4= 29 34-6=28 35-7=28 35-8=27 39-12=27 40-14=26 40-17=23 40-19=21 40-23=17 Nous pouvons donc trouver l’estimateur de Kaplan-Meier : 4.4. Modélisation paramétrique 4.4 43 Modélisation paramétrique L’approche paramétrique consiste à choisir un modèle connu pour le phénomène sous étude. Ce modèle comportera habituellement des paramètres qu’il faudra déterminer d’une manière ou une autre. En général, on optera pour une technique ayant un certain degré d’objectivité et se basant sur des observations du phénomène. 4.4.1 Méthode des moments 4.4.2 Méthode des quantiles 4.4.3 Méthode du maximum de vraisemblance 4.4.4 Estimation par intervalle 4.5 4.5.1 Tests Tests graphiques 1. Le graphe quantile-quantile Le graphe Q − Q, ou graphe quantile-quantile, est un outil graphique destiné à nous aider à déterminer si un ensemble de données est plausiblement tiré d’une distribution théorique telle qu’une distribution normale ou exponentielle. Par exemple, si nous exécutons une analyse statistique supposant que notre variable dépendante est normalement distribuée, nous pouvons utiliser un graphe Q − Q normal pour vérifier cette hypothèse. C’est juste un contrôle visuel, pas une preuve hermétique, donc c’est quelque peu subjectif. Mais cela nous permet de voir d’un coup d’œil si notre hypothèse est plausible et, dans le cas contraire, de quelle manière cette hypothèse est violée et quels points de données contribuent à la violation. En effet, un graphe Q − Q est un nuage de points créé en traçant deux ensembles de quantiles l’un par rapport à l’autre. Si les deux ensembles de quantiles proviennent de la même distribution, vous devriez voir les points former une ligne approximativement droite. Voici un exemple de tracé Q − Q normal lorsque les deux ensembles de quantiles proviennent réellement de distributions Normal. Exemple : on pose l’échantillon suivant : [10, 12, 13, 15, 18, 20, 22, 23, 29], en utilisant la méthode du maximum de vraisemblance nous voulons ajuster des distributions exponentielle et log-normale à ces données : Application sur R : Cette application nous donne le graphique suivant : 44 Chapitre 4. Les sinistres 4.5. Tests 4.5.2 45 Test de Kolmogorov-Smirnov La statistique de Kolmogorov–Smirnov, Dn , est directement construite à partir de la notion de distance de Kolmogorov–Smirnov entre deux fonctions de répartition. Cette distance est définie comme la plus grande différence entre les deux fonctions. La statistique est donc Figure 4.2 – Statistique de Kolmogorov–Smirnov 4.5.3 Test du khi deux de Pearson Le test du khi carré est valide uniquement pour des données groupées ; on regroupera donc arbitrairement les données individuelles. Soit nj le nombre de données dans la classe (cj−1 , cj ), j = 1, ..., r et Pr j=1 nj 4.5.4 = n. La statistique est : Test du ratio des vraisemblances Le test du ratio des vraisemblances (likelihood ratio test ) est un test statistique basé sur la fonction de vraisemblance permettant de vérifier si un paramètre d’une distribution appartient ou non à un sous-espace θ0 de l’espace θ des valeurs possibles des paramètres. La forme générale du test est la suivante : ˆ λ = −2log( lθ0 ) lθ̂ 46 4.6 4.6.1 Chapitre 4. Les sinistres Critères de choix d’un modèle Critère d’information de Akaike Le critère d’information d’Akaike (AIC) compare la qualité d’un ensemble de modèles statistiques entre eux. Par exemple, vous pourriez être intéressé par les variables qui contribuent à un niveau bas de statut socio-économique et comment les variables contribuent à ce statut. Supposons que vous créez plusieurs modèles de régression pour divers facteurs tels que l’éducation, la taille de la famille ou l’emploi ; L’AIC prendra chaque modèle et les classera du meilleur au pire. Le critère d’information d’Akaike est généralement calculé avec un logiciel. La formule de base est définie comme suit : AIC = −2k − 2log(L) où k est le nombre de paramètres à estimer du modèle et L est le maximum de la fonction de vraisemblance du modèle. 4.6.2 Critère bayesien de Schwarz Le critère d’information bayésien (BIC) est un indice utilisé dans les statistiques bayésiennes pour choisir entre deux ou plusieurs modèles alternatifs. Le code BIC est également appelé critère d’information Schwarz (abrégé SIC) ou critère d’information Schwarz-Bayésien. Il a été publié dans un article de Schwarz et al. (1978) et est étroitement lié au critère d’information d’Akaike (AIC), officiellement publié en 1974. La comparaison de modèles avec le critère d’information bayésien consiste simplement à calculer le BIC pour chaque modèle. Le modèle avec le plus bas BIC est considéré comme le meilleur. Chapitre 5 Modélisation actuarielle des risques et assurances Ce chapitre vise à fournir une compréhension de base des risques et assurances. Il explique le concept d’assurance et son utilisation pour couvrir les risques. La manière dont l’assurance est traitée en tant qu’entreprise et le fonctionnement du marché de l’assurance sont également expliqués. La relation entre les assureurs et leurs clients et l’importance des contrats d’assurance sont discutées. Certains problèmes comme l’hétérogénéité des risques au sein d’un portefeuille sont également énumérés. 5.1 Aperçu sur la théorie de l’utilité et assurance L’assurance est essentiellement un contrat par lequel une partie donne une contrepartie, généralement payée en argent, en échange de la promesse d’une autre partie de rembourser le prix si une certaine perte s’est produite. Concrètement, le terme assurance signifie un contrat par lequel on s’engage à indemniser une autre personne, à payer ou à permettre un montant ou un bénéfice déterminé ou pouvant être déterminé sur des éventualités de risque déterminables. 5.1.1 Le modèle d’utilité espérée Le secteur des assurances existe parce que les gens sont prêts à payer un prix pour être assurés. Il existe une théorie économique qui explique pourquoi les assurés sont disposés à payer une prime supérieure à la prime nette, c’est-à-dire l’espérance mathématique du sinistre assuré. Cette théorie affirme qu’un décideur, généralement sans s’en rendre compte, attribue une valeur u(w) à sa richesse w au lieu de mettre simplement w, où u(.) s’appelle sa fonction d’utilité. Ainsi, pour décider entre les "sinistres" (perte) aléatoires X et Y , il compare E[u(w − x)] avec E[u(w − y)] et choisit la perte avec l’utilité attendue la plus élevée. Avec ce modèle, l’assuré avec la richesse w est en mesure de déterminer 47 48 Chapitre 5. Modélisation actuarielle des risques et assurances la prime maximale P qu’il est prêt à payer pour une perte aléatoireX. Ceci est effectué en résolvant l’équation d’équilibre suivante : E[u(w − x)] = u(w − p) (Kaas et al. (2008)). Averse au risque versus aime le risque : Supposons qu’une personne possède un capital w et qu’elle valorise sa richesse par la fonction d’utilité U (.). On lui donne le choix de perdre le montant b avec une probabilité de 1 2 ou de payer seulement un montant fixe équivaut à 12b. Il choisit le premier si b = 1, le dernier si b =4 et si b = 2 il n’a pas de choix. Apparemment, la personne aime jouer un petit risque, mais a peur d’un plus gros, comme une personne avec une police d’assurance incendie qui participe à une loterie. Que peut-on dire de la fonction d’utilité U (.) ? On choisit w = 0 et U (0) = 0, U (−1) = −1. Le décideur est indifférent entre une perte 2 avec une probabilité de 1 2 et une perte fixe 1(b = 2). Ceci implique que : U (−1) = U (0) + U (−2) 2 (5.1) La fonction d’utilité est alors ni concave ni convexe, puisque pour b = 1 et b = 4 nous avons : U( U (0) + U (−1) U (0) + U (−4) −1 ) =< et U (−2) > 2 2 2 (5.2) Nous supposons que les fonctions d’utilités ne sont pas décroissantes, bien que l’inverse soit concevable (cas de prélèvement sur le capital). Par conséquent, l’utilité marginale est non négatif : U (x) ≤ 0. Les décideurs peu enclins à prendre des risques constituent un groupe important. Ils ont une utilité marginale décroissante, donc U (x) > 0. 5.1.2 Les classes de la fonction d’utilité Outre les fonctions linéaires, il existe d’autre famille de fonctions liées aux fonctions d’utilités : • Utilité linéaire : U (W ) = W • Utilité quadratique : U (W ) = −(α − W )2 (W ≤ α) • Utilité logarithmique : U (W ) = log(α + W ) (W > −α) • Utilité exponentielle : U (W ) = −αe−αW 5.2 Le modèle de risque individuel Dans le modèle de risque individuel (ainsi que dans le modèle de risque collectif i.e section 2) le total des créances sur un portefeuille de contrats d’assurance est la variable aléatoire d’intérêt. Nous voulons calculer, par exemple, la probabilité qu’un certain capital suffise à payer ces créances, ou la valeur en risque au niveau 99,5% associé au portefeuille, soit le quantile à 99,5% de sa fonction de 5.2. Le modèle de risque individuel 49 distribution cumulative. Le total des sinistres est modélisé comme la somme de toutes les sinistres sur les polices, qui sont supposés indépendant. 5.2.1 Distribution mixtes et risques ans cette section, nous examinons quelques exemples de risques d’assurance, c’est-à-dire les créances sur une police d’assurance. Premièrement, nous devons légèrement élargir l’ensemble des fonctions de distribution que nous considérons, car les variables aléatoires purement discrètes et les variables aléatoires purement continues se révèlent toutes deux insuffisantes pour modéliser les risques. Nous savons que chaque fonction F (·) qui satisfait : F (−∞) = 0; F (+∞) = 1; F (.) n0 est pas décroissante et continue à droite. (5.3) F (.) est une fonction de distribution cumulative (fonction de répartition) de certaines variables aléatoires, par exemple de F −1 (U ) avec U ∼ unif orme(0.1) Si F (∆) est une fonction en escalier, c’est-à-dire une fonction constante en dehors d’un ensemble dénombrable de discontinuités (étapes), alors F (∆) et toute variable aléatoire X avec F (x) = P r[X ≤ x] sont appelées discrètes. Nous avons : f (x) = F (x) − F (x − 0) = P r[X = x], pour tout x ∈ (−∞, ∞) 5.2.2 (5.4) Convolution Dans le modèle de risque individuel, nous sommes intéressés par la distribution du S total des créances, avec : S = X1 + X2 + ... + Xn , (5.5) où Xi , i = 1, 2, ..., n, dénote le paiement sur la police i. Les risques Xi sont supposés être des variables aléatoires indépendantes. Si cette hypothèse est violée pour certains risques, par exemple dans le cas de polices d’assurance incendie sur différents étages du même bâtiment, ces risques pourraient alors être combinés en un seul terme. L’opération "convolution" calcule la fonction de distribution de X + Y à partir des fonctions de répartition de deux variables aléatoires indépendantes X et Y comme suit : La fonction de distribution cumulative FX ∗ FY (.) est appelé convolution des fonctions de répartition FX (.) et FY (.). Pour la fonction de densité, nous utilisons la même notation. Si X et Y sont des variables aléatoires discrètes, on trouve pour la fonction de distribution cumulative de X + Y et la densité correspondante. 50 5.2.3 Chapitre 5. Modélisation actuarielle des risques et assurances Transformations Déterminer la distribution de la somme des variables aléatoires indépendantes peut souvent être plus simple en utilisant les transformations de la fonction de distribution cumulative. La fonction génératrice des moments est l’outil le plus adéquat pour faire la transformation. Pour une variable aléatoire X non négative et pour quelconque h, elle est définie comme suit : Pour qu’elle soit efficace, la fonction génératrice des moments va être utilisé dans un intervalle très proche de 0, ce qui nécessite que h soit strictement positif. Notons que cela n’est le cas que pour les risques légers, pour lesquels il existe des moments exponentiels E[ex ] pour quelconque > 0. Si X et Y sont indépendants, alors : Ainsi, la convolution des fonctions de répartitions correspond à la simple multiplication des des moments généralisées de ces fonctions. Remarque : Pour les variables aléatoires avec une queue lourde, telles que les distributions de Pareto, la fonction des moments généralisées n’existe pas. La fonction caractéristique, existe toujours et elle est défini comme : => Cependant, le désavantage de la fonction caractéristique est la nécessité de travailler avec les nombres complexe. 5.2. Le modèle de risque individuel 5.2.4 51 Approximations La méthode la plus connue dans l’approximation de la fonction de répartition, est basée sur le théorème Central Limite. 1. L’approximation normale En plus de la loi des grands nombres, le théorème centrale limite est le plus important théorème de la statistique. Il indique qu’en additionnant un grand nombre de variables aléatoires indépendantes, nous obtenons une variable aléatoire normalement distribuée dans la limite. Dans sa forme la plus simple, le théorème centrale limite peut être présenté comme suit : Si X1 , X2 , ..., Xn sont des variables aléatoires iid ayant une moyenne µ et une variance σ 2 < ∞ alors : Exemple 1 : Supposons que n = 1000 jeunes hommes souscrivent une police d’assurance vie pour une période d’un an. La probabilité de mourir au cours de cette année est de 0, 001 pour tout le monde et le paiement pour chaque décès est de 1. Nous voulons calculer la probabilité que le paiement total soit au moins de 4. Ce paiement total est distribué selon la loi binomiale (1000, 001) et puisque n = 1000 est grand et p = 0.001 est petit, nous allons approximer cette probabilité par une distribution de Poisson (np). Calcul de la probabilité à 3+ 12 au lieu de 4, en appliquant une correction de continuité nécessaire ultérieurement, nous trouvons : Notons que la probabilité binomiale exacte est : 0.01893 Bien que n soit beaucoup plus grand que dans l’exemple précédent, le théorème centrale limite donne une mauvaise approximation : avec µ = E[S] = 1 et σ 2 = V[S] = 1, nous trouvons : L’approximation avec le théorème centrale limite n’est pas très bonne en raison des valeurs extrèmes du coefficient d’asymétrie (Skewness) des termes Xi ainsi que l’asymétrie résultante de S qui est γS = 1. 2. L’approximation Gamma La plupart des distributions de réclamations totales sont asymétriques à droite (skewness γ > 0), ont un support non négatif et sont unimodales. Elles ont donc à peu près la forme d’une distribution gamma. Pour gagner en souplesse, outre les paramètres habituels α et β, nous autorisons un décalage sur une distance x0 . 52 5.3 Chapitre 5. Modélisation actuarielle des risques et assurances Les modèles de risques collectifs Dans ce chapitre, nous introduisons les modèles de risque collectifs. Comme au chapitre 2, nous calculons la distribution du montant total de la demande, mais nous considérons maintenant le portefeuille comme un collectif qui produit un nombre aléatoire N de demandes au cours d’une certaine période. Nous avons alors : S = X1 + X2 + ... + Xn (5.6) où Xi est la ième revendication. Évidemment, le total des réclamations S = 0 si N = 0. Les termes de S correspondent aux réclamations effectives ; il y a beaucoup de termes égaux à zéro, correspondant aux polices qui ne produisent pas de réclamation. Nous supposons que les réclamations individuelles Xi sont indépendantes et distribuées de manière identique, et que N et tous les Xi sont indépendants. Dans le cas particulier où N est distribué selon Poisson, S a une distribution de Poisson composée. Si N a une distribution binomiale (négative), alors S a une distribution binomiale composée (négative). Dans les modèles collectifs, certaines informations de stratégie sont ignorées. Si un portefeuille ne contient qu’une seule police susceptible de générer un montant de réclamation élevé, ce montant apparaît au plus une fois dans le modèle individuel. Dans le modèle collectif, cependant, cela pourrait se produire plusieurs fois. De plus, dans les modèles collectifs, le numéro de réclamation N et les montants de réclamation Xi doivent être indépendants. Cela rend un peu moins approprié de modéliser un portefeuille d’assurances automobiles, étant donné que, par exemple, les mauvaises conditions météorologiques engendreront de nombreuses petites demandes de remboursement. En pratique, cependant, l’influence de ces phénomènes semble être faible. Un modèle de risque collectif s’avère à la fois efficace et relativement proche de la réalité. Une méthode évidente mais laborieuse est la convolution, le conditionnement sur N = n pour tout n. Nous pouvons exprimer les moments de S en termes de ceux de N et Xi . Avec cette information, nous pouvons encore approximer la distribution de S en utilisant le théorème centrale limite si E[N ] est grand, ainsi que par l’approximation gamma. 5.3.1 Distributions composées Supposons que S est une variable aléatoire composée, on suppose aussi que les termes Xi sont répartis en tant que X. A la suite de ce cours nous allons utilisé les notations suivantes : Nous pouvons ensuite calculer la valeur espérée de S en utilisant la distribution conditionnelle de S donnée N . Nous utilisons l’indépendance de Xi et N pour éliminer la condition N = n. Cela donne le calcul suivant : 5.3. Les modèles de risques collectifs 53 Notons que le total de réclamations espérées est égal au nombre de réclamations espérées multiplié par la taille des réclamations espérées. Nous pouvons calculer la variance en utilisant la règle de décomposition de la variance : Nous pouvons, ainsi, déterminer la fonction des moments généralisée : 5.3.2 Utiliser la formule de convolution pour déterminer la fonction de répartition composée La distribution conditionnelle de S, étant donné N = n, nous permet de calculer F : Donc, 54 Chapitre 5. Modélisation actuarielle des risques et assurances => Cette expression représente le formule de convolution pour une fonction de distribution cumulative composée. Application : On suppose que P r[N = j − i] = j 10 pour j =, 1, 2, 3, 4 et pose que p(1) = 0.4 et p(2) = 0.6. En utilisant la formle de convolution déterminer la fonction de répartition F (x) ? Les probabilités P r[N = n] de la ligne inférieure sont multipliées par les nombres d’une ligne supérieure. Ensuite, la somme de ces résultats est placée dans la ligne correspondante de la colonne f (x). Par exemple : 0, 2 ∗ 0, 6 + 0, 3 ∗ 0, 16 = 0, 168. Remarque : Notons que si nous essayons la convolution dans le cas de tailles de réclamations discrètes arbitraires plutôt que de valeurs entières, comme ici, le nombre de valeurs possibles et le nombre de calculs requis augmentent de manière exponentielle. 5.4 Hétérogénéité des risques au sein d’un portefeuille Généralement, dans son portefeuille, la compagnie d’assurance souhaite différencier les primes qu’il demande à ses assurés. En Réalité, certains assurés subissent moins de sinistres que les autres et donc il y’a un risque qu’ils décident de ne pas renouveler leurs contrats s’ils constatent qu’il payent une prime élevée par rapport à leur risque . L’assureur peut donc utiliser l’historique de chaque assuré pour calculer une prime qui correspond à sont risque. C’est l’objet de la théorie de la crédibilité. 5.4. Hétérogénéité des risques au sein d’un portefeuille 5.4.1 55 Modèle de crédibilité de Buhlmann Soit un portefeuille liée à une compagnie d’assurance, contenant J contrats et on considère Sj (s) le montant du sinistre pour le contrat j à la date s. Hypothèses du modèles : 1. Chaque contrat j est est caractérisé par un un paramètre de risque inconnu représenté par une variable aléatoire γj à valeur dans R+ , et on note que les J vecteurs (γj , (Sj (n))n≥1 ), j ∈ {1, ..., J} sont indépendants et identiquement distribués. 2. Conditionnellement à γj = λ, les v.a. Sj (n)n≥1 sont indépendantes et identiquement distribuées de fonction de répartition Gλ . 3. Les deux premiers moments existent pour tout λ ∈ R+ tels que : Le modèle de Buhlmann propose de se limiter aux primes dépendant linéairement des sinistralités passée. Plus précisément l’assureur exigera pour le contrat j une prime à la date t + 1 donnée par : c0 + c1 Sj (1) + ... + ct Sj (t) (5.7) avec les coefficients ci sont choisis de manière à minimiser l’écart quadratique moyen : E[(µ(γj ) − c0 − c1 Sj (1) − ... − ct Sj (t))2 ] Afin de pouvoir déterminer la valeur de la prime, il faut introduire les paramètres de structure (5.8) P2 et M2 , définis comme suit : P2 = E[σ 2 (γi )] et M2 = sigma2 (µ(γi )) Le modèle de Buhlmann défini la prime pj pour le contrat j comme suit : pj = αE[Sj (1)] + (1 − α)( avec α = PtM 2 t 1X Sj (s)) t s=1 2 +M2 (5.9) 56 5.4.2 Chapitre 5. Modélisation actuarielle des risques et assurances Estimation des paramètres de structure L’objectif de cette section est l’estimation des paramètres de structure du modèle de crédibilité de Buhlmann, déjà introduit dans la section précédente, 1. Estimation de la moyenne : P2 et M2 . Pour le contrat j on définit l’estimateur de la moyenne µ de E[Sj (1)] comme suit : µˆj = 2. Estimation de P2 : t 1 X (Sj (s) − µˆj )2 t − 1 s=1 Nous pouvons alors déduire l’estimateur de P2 P ˆ = (5.11) : 1 J ˆ2 j=1 σ j PJ Pour l’estimation de M2 , nous définissons l’estimateur suivant : P J ˆ2 1 1 X 2 (µˆj − µˆe ) − M = J − 1 j=1 J t 2 5.5 (5.10) Pour la police (contrat) j, on définit l’estimateur de la variance par : σˆ2 = 3. Estimation de M2 : t 1X Sj (s) t s=1 (5.12) Introduction à la théorie de la ruine La théorie de la ruine appartient aux sciences de la gestion des risques et aux mathématiques appliquées à l’assurance. Il s’agit de l’étude mathématique de modèles stochastiques et dynamiques adaptés aux réserves financières allouées à un portefeuille de contrats d’assurance de type non-vie d’une compagnie d’assurance. Assurance de type IARD (Incendie, Accidents et Risques Divers). 5.5.1 Définitions • Ruine :survenance d’un scénario défavorable, insolvabilité, impossibilité de faire face à ces engagements. • Modèle de ruine :modélisation l’évolution de la richesse de la compagnie par un processus stochastique. • Probabilité de ruine :probabilité de survenance de la ruine soit en horizon fini ou sur un horizon infini. • Provisionnement : constitution de réserves initiales suffisantes pour éviter la ruine. 5.5. Introduction à la théorie de la ruine 5.5.2 57 Modèle classique de la théorie de la ruine : le modèle de Cramer-Lundberg Figure 5.1 – Une réalisation du processus de risque U (t) Un processus stochastique est constitué de variables aléatoires associées, indexées par le temps t. En se basant sur les travaux de Cramér (1930), nous définissons le processus de surplus (i.e le processus de risque) comme suit : U (t) = u + ct − S(t), t ≥ 0, (5.13) avec : U (t) : le capital de l’assureur en t ; u = U (0) : le capital initial, c : le revenu de primes (constant) par unité de temps S(t) = X1 + X2 + ... + XN (t) , N (t) : le nombre de réclamations (claim) jusqu’au temps t Xi : la taille de le ième réclamation, supposée non négative. 1. Probabilité de ruine Une réalisation typique du processus de risque est illustrée dans la figure 5.1. Les variables aléatoires T1 , T2 , ... indiquent les moments auxquels une réclamation a eu lieu. La pente du processus est c s’il n’y a pas de réclamations ; parfois t = Tj pour certains j, le capital baisse de Xj , ce qui correspond à la taille de la j ième créance. Comme le montre la figure 5.1, à l’heure T4 , le total des sinistres survenus X1 + X2 + X3 + X4 est supérieur au capital initial u plus la prime gagnée cT4 , le surplus restant U (T4 ) est inférieur à 0. Cet état du processus est appelé ruine, et le moment où cela se produit pour la première fois est désigné par T . Nous avons alors : min {t\t ≥ 0 et U (t) < 0}; T= ∞ si U (t) ≥ ∀t. 58 Chapitre 5. Modélisation actuarielle des risques et assurances Si la probabilité que T = ∞ soit positive, la variable aléatoire T est dite défectueuse. La probabilité que la ruine se produise, c’est-à-dire la probabilité que T soit fini, s’appelle la probabilité de ruine. Elle est écrit comme suit : Φ(u) = P r[T < ∞] (5.14) Avant de passer au processus de revendication S(t), représentant le nombre total de réclamations jusqu’à un instant t, nous examinons d’abord le processus N (t) du nombre de réclamations jusqu’à t. Nous supposerons que N (t) est un processus de Poisson : Def 1 : Le processus N (t) est un processus de Poisson si pour un λ > 0 appelée l’intensité du processus, les incréments du processus ont la propriété suivante : N (t + h) − N (t) ∼ P oisson(λ h) (5.15) ∀ t > 0, h > 0 et pour chaque N (s) ; s ≤ t, En conséquence, les incréments d’un processus de Poisson ont les propriétés suivantes : Indépendance : les incréments N (ti + hi ) − N (ti ) sont indépendants pour les intervalles disjoints (ti , ti + hi ), i = 1, 2, ... Stationnarité :N (t + h) − N (t) est poisson (λ h) distribué pour chaque valeur de t. Outre cette définition globale du processus du nombre de réclamations, nous pouvons également considéré des incréments N (t + dt) − N (t) dans des intervalles infiniment petits (t, t + dt). En suivant le processus du poisson, nous obtenons : la distribution cumulative et les moments des réclamations individuelles Xi sont notés par : 2. Le chargement de sécurité : Dans un échange de risque mutuel,la compagnie d’assurance ne sait pas exactement combien de demandes d’indemnisation se produiront. En imposant des contrats au niveau des primes pures (en supposant une répartition symétrique des pertes), l’assureur peut perdre de l’argent une année sur deux. En l’absence des fonds nécessaires, cette situation peut conduire à la faillite. Pour se protéger, la compagnie d’assurance ajoute donc à sa prime un chargement de sécurité. Le chargement de sécurité (safety loading) ou encore le facteur de chargement θ est défini par 5.6. Conclusion 59 c = (1 + θ)λµ1 , donc : θ= c −1 λµ1 (5.16) 3. Vers une généralisation du modèle de Cramer-Lundberg : Le Modèle de SparreAndersen Dans un article présenté lors du congrès international des actuaires en 1957 à New York, E. Sparre Andersen (Andersen (1957)) a proposé une généralisation de la théorie classique du risque (celle de Poisson). Plutôt que de supposer des temps distribués de manière indépendante selon le processus de poisson, il a introduit une fonction de distribution plus générale, tout en conservant l’hypothèse de l’indépendance. Donc lorsque N (t) est considéré comme un processus de renouvellement plutôt qu’un processus de Poisson, le modèle est alors une généralisation du modèle de poisson et il est dit de Sparre-Andersen. Selon ce modèle le processus du montant des sinistres agrégées est un processus de renouvellement composé. N (t) U (t) = u + ct − S(t) = u − X Zi (5.17) i=1 avec Zi = (Wi − c∆Ti ), i = 1, ..., n et φ(u) = p(Supn≤1 ( 5.6 Pn k=1 (Xk − cYk )) ≥ u) Conclusion La théorie du risque (ou de la ruine) est importante dans le monde de l’assurance et de la gestion du risque. C’est vrai qu’elle nous permet de calculer la probabilité de ruine et de prévoir le risque. Cependant, elle présente des calculs parfois trop compliqués à maitriser et présente trop peu de formules explicites. Bibliographie Andersen, E. S. (1957). On the collective theory of risk in case of contagion between claims. Bulletin of the Institute of Mathematics and its Applications 12 (2), 275–279. Chakroun, F. and F. Abid (2013). A methodology to estimate the interest rates yield curve in illiquid market : the tunisian case. Available at SSRN 2264913 . Cox, J. C., J. E. Ingersoll Jr, and S. A. Ross (2005). A theory of the term structure of interest rates. In Theory of Valuation, pp. 129–164. World Scientific. Cramér, H. (1930). On the mathematical theory of risk. Centraltryckeriet. Hou, H. and H. Andrews (1978). Cubic splines for image interpolation and digital filtering. IEEE Transactions on acoustics, speech, and signal processing 26 (6), 508–517. Kaas, R., M. Goovaerts, J. Dhaene, and M. Denuit (2008). Modern actuarial risk theory : using R, Volume 128. Springer Science & Business Media. Macaulay, F. R. (1938). The movements of interest rates. Bond Yields. Mishkin, F. S. (2005). The risk and term structure of interest rates. Paradis, E. (2005). R for beginners. institut des sciences de l’evolution, univerisite montpellier ii. france. Pluyaud, B. (2006). Faut-il avoir peur de la faiblesse des taux longs obligataires ? Note de conjoncture, 31–45. Poulon, F. (1980). Graphe, crise et circuit keynésien. Revue d’économie politique, 371–409. Racine, J. and R. Hyndman (2002). Using r to teach econometrics. Journal of Applied Econometrics 17 (2), 175–189. Schwarz, G. et al. (1978). Estimating the dimension of a model. The annals of statistics 6 (2), 461–464. 61 62 Bibliographie Therneau, T. M. and T. Lumley (2014). Package ‘survival’. Survival analysis Published on CRAN . Vasicek, O. (1977). An equilibrium characterization of the term structure. Journal of financial economics 5 (2), 177–188. Annexes Annexe A : Tableau récapitulatif des principales lois de probabilité 63 64 Annexe B : Introduction au langage R Cette annexe fournit une introduction informelle aux concepts du logiciel R et du langage de programmation S qu’il implémente. L’objectif est d’avoir une idée du fonctionnement de R et de la manière dont il faut interpréter ses résultats s’appliquant aux problèmes de la théorie du risque actuariel. De nombreux textes sur l’utilisation de R sont disponibles (Racine and Hyndman (2002), Paradis (2005)). R est un environnement de programmation bien adapté à la résolution de problèmes statistiques et économétriques. En ce qui concerne la théorie du risque, il est important car il offre de nombreuses fonctions mathématiques utiles pour la modélisation actuarielle. R et S-Plus utilisent tous les deux le langage S pour adapter et analyser les modèles statistiques et ne diffèrent actuellement que par des détails mineurs. En plus d’être stable, rapide, toujours à jour et très polyvalent, le principal avantage de R est qu’il est disponible pour tout le monde gratuitement. Et comme il s’agit d’un logiciel à code source ouvert, ses sources d’expédition sont disponibles. Ce n’est donc pas un système de boîte noire où il faut deviner comment les programmeurs ont interprété et mis en oeuvre la théorie. Il possède des capacités graphiques étendues et puissantes et se développe rapidement. Il est l’outil statistique de choix dans de nombreux environnements universitaires. Le programme R invite l’utilisateur à entrer, en affichant son invite>. Après avoir entré une commande, R répond. Il suffit de taper le nom d’un objet pour que R l’imprime. Un programme «Bonjour Amal !» consiste donc simplement à taper la chaîne. Annexe C : Installation du langage R Les étudiants sont appelées à télécharger et installer R (la dernière version R-3.6.0) en suivant les étapes suivantes : 1. Taper sur google R CRAN puis choisir "The Comprehensive R Archive Network" 2. Cliquer sur télécharger R (Download R) pour Windows (ou Linux, (Mac) OS X, selon le type de vos ordinateurs) . Annexe C : Installation du langage R 65 3. Cliquer sur installer R pour la première fois (s’il n’est pas déjà installé) 4. Cliquer sur Download R 3.6.0 for Windows 5. Une fois l’étape précédente est terminée, cliquer sur le lien : 6. Choisir exécuter 7. Choisir la langue 8. Choisir l’emplacement dans vos ordinateurs 9. Terminer les étapes suivantes en cliquant sur suivant. Une fois installé cliquer 2 fois pour ouvrir l’interface R et commencer le travail ! 66 Annexe D : Estimation non paramétrique de "Kaplan-Meier" sous R .1 Avant de commencer : Commencer par lire les données : donnee<-read.csv("donnee.csv") . Annexe D : Estimation non paramétrique de "Kaplan-Meier" sous R 67 La commande attach() nous permet d’analyser les variables séparément. Afin d’analyse les données de survie sous R, il est indispensable de charger les packages suivants : library(splines) library(survival) La fonction Library nous permet d’ouvrir un package déjà installer dans notre machine. S’il n’existe pas dans notre bibliothèque il faut l’installer en cliquant sur installer package et choisir ensuite la miroire CRAN . .2 L’estimateur de "Kaplan-Meier" Les objets de survie sont créés en utilisant la fonction Surv(duree, evt). La commande de base pour créer un objet de survie en utilisant les colonnes duree et evt de la base de données est : donnee.surv = Surv(duree, evt, data = donnee) L’estimation d’une fonction de survie en utilisant un objet de survie se fait à partir de la fonction survf it. La commande de base est : survf it(donnee.surv) La commande pour avoir les estimations de la fonction de survie en fonction du temps est : summary(survf it(donnee.surv)) Et pour tracer la courbe de survie avec les intervalles de confiance de niveau 95%, nous utilisons : plot(survf it(donnee.surv), xlab = ”Durée de suivi”, ylab = ”T auxdesurvie”) et sans intervalle de confiance : plot(survf it(donnee.surv), conf.type = ”none”, xlab = ”Durée de suivi”, ylab = ”T auxdesurvie”) View publication stats