tag:blogger.com,1999:blog-4313472142599177823.post4253727208121146025..comments2024-03-21T19:16:17.213+01:00Comments on DE LA MEDECINE GENERALE, seulement de la médecine générale: Cancer de la prostate : If you don’t mind what goes on your death certificate, prostate screening is a waste of time. Richard Lehman.JC GRANGEhttp://www.blogger.com/profile/02625782569551294943noreply@blogger.comBlogger31125tag:blogger.com,1999:blog-4313472142599177823.post-31646909760165952952012-04-05T22:47:54.552+02:002012-04-05T22:47:54.552+02:00@ BG. Je vous l'ai déjà dit une fois mais vous...@ BG. Je vous l'ai déjà dit une fois mais vous êtes un casse-pied de première et un enfumeur dans le même métal. Grâce à Vincent Terrisse, fidèle lecteur et... critique de ce blog et d'autres écrits que je laisse ici et là sur les forums, il m' a communiqué deux cours de Stanislas Dehaenne qu'il a faits récemment au Collège de France. Dans le premier que vous trouverez ici http://www.college-de-france.fr/site/stanislas-dehaene/cours-du-24-janvier-2012-.htm il répond à vos questions sur le calcul bayésien et sur bien d'autres choses (vers la quinzième minute il donne un problème identique à celui que j'avais proposé). Le second cours rend compte de ce qu'est le calcul bayésien. Je conçois que vous connaissez tout cela par coeur mais une relecture vous ferait du bien. http://www.college-de-france.fr/site/stanislas-dehaene/Cours_du_10_janvier_2012_Intro.htm<br />Bonnes séances.JC GRANGEhttps://www.blogger.com/profile/02625782569551294943noreply@blogger.comtag:blogger.com,1999:blog-4313472142599177823.post-85920850358554426362012-04-04T10:32:31.670+02:002012-04-04T10:32:31.670+02:00Je voudrais apporter des précisions sur ce comment...Je voudrais apporter des précisions sur ce commentaire de CMT sur le risque de tomber malade si positif à un test :<br />« Les risques (de tomber malade si positif) sont proportionnels à la prévalence de la maladie dans la population. C'est à dire, que même avec un test très performant, plus la maladie est rare, plus la probabilité d'être réellement malade en cas de test positif diminue. » <br /><br />Prenons une susceptibilité de 0,99 et une sensibilité de 0,95. Si la prévalence est 10% le risque de tomber malade si positif est 91,3%. Si la prévalence est 5% donc divisée par 2 il devient 83,3% qui est plus faible mais pas du tout divisé par 2. Avec une prévalence de 1% (divisée par 10) on a 49% ; avec 0,1% (divisée par 100) c'est 8,7% et avec 0,01% ( divisée par 1000) c'est 0,94% soit à peu près le centième de 91,3%. On est donc très loin d'une évolution à la proportionnelle. <br /><br />On voit que la valeur prédictive positive n'est pas du tout proportionnelle à la prévalence. On peut seulement dire qu'elle est une fonction croissante de la prévalence.<br /><br />Il y a cependant 2 cas particuliers : si la somme de la sensibilité et de la susceptibilité vaut 1 alors la valeur prédictive positive est égale à la prévalence. <br />Si la susceptibilité vaut 1 cette valeur prédictive est alors indépendante de la prévalence et vaut 1. Ce n'est sans doute pas fréquent mais suggère quand même que si la susceptibilité est très élevée (donc très peu de non malades positifs) le risque de tomber malade si positif sera malgré tout non négligeable : si la susceptibilité vaut 99,9%, la sensibilité 0,95 et la prévalence 1/1000 c'est quand même près de 49%.BGnoreply@blogger.comtag:blogger.com,1999:blog-4313472142599177823.post-56764344553385457732012-04-02T09:05:05.463+02:002012-04-02T09:05:05.463+02:00@ docpp
Quand vous me dites « vous n'allez qu...@ docpp <br />Quand vous me dites « vous n'allez quand même pas prétendre réinventer le calculs des probabilités » je pourrais vous répondre que c'est la médecine qui réinvente le calcul des probabilités, au moins pour une part sous la contrainte de l'impossibilité matérielle d'avoir des échantillons suffisants et aussi du désir d'avoir malgré cela des résultats à annoncer.<br /><br />Ce que dit le calcul des probabilités (j'ai quand même enseigné cette spécialité) c'est que toutes les probabilités doivent être prises sur le même espace de probabilités. Ce qui signifie, pour notre problème, qu'il faudrait un échantillon suffisamment représentatif et assez grand de personnes testées pour pouvoir y estimer TOUTES les probabilités nécessaires.<br /><br />Le procédé qui consiste à aller chercher 3 probabilités dans 3 échantillons de nature différente et indépendants pour ensuite les combiner entre-elles n'est pas normalement autorisé et j'ai donné une raison pour cela (une variation sur un échantillon ne peut se répercuter sur les autres). Ayant été formé par la rigueur des maths je n'aurais jamais pensé faire une opération aussi douteuse. C'est pourquoi je n'avais pu imaginer que c'était cela qui se faisait en médecine, d'autant que l'exemple de docteurdu16 portait sur un seul échantillon, jusqu'à ce que j'aille regarder l'exemple de votre lien. Je comprends qu'il ne soit pas toujours possible de disposer de l'échantillon qui éviterait cette opération peu licite et je ne porte aucun jugement moral mais il faudrait que vous sachiez que ce n''est pas satisfaisant et qu'il n'est pas possible d'invoquer le calcul des probabilités pour le justifier. C'est seulement un calcul par défaut, c'est tout.<br /><br />Cela me rappelle quand je lisais ''on résoud'' avec un d dans les copies des étudiants et que je m'empressais d'expliquer, avant que les étudiants rigolent, que je ne faisais pas une faute d'orthographe en écrivant ''on résout'' avec un t au tableau. Je dois expliquer ici que ce n'est pas moi qui faisait une faute technique en supposant que tout ce passait sur le même échantillon, auquel cas le détour par Bayes est inutile. Il faudrait que ça puisse être la norme. Peut-être qu'avec l'informatisation des données il deviendra possible un jour d'avoir de grands échantillons, il faut le souhaiter.BGnoreply@blogger.comtag:blogger.com,1999:blog-4313472142599177823.post-45601145458926800092012-04-01T10:32:56.064+02:002012-04-01T10:32:56.064+02:00Je prolonge la réflexion précédente.
Quand il fau...Je prolonge la réflexion précédente.<br /><br />Quand il faut utiliser Bayes on va le faire en estimant 3 probabilités sur 3 échantillons différents et indépendants : un échantillon de malades pour estimer P(T si M), un échantillon de non malades pour P(T si nM) et un échantillon de la population concernée pour estimer P(M). C'est ce qu'illustre l'exemple d'école du lien de docpp. Ces 3 échantillons devant être suffisamment représentatifs ce qui ne doit pas être si facile à réaliser. On mixe ensuite ces 3 estimations dans Bayes qui n'est plus un Bayes ''probabilité'' mais un Bayes ''statistique''.<br /><br />Je voudrais souligner ici une conséquence importante de cela : une variation sur le choix d'un SEUL de ces 3 échantillons affectera un SEUL de ces 3 nombres alors que s'il était possible de disposer d'un échantillon globalement représentatif, une variation de cet échantillon pourra affecter simultanément TOUS les nombres en permettant ainsi des compensations qui limiteront les variations du résultat recherché.<br /><br />C'est pourquoi il serait bien préférable de pouvoir disposer d'un échantillon globalement représentatif. Je rappelle qu'alors il permet l'estimation directe de P(M si T) et que le recours à Bayes est inutile et donnera le même résultat, ce n'est pas un poisson d'avril ! (démonstration générale facile : dans mon exemple avec 5 malades dont 3 positifs etc il suffit de remplacer les valeurs numériques par des valeurs littérales. ). De plus, comme le calcul est alors beaucoup plus simple il devrait être plus facile de gérer les effets des variations aléatoires sur le résultat, ce qui n'est pas négligeable non plus.<br /><br />Ceci dit, il faut reconnaître que pour une maladie rare un tel échantillon peut être matériellement difficile à obtenir. Il ne faut pas non plus se dissimuler que des échantillons représentatifs de malades, de non malades et de la population visée ne sont sans doute pas non plus aisés à obtenir. Les comités d'experts ont toujours avancé les biais de sélection pour critiquer les études significatives sur la SEP et la vaccination hépatite B. Ils existent d'ailleurs tout autant dans celles qui ne sont pas significatives mais ils n'en parlent pas.BGnoreply@blogger.comtag:blogger.com,1999:blog-4313472142599177823.post-75933328022536317932012-04-01T00:04:51.046+02:002012-04-01T00:04:51.046+02:00SUITE
Par contre ce n'est plus valable si l...SUITE<br /><br /><br />Par contre ce n'est plus valable si la probabilité de tomber malade en population générale n'est plus celle de l'échantillon. Dans l'exemple du lien de docpp il y a 1000 malades et 1000 non malades soit 50% de malades mais la prévalence générale est prise à 1/10000. En pareil cas il faut effectivement recourir à Bayes mais à condition quand même que les échantillons de malades et de non malades soient chacune représentatifs séparément ce qui mériterait d'être plus souvent rappelé.<br /><br />Je précise aussi que dans Bayes, si P(T si M) apparaît et est la sensibilité, la spécificité n'apparait pas directement et n'est pas indispensable car P(T si nM) s'obtient directement sur les données de l'échantillon des non malades (10/1000 pour l'exemple du lien). Il est donc inutile de passer par la spécificité 990/1000 pour ensuite faire 1- cette spécificité alors qu'on a le résultat sous les yeux mais c'est un détail. P(T si nM) est d'ailleurs le taux de faux positifs au sens utilisé en médecine, donc parmi les non malades. C'est un très mauvais indicateur des caractéristiques du test, comme la spécificité, ce qui est logique car ce n'est parce que les non malades ne réagiraient pas au test que les malades vont y réagir. Aussi, si on présentait au public un taux de faux positifs de 5% en pouvant laisser croire que le test dépisterait 95% des cas ce ne serait pas très honnête (cela se fait-il ?)<br /><br /><br />Cette discussion a plutôt été vive et il est sans doute dommage de monter un peu vite en décibels plutôt que d'essayer de comprendre ce que l'autre veut dire mais en définitive on voit bien qu'il y avait quand même des problèmes dans cette affaire et cela aura au moins permis de les faire apparaître comme l'importance de la représentativité pas si facile à réaliser en pratique. Sur un plan théorique il reste quand même comme étant un peu gênant que dans la formule de Bayes utilisée, P(T si M) soit une probabilité SUR l'échantillon et que P(M) soit une probabilité SUR la population générale et qu'on se permette de les multiplier alors qu'elles sont sur des espaces de probabilités différents. Kolmogorof, le mathématicien russe fondateur des espaces de probabilités, était très opposé à cela. Pour lui les probabilités devaient toujours être prises sur le même espace.<br /><br />C'est pourquoi il serait préférable que l'échantillon soit globalement représentatif, ce qui rendrait Bayes inutile, mais c'est beaucoup demander en médecine avec des événements rares et même impossible souvent à réaliser. Alors on passe outre...ce qui se comprend aussi.BGnoreply@blogger.comtag:blogger.com,1999:blog-4313472142599177823.post-18787104853760632662012-03-31T23:34:54.580+02:002012-03-31T23:34:54.580+02:00La valeur prédictive positive, c'est à dire l...La valeur prédictive positive, c'est à dire la probabilité d'être malade si positif P(M si T) est sans doute l'indicateur le plus intéressant pour caractériser un test selon ce qui a été dit ici et j'y souscris volontiers. L'indicateur P(nM si T) c'est à dire le taux de faux positifs parmi les positifs aura la même qualité d'indicateur puisque leur somme fait 1. Le problème que je soulève ici est la représentativité de l'échantillon dont on dispose.<br /><br />Pour que P(M si T) SUR l'échantillon corresponde au P(M si T) SUR la population générale il faut que l'échantillon de malades dont on dispose se comporte vis à vis du test de la même façon que l'ensemble des malades. De même, pour que P(nM si T) sur l'échantillon des non malades corresponde au résultat général il faut que les non malades dont on dispose soient un échantillon représentatif des non malades en population générale. Ces 2 conditions sont évidemment indispensables et n'ont pas été rappelées dans le liens donné par docpp, ce qu'on peut regretter car c'est important et pas forcément toujours réalisé.<br /><br />Si de plus la probabilité P(M) observée sur cette échantillon est égale à la prévalence générale (aux variations aléatoires près) alors on peut obtenir P(M si T) très simplement sans passer par Bayes car la sensibilité et le pourcentage de faux positifs ne tombent pas comme ça du ciel et que pour les calculer il faut disposer des nombres qui peuvent donner immédiatement le résultat cherché SANS forcément passer par tous ces intermédiaires.<br /><br />A priori il suffit de 2 nombres pour calculer P(M si T). Par exemple 60 positifs dont 3 malades donne aussitôt 3/60=0,05.<br /><br />Calculons maintenant avec Bayes et un échantillon représentatif de 1000 personnes où on a eu 2 malades négatifs. On va alors calculer P(T si M)=3/5 puisqu'il y a 3 malades positifs parmi les 5 ce qui donnera le numérateur de Bayes : 3/5x5/1000=3/1000, la prévalence étant 5/1000 l'échantillon étant représentatif.<br /><br />Puis on va calculer P(T si nM)=57/995 car il y a 995 non malades (nM) dont 60-3 positifs. Le dénominateur de Bayes sera : 3/1000+57/995x995/1000=60/1000.<br />En divisant le numérateur par le dénominateur de Bayes on va alors avoir le plaisir d'obtenir 3/60 ! <br /><br />Le calcul direct rapide fait au début est donc valable lorsque la prévalence théorique admise est égale au P(M) observé sur l'échantillon. Le recours à Bayes est donc inutile dans ces conditions. J'avais supposé implicitement que l'échantillon était représentatif comme dans l'exemple donné par docteurdu16 où il y avait 1 malade pour 1000 testés avec une prévalence générale de 1/1000. Dans ces conditions et même avec des faux négatifs le calcul que j'avais proposé est parfaitement valable.BGnoreply@blogger.comtag:blogger.com,1999:blog-4313472142599177823.post-78495222723987116272012-03-31T09:06:55.399+02:002012-03-31T09:06:55.399+02:00Si malgré les critiques , le dépistage continue à ...Si malgré les critiques , le dépistage continue à être promu par les différentes autorités , n'est-ce pas aussi parce que des labos ont déjà d'éventuelles nouvelles solutions - discutables sans doute - à proposer ?<br /><br />Dans une dépêche Reuters , faisant écho aux critiques formulées à l'encontre de la procédure d'homologation du "Provenge" - un vaccin autogène - il est mentionné : "Promising new agents for advanced prostate cancer include an oral drug from Medivation Inc called enzalutamide, in the final phase of clinical trials, and Zytiga from Johnson & Johnson, which won FDA approval in 2011. A vaccine that targets PSA, from Bavarian Nordic Immunotherapy, is in late-stage trials." cf http://www.reuters.com/article/2012/03/30/us-provenge-idUSBRE82T07420120330Anonymousnoreply@blogger.comtag:blogger.com,1999:blog-4313472142599177823.post-6919506615026126802012-03-30T23:34:22.274+02:002012-03-30T23:34:22.274+02:00Un exemple pour illustrer avec une définition com...Un exemple pour illustrer avec une définition complètement inadaptée pour classer le risque d'événements secondaires après vaccination par exemple.<br /><br />L'OMS a défini une classification avec un risque qualifié de très fréquent si supérieur à 1/10, fréquent si entre 1/10 et 1/100 … jusqu'à rare entre 1/1000 et 1/10000 puis très rare si inférieur à 1/10000. On trouve cela partout et c'est accepté par notre santé publique nationale. Cette classification du risque avait d'ailleurs été largement présentée dans le cadre de la vaccination dite pandémique. Personne n'a bronché sur cette définition.<br /><br />Un labo va présenter un vaccin au ministre qui demande quel est le risque de décès avec ce vaccin. C'est très rare répond le labo, une chance sur 20000. Bien dit le ministre, allons-y, je lance une grande campagne (toute ressemblance … serait fortuite ….). On va vacciner 20 millions de personnes en peu de temps ce qui va faire 1000 décès. Avec ce risque qualifié de très rare on va avoir la certitude d'une très grave crise sanitaire avec possible mise en examen du ministre.<br /><br />Où est l'erreur ? <br />On ne peut mesurer un risque sur sa SEULE probabilité mais au minimum sur cette probabilité multipliée par le nombre de vaccinations qui seront effectuées, ce qui s'appelle espérance mathématique en probabilités et cas attendus en épidémiologie. Les compagnies d'assurance ne se contentent pas d'évaluer la probabilité d'un événement grave mais essaient aussi d'évaluer le nombre de sinistrés qu'il faudra alors indemniser pour prévoir les provisions nécessaires. Sinon elles iraient toutes à la faillite. Sur invitation du président de ma mutuelle, un ancien prof de maths, j'avais pu assister à des exposés de ses spécialistes sur les méthodes mathématiques utilisées pour gérer le risque dans l'assurance. C'est déjà plus sérieux qu'en épidémiologie. Dans un cas le risque est financier pour l'assureur et dans l'autre il est seulement pour la santé des populations...<br /><br />Cette classification du risque en matière de vaccinations est une aberration totale. On a peine à croire que des experts de classe internationale aient pu la proposer (l'imposer) sans avoir conscience du problème que je soulève ici, surtout avec l'affaire de la vaccination hépatite B en France. On pourrait s'interroger. Oui mais seulement en silence ...BGnoreply@blogger.comtag:blogger.com,1999:blog-4313472142599177823.post-70832246049740964662012-03-30T23:19:34.002+02:002012-03-30T23:19:34.002+02:00On n'y arrivera pas …
Ce que vous indiquez ce ...On n'y arrivera pas …<br />Ce que vous indiquez ce fait ainsi QUAND le taux de faux positifs est 50/999 pour rester sur l'exemple ou plus généralement P(T si nM) (positif si non malade).<br /><br />Par contre, avec l'autre définition donnée d'ailleurs page 8 du lien de docpp [1] <br />« Attention: pour certains auteurs: taux de faux positifs = P(nM si T),<br /><br />Vérifiez donc toujours la définition utilisée ! »<br /><br />Ce taux donne sur l'exemple : 50/51=98%. Aussi, la probabilité P(M si T)=1-P(nM si T)=2% s'obtient directement à partir du taux de faux positifs. Je n'y peux rien c'est ainsi et facile à vérifier il me semble, non ? Faites-le !!!<br /><br />[1] http://www.iumsp.ch/Enseignement/pregradue/s_nspec.pdf <br /><br />Aussi, avec cette définition du taux de faux positifs on a un indicateur qui est très signifiant de la valeur réel du test : 98% des positifs ne seront pas malades que chacun traduira aussitôt pas ''la probabilité d'être malade si positif est 2%'' sans avoir besoin d'aller chercher une formule de calcul à appliquer.<br /><br />C'est d'ailleurs pourquoi, quand on pense que c'est cette définition qui est en vigueur, on traduit 5% de faux positifs par 95% de risque de tomber malade si positif, raisonnement qui n'est pas fondamentalement une erreur puisqu'il s'applique quand c'est cette définition qui est en vigueur mais pas si c'est l'autre.<br /><br />Les deux définitions existent et cela est parfaitement reconnu. Allez donc le vérifier dans le cours de probas du lien de docpp ou encore sur Wikipédia. La médecine a choisi l'une d'elles mais ce n'est pas universel, c'est ainsi, d'où les confusions possibles.<br /><br /> Une des définitions est-elle préférable à l'autre ? C'est une autre question. Le premier avantage de la seconde est que le taux de faux positif est directement signifiant ce qui n'est pas le cas avec les 5% qui n'expriment rien de vraiment intéressant. Il faut tout un mixage de valeurs à travers Bayes pour trouver une valeur signifiante. Cela fait donc un avantage non négligeable qui évite en plus certaines erreurs.<br /><br />En voici un autre : si au groupe servant pour l'étude du test et formé d'hommes de 60 ans (taux PSA) on ajoute des jeunes de 20 ans, ils seront tous négatifs et non malades. Leur présence va donc contribuer à abaisser la valeur P(T si nM) sans changer P(nM si T). On répondra alors qu'il faut les exclure de l'étude. OK ! Oui mais on peut très bien avoir des hommes de 60 ans qui, pour des raisons génétiques ou autres, vont être un peu comme des jeunes vis-à-vis du taux de PSA, c'est à dire négatifs et non concernés par la maladie. On ne peut a priori l'exclure. Il faudrait donc aussi les exclure. Oui mais on n'a aucun critère. Sauf qu'en limitant le taux de faux positifs à ceux qui sont positifs on les exclut automatiquement. Cette définition aura ainsi plus de chances de donner une valeur pertinente pour caractériser la valeur réelle du test.<br /><br />Quand j'enseignais (en particulier les probabilités et statistiques mais je ne suis pas statisticien) et qu'un nouveau collègue statisticien venait d'arriver, je veux le brancher sur les statistiques médicales. Il me répond aussitôt en levant les bras : « On devrait interdire aux médecins d'utiliser la statistique ils font n'importe quoi avec ! » C'est loin d'être faux, j'en avais fait une communication affichée au congrès de la Sfsp à Lille en novembre dernier, communication très appréciée par certains congressistes épidémiologistes avec lesquels j'avais pu échanger[2]. <br /><br />A suivre, un autre exemple pour illustrer avec une définition complètement inadaptée pour classer le risque d'événements secondaires après vaccination par exemple.<br /><br />[2] http://storage.canalblog.com/35/91/310209/69807497.pdfBGnoreply@blogger.comtag:blogger.com,1999:blog-4313472142599177823.post-86843467306098342452012-03-30T20:45:24.587+02:002012-03-30T20:45:24.587+02:00@ BG
vous n'allez quand même pas prétendre réi...@ BG<br />vous n'allez quand même pas prétendre réinventer les calculs des probabilités ( et il n'y a pas de complot !)<br /><br />le pourcentage de faux positifs c'est 1- spécificité <br /><br />et la spécificité c'est le pourcentage de personnes ayant un test négatif parmi les non malades<br /><br />Mais comme le dit très bien CMT ce qui nous intéresse c'est la valeur prédictive positive c'est à dire la probabilité d’être malade si le test est positif<br /><br />et cette probabilité se calcule par le théorème de Bayes (cf lien que j'ai envoyé précédemment ) qui tient compte de la prévalence de la sensibilité et de la spécificité et pas seulement à partir du pourcentage de faux positif comme vous l'indiquezdocpphttps://www.blogger.com/profile/03907326434904736975noreply@blogger.comtag:blogger.com,1999:blog-4313472142599177823.post-80051863515846107772012-03-29T23:59:37.913+02:002012-03-29T23:59:37.913+02:00Ce procédé par dilution je l'ai déjà rencontré...Ce procédé par dilution je l'ai déjà rencontré dans d'autres situations avec des vaccins. Hier je n'avais pas encore vu ce type de problème avec cet histoire de faux positifs mais ça s'est éclairé pour moi au cours de la matinée. Désolé docteurdu16, mais je comprends bien que vous avez autre chose à faire avec une clientèle et que vous ayez du mal à suivre. Aussi je ne vous reprocherai pas les critiques que vous faites. Je ne suis pas à temps plein mais presque sur cette question depuis 2 jours, ce qui m'a permis d'avancer rapidement dans ma réflexion. Dès le début j'ai soulevé le problème de la définition des faux positifs. Je n'avais pas conscience qu'il pouvait y en avoir 2 tant ''l'autre'' c'est à dire celle en vigueur en médecine (mais pas forcément ailleurs), est plutôt anormale ici comme le confirme l'analyse que je viens d'en faire et ce même si on peut récupérer le bon résultat mais à quels prix, c'est là le problème. <br /><br /> C'était en fait sans doute la bonne question et j'ai constaté ce matin que cela faisait polémique sur Wikipédia, confirmant que je suis sans doute sur une piste importante. Je suis maintenant à peu près convaincu que cette histoire de définitions cache quelque chose et qu'elle n'est pas le fruit du hasard ou d'un choix arbitraire. C'est aussi grâce à vous et votre blog que j'ai pu avancer ainsi dans cette recherche aussi rapidement. Je vous en remercie très sincèrement même si vous me faites une opposition verbale complètement décalée. C'est assez normal que vous n'aimiez pas la recherche en direct avec ses aléas et ses changements de point de vue. Mais c'est ça la recherche, toujours en mouvement, à la différence de l'expertise qui plaque sous la coupole académique (ou la cloche à fromages si on voulait être méchant).<br /><br />C'est pourquoi je n'accepterai évidemment pas « que les définitions que les auteurs donnent et que les concepts qu'ils manient sont, jusqu'à preuve du contraire, justes . » Non, je ne vais quand même pas m'arrêter de réfléchir ? Quand on voit par exemple, comme j'ai pu le constater et comme je pourrais vous en apporter la preuve, que des épidémiologistes utilisent la règle de 3 avec des choux (pour faire simple) qui ne sont pas du tout tous au même prix, on a quand même le droit de s'interroger sans attendre que l'expert descende du Sinaï avec les tables de la Vérité.<br /><br />J'ai rappelé votre propos car il est très important : vous exprimez ici parfaitement la barrière qu'il faut absolument franchir si on veut faire de la recherche quel que soit le domaine, maths, physique, sport avec l'exemple du saut en hauteur mis au point par un homme seul abandonné de ses entraineurs qui voulaient le faire sauter en ventral. Il a inventé le saut sur le dos et la tête la première. Jamais aucun comité d'experts en saut en hauteur (mécaniciens, physiologistes comme avaient réunis les soviétiques pour mettre au point le ventral) n'aurait été capable d'inventer cette méthode complètement farfelue mais aujourd'hui universelle.BGnoreply@blogger.comtag:blogger.com,1999:blog-4313472142599177823.post-14809911481676720922012-03-29T23:15:42.741+02:002012-03-29T23:15:42.741+02:00Excusez-moi docteurdu16 vous n'avez pas bien c...Excusez-moi docteurdu16 vous n'avez pas bien compris, la réponse à votre problème est SANS aucun doute 2% comme je l'ai écrit dans mon dernier commentaire à partir du moment où les données sont 50 faux positifs et 1 vrai positif. Il n'y a aucun doute là-dessus mais ce n'est plus le problème car j'ai évolué sur la question depuis hier en partant non plus de votre problème mais des données en amont du problème, c'est à dire des nombres absolus et non des proportions fabriquées à partir de ces données. Ces nombres étant donc ici 1000, 50 et 1.<br /><br />Il y a 2 définitions a priori pour les faux positifs : par rapport aux 51 positifs ou par rapport à l'ensemble. Si vous avez 65 millions de Français dont 35 millions de femmes et 10 millions de ménopausées, le taux de ménopausées en France est-il 10/65 ou 10/35 ? Telle est la question du choix à faire à partir de ces données absolues et non plus pour remonter des pourcentages vers ces données absolues comme on le faisait hier encore. C'est ça le changement.<br /><br /><br />Si on prend ce que j'appelle, pour faire vite, ''ma'' définition, ça fait 98% de faux positifs et donc 2% de chances de tomber malade pour un positif. C'est bien le bon résultat obtenu immédiatement.<br /><br />Si on choisit ''l'autre'' définition on aura 5% de faux positifs qui fera croire qu'ils auront 95% de chances de tomber malades alors qu'il faut faire un calcul tenant compte de cette autre définition pour arriver aussi à 2%.<br />Nous constatons donc qu'avec les mêmes données, le taux de faux positifs va passer de 98% à 5% selon la définition adoptée et alors que ''ma'' définition est a priori tout aussi acceptable que l'autre sinon plus ici (et certainement plus d'ailleurs). On a quand même le droit de s'interroger sur une telle étrangeté, c'est le moins qu'on puisse dire, NON ?<br /><br />La question que je soulève MAINTENANT et qui n'est pas celle d'hier est pourquoi ''ils'' ont préféré une définition qui complique ainsi la situation et risque de la fausser en pouvant faire croire que le risque serait de 95% alors qu'il est de 2% ? Faudrait-il croire que ce serait pour pouvoir poser des colles aux étudiants ou s'imposer des complications calculatoires inutiles ?<br /><br />J'ai proposé une réponse : si on annonçait 98% de faux positifs le test n'aurait aucune chance d'être accepté, c'est à dire commercialisé et remboursé si vous voyez ce que je veux dire. Pour faire baisser le taux de faux positifs et rendre le test en apparence plus crédible ''ils'' auraient alors convenu d'adopter cette définition qui augmente le dénominateur (remplacé dans l'exemple par 999 au lieu de 51) sans changer le numérateur.BGnoreply@blogger.comtag:blogger.com,1999:blog-4313472142599177823.post-32401345004498315512012-03-29T21:43:15.761+02:002012-03-29T21:43:15.761+02:00@ BG. Vous êtes quand même casse-pied. Vous critiq...@ BG. Vous êtes quand même casse-pied. Vous critiquez, vous argumentez, vous interprétez et vous vous trompez. L'exemple que j'ai cité et qui perd désormais de son exemplarité dans la mesure où vous jetez le doute à la fois sur ce que j'ai écrit mais aussi sur ce que VOUS écrivez, disant tout et son contraire, ce qui est une bonne façon de ne jamais se tromper, l'exemple que j'ai cité est là pour illustrer la méconnaissance des statistiques en général et médicales en particulier et, surtout, la façon que certains ont de présenter les faits de façon falsifiée : semer le doute, attiser la peur. Donc, très cher BG, dont les propos, j'hésite à le dire, sont parfois farfelus mais aussi trolliens, c'est un néologisme, la réponse est 2 % Vous pouvez vous demander pourquoi je n'ai pas pris votre définition, vous pouvez me produire des éléments wikipediens, je reprends un problème posé par Cosmides et Tooby et vous trouverez ici nombre d'expériences qu'ils ont faites ici et là : http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.131.8290 mais le web est rempli de leurs travaux. Respirez un bon coup et acceptez que les définitions que les auteurs donnent et que les concepts qu'ils manient sont, jusqu'à preuve du contraire, justes. Merci d'en tenir compte.JC GRANGEhttps://www.blogger.com/profile/02625782569551294943noreply@blogger.comtag:blogger.com,1999:blog-4313472142599177823.post-60522197229813515612012-03-29T14:14:40.011+02:002012-03-29T14:14:40.011+02:00J'ai maintenant une explication à proposer sur...J'ai maintenant une explication à proposer sur la raison de l'existence de ces 2 définitions. Partons des données absolues et non pas des pourcentages qui modifient les données absolues selon les définitions choisies. <br /><br />On a donc 1000 hommes de 60 ans qui ont été testés et suivis pendant une durée déterminée pour le cancer de la prostate. On a 50 faux positifs, 1 vrais et 949 vrais négatifs. C'est cette étude qui a permis de tester les performances du test sur cette population.<br /><br />Avec ''ma'' définition le taux de faux positifs sera 50/51=98% et avec ''l'autre'' il sera 50/999=5%.<br />Un homme de 60 ans est testé positif, il s'inquiète. Avec ''ma'' définition on lui dit qu'il y a 98% de faux positifs et qu'il a donc seulement 2% de chances de tomber malade. Il part rassuré. Avec ''l'autre'' définition on lui dit qu'il y a 5% de faux positifs, ce qui va l'inquiéter car il va traduire aussitôt 95% de chances de … ce qui est une conclusion tout à fait normale. On lui explique alors qu'un calcul de probabilités montre qu'en réalité c'est 2%. Vous croyez vraiment qu'il va partir rassuré ou qu'on essaie plutôt de ne pas l'inquiéter en lui racontant des histoires de calculs de probabilités auxquelles il ne comprendra rien.<br /><br />QUESTION : pourquoi ne pas avoir choisi ''ma'' définition ?<br /><br />UNE REPONSE ? : Le labo va voir le ministre pour lui présenter son nouveau test. ''Quelles sont ses performances demande le ministre ?'' ''98% de faux positifs répond le laboratoire''. ''Quand vous serez descendu en dessous de 10% vous reviendrez me voir !''<br /><br />Pour abaisser ce fameux taux il y a la solution miracle utilisée aussi pour les vaccins : NOYER LE POISSON !!! C'est bien ce qui se produit avec ''l'autre'' définition alors qu'on aurait tout aussi facilement pu présenter les résultats avec ''ma'' définition.<br />Ceci pourrait-il expliquer cela ? Ceci pourrait-il aussi expliquer l'acharnement de la discussion sur Wikipédia ?BGnoreply@blogger.comtag:blogger.com,1999:blog-4313472142599177823.post-69948212158801577792012-03-29T12:36:55.978+02:002012-03-29T12:36:55.978+02:00Dans une discussion Wikipédia on lit ceci [1] :
«...Dans une discussion Wikipédia on lit ceci [1] :<br /><br />« Le taux de faux positif de 5% signifie que sur 100 grossesses identifiées comme des grossesses anormales, 5 le seront à tort »<br /><br />Qui doit signifier qu'on a eu 100 tests positifs dont seulement 5 grossesses non anormales parmi elles. Cette interprétation est confirmée ainsi sur une autre page de discussions sur Wikipédia où on discute ferme sur LA définition, c'est le moins qu'on puisse dire [2] :<br /><br />« Or la définition actuelle prétend que le taux de faux positif = FP / (FP + TP), ce qui est très différent » <br />FP : faux positifs ; TP : vrais positifs. La somme donne donc tous les positifs. C'est donc ''ma'' définition. Avec les valeurs 50, 1 et 1000 de docteurdu16 ce serait 50/51=98%.<br /><br />L'autre définition en discussion pour ce fameux taux est donc FP divisé par tous les non malades. Avec les mêmes valeurs ce serait 50/999=5%. Ce n'est pas la même chose !!!<br /><br />Leur discussion me paraît stérile, l'un des protagonistes, très chaud défenseur de la définition utilisée par docteurdu16, étant même sous la menace du comité d'arbitrage de Wikipédia !!! Je pense qu'il serait bien préférable de se demander dans quelles circonstances l'une est plus pertinente que l'autre et inversement, quitte à utiliser des mots différents pour éviter les confusions.<br />Rien n'est simple sur cette question car sur une autre page Wikipédia on lit :<br /><br />« le taux de faux positif de 5% signifie que si cent femmes enceintes d'un fœtus normal passent ce test, en moyenne 5 seront identifiées à tort comme des grossesses anormales »<br />qui est exactement la définition de docteurdu16. Son exemple est d'ailleurs repris un peu plus loin :<br /><br />« si l'on teste 1 000 personnes au hasard avec un test produisant 5 % de faux positifs, on annonce à 50 personnes que le test est positif. Si la maladie ne touche qu'une personne sur 1 000 dans la population générale, on peut montrer par le théorème de Bayes que la personne n'a (environ) que 2 % de chance d'être effectivement atteinte. »<br /><br />Mais le résultat donné par Bayes est directement sous la dépendance de la définition, car comme je l'ai montré il donne 95% avec ''ma'' définition qui n'est pas que la mienne.<br /> <br /><br />[1] http://fr.wikipedia.org/w/index.php?title=Faux_positif&oldid=48249002 <br /><br />[2] http://fr.wikipedia.org/wiki/Discussion:Faux_positif <br /><br />[3] http://fr.wikipedia.org/wiki/Faux_positifBGnoreply@blogger.comtag:blogger.com,1999:blog-4313472142599177823.post-22842490748844810382012-03-29T10:11:16.294+02:002012-03-29T10:11:16.294+02:00Si on prend l'exemple que vous avez proposé, d...Si on prend l'exemple que vous avez proposé, docteurdu16, comme un exemple pédagogique, la ''bonne'' réponse de devrait pas être ''ceux qui ont répondu 95% ont torts'' mais personne n'a tort, personne n'a raison, ça dépend de la définition utilisée.<br /><br />D'un autre point de vue y-a-t-il une définition plus pertinente que l'autre en toutes circonstances ? Un exemple fabriqué (par moi) : un test de grossesse. Si on l'applique à des femmes entre 20 et 30 ans il donne 5% de faux positifs avec ma définition. J'ajoute des femmes ménopausées dans le groupe des femmes testées. Ces dernières seront toutes négatives au test en raison d'une hormone manquante par exemple mais peu importe. Le taux de faux positifs ne changera pas avec ma définition. Par contre il va chuter avec l'autre définition puisque le numérateur ne change pas alors que le dénominateur augmente. Dans cet exemple quelle va être la définition la plus pertinente ? Sans discussion celle que j'utilisais.<br /><br />Plus généralement il peut toujours y avoir le risque de tester inutilement, par exemple contre le sida si on rendait le test obligatoire, des personnes qui ne sont pas à risque et ainsi d'avoir des données peu pertinentes pour mesurer l'intérêt du test. La définition à laquelle j'avais spontanément pensé est donc certainement utile. Il est possible que l'autre le soit aussi dans d'autres circonstances.<br /><br />Un commentateur sur Wikipédia écrit :<br />''j'ai un doute sur le fait que la définition soit la même dans tous les domaines, ce qui serait surprenant, plutôt une mauvaise habitude dans les sciences de la vie.''<br />Effectivement on peut s'interroger.BGnoreply@blogger.comtag:blogger.com,1999:blog-4313472142599177823.post-47859105525317721722012-03-29T09:33:59.240+02:002012-03-29T09:33:59.240+02:00Sur le lien donné par docpp on lit page 8 (nM dési...Sur le lien donné par docpp on lit page 8 (nM désignera ''non malade'') :<br /><br />« P(T si nM ) = taux de faux positifs <br /><br />Attention: pour certains auteurs:<br />taux de faux positifs = P( nM si T),<br /><br />Vérifiez donc toujours la définition utilisée ! »<br /><br />Cette dernière définition correspond à celle que j'ai utilisée : la proportion de non malades PARMI les positifs. Les 2 définitions existent donc, d'où le problème. Ce n'était donc pas inutile de préciser les choses.<br /><br />Quelle que soit la définition utilisée on ne peut pas dire que la probabilité d'être malade si positif soit proportionnelle à la prévalence, c'est plus compliqué comme le montre la formule de Bayes de la page 5 du lien de docpp car cette prévalence intervient aussi au dénominateur et pas seulement au numérateur.BGnoreply@blogger.comtag:blogger.com,1999:blog-4313472142599177823.post-13445065170877560022012-03-29T09:01:20.380+02:002012-03-29T09:01:20.380+02:00Il y a justement sur Wikipédia une discussion anim...Il y a justement sur Wikipédia une discussion animée sur LA définition de faux positifs :<br /><br />http://fr.wikipedia.org/wiki/Discussion:Faux_positif<br /><br />Comme quoi les définitions ne sont pas si claires et définitives que cela. D'autant plus qu'on peut se demander quel serait l'intérêt d'un test qui sur 51 positifs ne donnerait qu'un seul cas réellement malade. Mais que cela puisse effectivement exister, pourquoi-pas ?BGnoreply@blogger.comtag:blogger.com,1999:blog-4313472142599177823.post-28894935048603007232012-03-29T08:36:06.601+02:002012-03-29T08:36:06.601+02:00Mais docteurdu16 que veux dire ''taux de f...Mais docteurdu16 que veux dire ''taux de faux positifs de 5%'' ? Si c'est 50 faux positifs sur 1000 personnes testées c'est qu'on admet que le test donne, parmi les 1000 personnes testées, 5% de positifs qui seront non malades. Avec 50 et 51 vous avez donc traduit 2 hypothèses : 5% de testés positifs non malades et 0,1% de positifs malades (1 pour 1000). OK si c'est cela les hypothèses. <br /><br />Mais si 5% de faux positifs signifie 5% parmi les positifs comme il parait normal de le comprendre et avec 0 faux négatifs alors c'est 95%.<br /><br />Les phrases sont donc très imprécises : pour moi il paraissait très normal de comprendre que parmi les positifs on s'intéresse à ceux qui sont faux et à ceux qui sont vrais, ce qui est évidemment un critère essentiel pour apprécier la qualité du test. Donc qu'un taux de faux positifs représente la proportion de non malades PARMI les positifs et non pas parmi les personnes testées. <br /><br />Il s'agissait donc d'un problème de définition mais je n'avais jamais vu que ''taux de faux positifs'' s'appliquait à l'ensemble des testés. Il faut donc admettre que les 2 définitions existent en médecine, ce qui demande alors de préciser laquelle on applique. Le lien donné par docpp ne va pas dans le sens de l'utilisation de votre définition mais tout est possible en médecine...BGnoreply@blogger.comtag:blogger.com,1999:blog-4313472142599177823.post-48735965480416975982012-03-29T07:55:50.330+02:002012-03-29T07:55:50.330+02:00@ BG. Donc, en résumé, la réponse à la question po...@ BG. Donc, en résumé, la réponse à la question posée est 2 %;<br />La question posée était :<br />"Soit une maladie qui touche une personne sur 1000 en moyenne. Il existe un test pour la détecter avec un taux de faux positifs de 5 % Le résultat, dans votre cas, est positif. Quelle probabilité donnez-vous au fait d'avoir la maladie ?"<br />Et, l'origine était un questionnement de Cosmides et Tooby à des étudiants de Santa Clara (dont des étudiants médecins) et la réponse majoritaire fut 95 %<br />Ainsi les testeurs voulaient-ils montrer combien la formulation des questions et des résultats pouvaient être trompeuses.<br />C'est tout.<br />Le calcul Bayesien, au delà des notions classiques de spécificité / sensibilité, valeur prédictive positive / valeur prédictive négative, donne un résultat facile à obtenir.JC GRANGEhttps://www.blogger.com/profile/02625782569551294943noreply@blogger.comtag:blogger.com,1999:blog-4313472142599177823.post-872171163682918982012-03-28T23:11:35.057+02:002012-03-28T23:11:35.057+02:00Mettons nous deux minutes à la place des patients....Mettons nous deux minutes à la place des patients.<br />Qu'est-ce qui les intéresse?<br />La question posée est celle de la valeur prédictive positive des tests. C'est à dire la réponse à la question: "si mon test est positif, quels sont les risques que je sois réellement malade".<br /><br />Je crois que ce qui est intéressant à comprendre est que ces risques sont proportionnels à la prévalence de la maladie dans la population. C'est à dire, que même avec un test très performant, plus la maladie est rare, plus la probabilité d'être réellement malade en cas de test positif diminue.CMTnoreply@blogger.comtag:blogger.com,1999:blog-4313472142599177823.post-2494399496230081442012-03-28T21:42:46.792+02:002012-03-28T21:42:46.792+02:00Votre lien docpp permettra de ne pas avoir besoin ...Votre lien docpp permettra de ne pas avoir besoin de reprendre les probabilités de base, merci !<br /><br />La spécificité et la sensibilité sont des indicateurs fabriqués à partir d'autres données, on peut donc s'en passer si on ne part pas de leurs valeurs. Puisque l'article nous dit qu'il n'y a pas de faux négatifs, donc que tout malade est positif, la spécificité est 1. La prévalence supposée est 1/1000.<br /><br />Comment traduire ''le test donne 95% de vrais positifs'' sinon par ''parmi les positifs il y a 95% de malades'' ? Soit par P(M si T)=0,95 avec les notations du lien : M désignant l'événement ''être malade'' et T ''être positif''. Quelle était la question posée : que vaut P(M si T) ? La réponse est dans les données, il n'y avait rien à chercher et P(M si T)=M/T quand M est inclus dans T (pas de faux négatifs).<br /><br />Si on veut quand même utiliser la formule de Bayes donnée page 5 du lien, la spécificité valant 1 et P(M) valant 1/1000 il reste un terme à calculer qui est P(T et nM) en désignant les non malades par nM. Il reste donc à calculer le nombre de positifs parmi les non malades qui sera le nombre de positifs moins 1 parmi 1000.<br /><br />On a P(M)=P(M si T)P(T)+P(M si nT)P(nT) en désignant par nT les négatifs au test. Mais P(M si nT)=0 (pas de faux négatifs). On obtient alors P(T) en divisant 1/1000 par 0,95 soit 1,05 sur 1000 ou 105 positifs sur 100000 dont 100 malades, 100 étant 95% de 105.<br />On peut alors retrouver la valeur M/T sur le second membre de la formule de Bayes.<br /><br />Ce sont les faux négatifs qui feront que P(M si T) ne sera plus égale à M/T, M n'étant plus inclus dans T.BGnoreply@blogger.comtag:blogger.com,1999:blog-4313472142599177823.post-68883785986655135602012-03-28T14:15:10.624+02:002012-03-28T14:15:10.624+02:00l'exemple mélange 2 choses :les notions de fau...l'exemple mélange 2 choses :les notions de faux positif et de faux négatif renvoient aux notion de sensibilité et spécificité d'un test<br />5% de faux positif = 95 % de spécificité<br />5% de faux négatif = 95 % de sensibilité <br /><br />et la probabilité d'avoir la maladie en cas de test positif ou négatif qui dépend aussi de la prévalence et qui est exprimée par la valeur prédictive (positive ou négative<br /><br />lire à ce sujet http://www.iumsp.ch/Enseignement/pregradue/s_nspec.pdfdocpphttps://www.blogger.com/profile/03907326434904736975noreply@blogger.comtag:blogger.com,1999:blog-4313472142599177823.post-83965251732838310272012-03-28T14:09:54.908+02:002012-03-28T14:09:54.908+02:00Je reprends un instant ici le problème de la dysle...Je reprends un instant ici le problème de la dyslexie en relation avec ce que j'appelais ''les cerveaux gauche dominants'' et ''les cerveaux droits dominants'' car ce qui vient de se produire dans les commentaires ci-dessus illustre bien le problème :<br /><br />Je l'ai déjà dit je suis sans doute ''cerveau droit dominant'' aussi je poursuis l'idée sans trop m'occuper de l'écrit formel, d'où une inversion entre vrai et faux mais qui ne change rien au raisonnement que je fais car il ne se déroule pas, pour moi, à partir de ce que j'ai écrit. C'est pourquoi je me récupère aussitôt.<br /><br />Par contre, vous êtes probablement ''cerveau gauche dominant''. Aussi, ayant trouvé une erreur formelle dans mon écrit vous pensez sans doute qu'elle annule toute ma remarque et que cela sauve votre calcul. <br /><br />Les ''gauches dominants'' regardent la forme alors que les ''droits dominants'' poursuivent l'idée sans trop s'occuper de la forme, d'où des fautes formelles très durement sanctionnées par l'école. Il existe aussi des personnes qui peuvent passer suffisamment rapidement du droit au gauche et du gauche au droit pour ne pas avoir ces problèmes. Pour moi, et ça ne me gêne nullement de le dire si ça peut aider à comprendre comment pourrait se générer la dyslexie, j'ai tendance à m'attarder sur le cerveau droit. Ce dont s'occupe le cerveau gauche m'ennuie. C'est une analyse par introspection si je puis dire. Je ne prétends pas que ça explique tout mais ça pourrait être une piste.BGnoreply@blogger.comtag:blogger.com,1999:blog-4313472142599177823.post-86653946054428110052012-03-28T13:47:40.681+02:002012-03-28T13:47:40.681+02:00Je ne suis pas d'accord et je vous répondrai c...Je ne suis pas d'accord et je vous répondrai ce soir.JC GRANGEhttps://www.blogger.com/profile/02625782569551294943noreply@blogger.com