Les cliniciens utilisant la recherche conversationnelle MedSearch AI répondent aux questions 79 % plus rapidement et effectuent 34 % de recherches en moins
MedSearch : l'IA en temps réel, fondée sur des preuves, a réduit le temps de réponse des cliniciens de 79 % et les recherches de 34 % dans le cadre d'un projet pilote.
MedSearch : Accélérer la prise de décision médicale fondée sur des données probantes grâce à la recherche par IA en temps réel – Une étude préliminaire montre des réponses 79 % plus rapides et une réduction de la charge de recherche
Dans le monde en constante évolution de la médecine clinique, un accès rapide et fiable à des données probantes actualisées est essentiel pour une prise en charge optimale des patients. Pourtant, les professionnels de santé sont souvent confrontés à des méthodes de recherche d'information inefficaces, s'appuyant sur des recherches bibliographiques traditionnelles, parfois chronophages et fragmentées. Pour pallier cette lacune, MedSearch propose un agent conversationnel basé sur l'IA, conçu pour effectuer des recherches en ligne en temps réel, fondées sur des données probantes et adaptées aux requêtes médicales. Les résultats préliminaires révèlent que les cliniciens utilisant MedSearch ont répondu aux questions cliniques 79 % plus rapidement et avec 34 % de recherches en moins par rapport aux méthodes traditionnelles, ce qui témoigne d'une avancée prometteuse dans l'accès à l'information clinique.
Cet outil innovant intègre les atouts des grands modèles linguistiques à une connectivité internet en temps réel, lui permettant de rechercher et de référencer dynamiquement la littérature médicale validée la plus récente. Cette adaptabilité offre un puissant complément au flux de travail des cliniciens, transformant potentiellement l'accès aux connaissances médicales au point de service. Dans cet article de blog, nous explorons l'étude évaluant les performances de MedSearch auprès des professionnels de santé, sa rigueur méthodologique et ses implications pour la pratique clinique et son déploiement futur.
Partenariat et contexte de l'étude
L'étude a été menée par des chercheurs d'Arkangel AI à Bogotá, en Colombie, motivés par un besoin reconnu d'améliorer l'accès en temps réel à des connaissances médicales validées en milieu clinique et universitaire. Le contexte sanitaire colombien, marqué par la diversité des populations de patients et la variabilité des ressources, offre un contexte pertinent pour tester des outils numériques visant à améliorer l'aide à la décision clinique. Cette collaboration reflète un intérêt international croissant pour l'exploitation de l'IA afin de rationaliser la recherche de données probantes et d'intégrer plus efficacement les connaissances cliniques dans les flux de travail des soins de santé.
L'étude a spécifiquement porté sur une cohorte d'étudiants en médecine, de médecins généralistes et de spécialistes, reflétant un large éventail d'expériences cliniques et de besoins en information. En comparant MedSearch aux techniques de recherche conventionnelles, les chercheurs ont cherché à évaluer non seulement la rapidité et l'efficacité, mais aussi l'acceptabilité de cette approche assistée par l'IA dans des scénarios de raisonnement clinique réels.
Conception et méthodologie de l'étude
L'étude a utilisé un plan randomisé impliquant 25 participants préliminaires répartis en deux groupes :
- Groupe A (utilisateurs de MedSearch) : 13 participants ont utilisé l'agent conversationnel MedSearch pour répondre à des questions de cas cliniques.
- Groupe B (méthodes traditionnelles) : 12 participants ont utilisé des stratégies de recherche conventionnelles, excluant toute plateforme basée sur l'IA.
Les participants ont abordé quatre scénarios cliniques, chacun accompagné de quatre questions soigneusement conçues couvrant le diagnostic général, le diagnostic différentiel, la recherche de pointe et les connaissances médicales générales. Les indicateurs clés enregistrés comprenaient le temps moyen de réponse à chaque question et le nombre de recherches effectuées par question. De plus, les participants du groupe A ont répondu à une brève enquête évaluant l'utilité perçue, la confiance dans les réponses, la probabilité d'utilisation quotidienne et la volonté de recommander MedSearch à leurs pairs, à l'aide d'une échelle de notation simple de 1 à 3.
MedSearch fonctionne en combinant des techniques avancées de modèles de langage à grande échelle (LLM) avec une connexion Internet en direct, permettant une récupération dynamique d'informations actualisées et fondées sur des preuves, avec un accès direct aux références sources. Cela contraste avec les LLM classiques déployés hors ligne ou entraînés sur des ensembles de données statiques, ce qui répond à une limitation cruciale des outils d'IA médicale.
Résultats clés
- Temps de réponse : Le temps de réponse médian par question était de 46 secondes pour les utilisateurs de MedSearch, contre 1,75 minute pour les utilisateurs traditionnels, soit une réduction impressionnante de 79,8 %.
- Nombre de recherches : Les utilisateurs de MedSearch ont effectué en moyenne 3,81 recherches par question, contre 5,38 pour les utilisateurs traditionnels, soit une baisse de 34,1 %.
- Scores d'acceptabilité utilisateur (échelle de 1 à 3) :
- Utilité perçue : 3,0 (utile pour répondre aux questions)
- Confiance dans l'exactitude : 2,7 (généralement confiant)
- Probabilité de Utilisation quotidienne : 2,8 (utilisation probable) Recommandation aux pairs : 3,0 (recommander)
Ces résultats préliminaires soulignent l’efficacité obtenue en intégrant un outil de recherche conversationnelle basé sur l’IA à la résolution de problèmes cliniques, sans compromettre la confiance ni la satisfaction des utilisateurs.
Interprétation et implications
La réduction spectaculaire du temps de recherche et du volume de requêtes suggère que MedSearch peut rationaliser les flux de travail cliniques en fournissant rapidement des réponses pertinentes et fondées sur des données probantes. Cette fonctionnalité pourrait réduire la charge cognitive des prestataires, accélérer la prise de décision et, in fine, améliorer les résultats pour les patients grâce à l’intégration rapide des meilleures données probantes actuelles. Les taux élevés d'acceptabilité et de confiance indiquent également que les cliniciens jugent l'outil fiable et pratique, des facteurs importants pour son adoption et son utilisation durable.
À l'inverse, les méthodes de recherche traditionnelles, qui nécessitent souvent plusieurs plateformes, manuels ou bases de données, présentent des obstacles logistiques à une recherche efficace d'informations. L'interface conversationnelle de MedSearch offre un moyen plus intuitif et interactif de naviguer dans des bases de connaissances médicales complexes, réduisant ainsi les obstacles à la pratique fondée sur les preuves dans des environnements cliniques très fréquentés.
Néanmoins, compte tenu du caractère préliminaire de ces résultats, une validation plus approfondie auprès de cohortes plus larges et plus diversifiées est essentielle. De plus, l'étude n'a pas encore évalué la précision diagnostique ni les résultats pour les patients directement liés à l'utilisation de MedSearch, domaines qui méritent d'être approfondis. Les biais potentiels liés à la difficulté des questions ou à la familiarité des participants avec les outils numériques méritent également d'être examinés attentivement.
Déploiement et évolutivité
L'architecture de MedSearch permet une intégration transparente dans les environnements cliniques où une aide à la décision rapide est nécessaire, comme les services d'urgence, les cliniques externes et les hôpitaux universitaires. Sa connexion Internet en temps réel le distingue des systèmes fermés de LLM et permet une mise à jour continue des données probantes avec une intervention manuelle minimale.
Les défis d'un déploiement à grande échelle incluent la garantie de la confidentialité des données, la sécurisation d'un accès Internet fiable et la formation des utilisateurs pour une utilisation optimale. La résolution de ces obstacles sera essentielle dans les environnements disposant d'une infrastructure informatique limitée. Cependant, la flexibilité de MedSearch permet une adaptabilité à de multiples langues, spécialités et systèmes de santé à l'échelle mondiale, ce qui laisse entrevoir un vaste potentiel au-delà du contexte colombien initial.
De plus, la technologie sous-jacente pourrait être étendue pour soutenir les professions paramédicales, l'éducation des patients et la diffusion d'informations de santé publique, accélérant ainsi le transfert de connaissances au sein de l'écosystème médical.
Conclusion et prochaines étapes
L'étude pilote MedSearch présente des preuves préliminaires convaincantes que la recherche de données probantes en temps réel grâce à l'IA peut améliorer considérablement l'accès aux informations cliniques. En réduisant considérablement le temps et les efforts de recherche tout en préservant la confiance des utilisateurs et leur utilité perçue, MedSearch offre une voie prometteuse pour intégrer les connaissances médicales les plus récentes à la pratique courante.
À l'avenir, des essais à plus grande échelle évaluant la précision clinique, l'impact des décisions et les résultats pour les patients seront essentiels. Des efforts parallèles devraient se concentrer sur l'intégration de MedSearch aux dossiers médicaux électroniques et sur l'optimisation de son interface pour divers groupes d'utilisateurs. Grâce à un développement et une validation continus, des outils comme MedSearch pourraient devenir des atouts indispensables pour des soins fondés sur des données probantes, efficaces et centrés sur le patient.
Références
- Castaño-Villegas N, Villa MC, Llano I, Zea J. Validación preliminar de MedSearch: un agente conversacional para responder preguntas médicas en tiempo real basadas en evidencia. Arkangel AI, Bogotá, Colombie, 2024.
- Liu N, Chen L, Tian X, Zou W, Chen K, Cui M. Du LLM à l'agent conversationnel : une architecture optimisée par la mémoire avec un réglage précis des grands modèles de langage. arXiv 2024. http://arxiv.org/abs/2401.02777
- Gilson A, Safranek CW, Huang T, Socrates V, Chi L, Taylor RA, Chartash D. Comment ChatGPT se comporte-t-il à l'examen d'autorisation d'exercer la médecine aux États-Unis (USMLE) ? JMIR Med Educ. 2023 ; 9 : e45312.
- Thirunavukarasu AJ, Ting DSJ, Elangovan K, et al. Grands modèles de langage en médecine. Nat Med. 2023 ; 29 : 1930-1940.