La química analítica Heather Desire y su equipo de la Universidad de Kansas (KU) han desarrollado un detector que, según afirman, tiene una eficacia del 98 al 100 % para identificar artículos de química para módulos de idiomas principales (LLM, por sus siglas en inglés) como ChatGPT.1 Los investigadores sostienen que su herramienta puede ayudar a los editores científicos a detectar y prevenir el uso indebido de la inteligencia artificial (IA) en revistas académicas.
Los investigadores revelaron por primera vez su detector en junio, cuando lo aplicaron al artículo del Prospectus. ciencia y descubrió que reconoce texto científico generado por ChatGPT con más del 99% de precisión.2 Pero ahora han ampliado drásticamente el alcance de la herramienta probándola en artículos de química.
El detector KU fue entrenado en 10 pasajes introductorios de 10 revistas publicadas por la American Chemical Society. Luego, el equipo trabajó escribiendo pasajes similares en ChatGPT.
Los modelos de aprendizaje automático identifican correctamente los pasajes escritos por humanos el 100 % de las veces, así como los elaborados a partir de pistas basadas únicamente en los títulos de los informes. Los resultados fueron casi igual de buenos cuando el LLM fue capacitado en los pasajes introductorios, con un reconocimiento correcto el 98% de las veces.
«La principal motivación era examinar de forma más amplia la selección de revistas… y queríamos desafiar el método con indicadores más complejos y diversos», explica Desaire.
Los expertos en fraude en investigación señalan que ChatGPT Finder se puede utilizar como herramienta para señalar artículos sospechosos, que luego serán investigados por revisores o editores de revistas para determinar si son fraudulentos.
Elisabeth Bick, microbióloga y consultora de integridad científica en Estados Unidos, está entusiasmada con el estudio. «Se trata de una nueva herramienta bienvenida que puede ayudar enormemente a los editores de revistas científicas a la hora de seleccionar manuscritos entrantes en busca de textos generados por ordenador, como… utilizando software de detección de plagio», afirma. mundo de la quimica.
Pero Suniyat (John) Suhrawardy, estudiante de doctorado de quinto año en el Instituto de Tecnología de Rochester de Nueva York que trabaja en la identificación de «falsificaciones profundas», tiene algunas reservas. «Ninguna revista, ningún lugar académico debería utilizar herramientas como única justificación para rechazar un artículo», afirma. «Creo que su trabajo tiene mérito como primer paso, siempre que sea lo suficientemente eficiente y con pocos recursos, pero hay que decir que este documento no debe utilizarse como prueba concluyente para el rechazo».
Preocupaciones por afirmaciones sobrevaloradas
Sin embargo, muchos expertos en esta área se muestran escépticos ante la afirmación de que cualquier detector de IA alcance altos niveles de confiabilidad. Debbie Cotton, directora de práctica académica de la Universidad Plymouth Margin en el Reino Unido, señala que los primeros experimentos con muchos de estos detectores han sugerido una alta precisión, pero que esto rara vez se ha confirmado una vez que se han llevado a cabo más ensayos a gran escala.
Captain, quien escribió un estudio reciente que examinó el uso de la IA en la educación superior.3, afirma que en el caso de esta herramienta moderna, el modelo fue entrenado específicamente en un campo estrecho y esto la hará más eficiente. Aun así, sugiere que normalmente es bastante fácil evitar tales detectores con algún nivel de edición humana, señalando que incluso hay un nuevo servicio llamado Undetectable AI que ayuda a los autores que quieren ocultar el origen AI de su trabajo.
Robin Shipway, profesor de biología marina en la Universidad de Plymouth y coautor del artículo de Kapitan, está de acuerdo. ¿Qué ha impedido a los autores escribir utilizando LLM, comparar el resultado con el software de detección y luego modificarlo hasta que obtenga una puntuación baja en el software de detección? él pide. «Por el momento, nada.»
Desaire ahora quiere determinar hasta qué punto ChatGPT ha penetrado en el instituto de investigación. «Tenemos un detector que es útil para encontrar soporte ChatGPT en la redacción científica académica, y luego el siguiente paso será aplicarlo a la redacción científica académica y ver», afirma.
«No creo que nadie sepa realmente cuánto contribuye ChatGPT a la literatura académica: ¿es cero, es 20%?» Pregunta el deseo. Ella dice que sus estudios futuros tendrán como objetivo aclarar cuán común e inaceptable es el uso de ChatGPT en la literatura científica.