Cómo identificar texto e imágenes generados por IA

El contenido generado por IA es un desarrollo fascinante y cada vez vemos más artículos, historias e imágenes creadas por herramientas de IA. (Gracias, AI, por la frase introductoria).

ANUNCIOS
o que é detecção de ia

Sin embargo, la aparición de herramientas avanzadas de generación de IA ha expuesto problemas potenciales, desde que las personas no pueden detectar la diferencia entre la IA y las generaciones humanas hasta predicciones y análisis de IA completamente erróneos.

ANUNCIOS

Aquí es donde entra en juego la detección de IA, ya que es una forma de que las personas descubran cuándo el texto, las imágenes e incluso los vídeos se generan automáticamente para poder tomar decisiones informadas sobre el contenido que consumen. En esta publicación, cubriremos:

ANUNCIOS

Guia gratuito: como usar IA no marketing de conteúdo [Download Now]

Las herramientas de detección de IA no conocen el significado de las palabras y utilizan el contexto para analizar el texto. Para ser más técnicos, las herramientas utilizan el contexto de lo que es Para la izquierda de la siguiente palabra para predecir la probabilidad de la palabra de la derecha.

Cuanto más predecible sea la palabra de la derecha, es más probable que el texto sea generado por IA. Por otro lado, las oraciones escritas por humanos varían de patrones predecibles y son más creativas.

Si eres como yo, un ejemplo básico podría resultar útil para entender esto. Analicémoslo.

Digamos que alguien ingresa la frase, "Los conejos son tan lindos".

La herramienta utiliza datos aprendidos y contexto de palabras para izquierda de "lindo" para predecir que es más probable que "esponjoso" venga a continuación, más que palabras como "esponjoso" o "suave".

Dado que la oración sigue un patrón altamente predecible, la herramienta probablemente clasificará el texto como generado por IA.

Las herramientas de detección de IA funcionan a una escala mucho mayor con oraciones y párrafos más complejos que “Los conejitos son tan lindos” para hacer predicciones y clasificaciones, pero este es un ejemplo básico y muestra cómo funciona el proceso.

Algunas herramientas de detección analizan imágenes y vídeos y utilizan anomalías de píxeles para determinar si algo está generado por IA.

Cómo detectar texto generado por IA

No existen reglas ni pautas establecidas para identificar el texto generado por IA, pero aquí hay algunas cosas a tener en cuenta:

  • Repetición de palabras y frases: La IA sabe de lo que habla, pero no tanto como los expertos humanos. Sus resultados pueden repetir las mismas palabras clave y frases con poca variación cuando se trata un tema.
  • Falta de profundidad: Las herramientas de generación carecen de profundidad y no pueden ir más allá de los hechos básicos para analizar verdaderamente un tema y desarrollar una visión única. El texto generado por IA puede ser más robótico y prescriptivo que creativo y tiene un tono genérico.
  • Información inexacta y desactualizada: Los datos que tienen las herramientas de generación de contenido suelen ser correctos, pero debido a que las herramientas hacen predicciones, los resultados pueden ser incorrectos o no estar relacionados con hechos reales. Además, la información puede estar desactualizada, ya que ChatGPT se limita a información anterior a septiembre de 2021.
  • Formato y estructura: Las herramientas de generación siguen la misma estructura de oraciones que los humanos, pero las oraciones pueden ser más cortas y carecer de la complejidad, la creatividad y la estructura de oraciones variada que producen los humanos. El contenido se puede simplificar y uniformar con poca variación.

El texto escrito por humanos también tiene más probabilidades de tener errores tipográficos y utilizar lenguaje informal y vulgar.

Roft.io es un juego divertido para poner a prueba tus habilidades de detección y ver qué tan bueno eres para predecir cuándo la IA genera texto.

Cómo detectar imágenes y vídeos generados por IA

Identificar imágenes y videos generados por IA puede ser un poco más desafiante que detectar texto. Algunas indicaciones comúnmente discutidas son:

  • Fondos texturizados, imágenes que parecen retocadas, pinceladas aleatorias en las imágenes
  • Nitidez general de la imagen o partes de las imágenes que están borrosas mientras que otras son más nítidas
  • Texto visible en el fondo de las imágenes.
  • Asimetría en rostros, dientes y manos humanas.
  • Signos de marcas de agua o firmas de artistas (las herramientas de inteligencia artificial se entrenan a partir de obras de arte existentes)

Herramientas como DALL-E 2 colocan una marca de agua en las salidas de imágenes, pero puede que no sean fáciles de detectar. OpenAI también permite a las personas eliminar una marca de agua. También puedes invertir la búsqueda de imágenes para ver si hay rastros de una imagen en la web.

El desafío de detectar imágenes y videos de IA es la razón por la cual los deepfakes son tan peligrosos, ya que los videos e imágenes que parecen lo suficientemente realistas pueden difundir información errónea rápidamente.

Herramientas de detección de IA

En este momento, podría ser más fácil saber si algo está generado por IA porque suena robótico o si a alguien le faltan dos dedos en una imagen. Si las herramientas de generación se vuelven más sofisticadas, puede resultar más difícil para los humanos encontrar valores atípicos clave.

Independientemente de los avances futuros, las herramientas de detección pueden ser más útiles que nuestras propias habilidades de deducción a la hora de clasificar el contenido generado por IA, y hay varias opciones disponibles.

A continuación, veremos algunos de ellos y evaluaremos su efectividad utilizando un párrafo generado por IA del Asistente de contenido de HubSpot (que usa GPT). Esto es lo que me dijo cuando le pedí que escribiera un párrafo sobre perros:

“Los perros son criaturas simplemente increíbles. Son leales, cariñosos e infinitamente divertidos. Ya sea que necesite un amigo peludo para acurrucarse en el sofá o un compañero leal para explorar el aire libre, los perros siempre están a la altura de la tarea. Los hay de todas las formas y tamaños, desde pequeños chihuahuas hasta majestuosos grandes daneses, pero todos los perros comparten una cosa en común: una capacidad ilimitada de amor y afecto. Si eres un amante de los perros de toda la vida o un recién llegado al mundo de la compañía canina, nunca ha habido un mejor momento para descubrir las alegrías de la vida con un amigo peludo a tu lado.

Tenga en cuenta que la escritura humana aún puede activar una herramienta si sigue un patrón predecible.

1. CeroGPT

  • Precio: Gratis o contáctenos para API personalizada
  • Pruebas para: ChatGPT y Google Bard

El algoritmo de ZeroGPT se basa en más de 10 millones de artículos y textos para tener una tasa de precisión de detección de 98%. Admite texto multilingüe y detecta generadores de idiomas populares como Chat GPT, GPT-4 y Google Bard. Los resultados resaltan las oraciones que es más probable que escriba la IA.

Entré al párrafo generado por IA sobre perros y predijo que el texto es 88.57% generado por AI/GPT.

melhores ferramentas de detecção de IA: zerogpt

Mejor para: ZeroGPT se creó para que los educadores prueben contenido generado por IA, pero funciona para cualquiera que busque detectar contenido de IA.

2. Sala de pruebas del modelo de lenguaje gigante

  • Precio: Gratis
  • pruebas para: Desarrollado en 2019 para texto GPT-2, puede no ser confiable en otros generadores

El laboratorio de IA Watson del MIT-IBM y el grupo de PNL de Harvard crearon la sala de pruebas del modelo de lenguaje gigante para detectar texto generado por IA. Analiza las entradas en función de la probabilidad de que cada palabra aparezca en función de la palabra inmediatamente a su izquierda. Cuanto más predecible sea la palabra, más probabilidades habrá de que la IA escriba el texto.

Esta herramienta no proporciona un porcentaje, sino que codifica las palabras con colores según su previsibilidad; el verde significa que la palabra es parte de las 10 palabras más predecibles.

La mayor parte de mi párrafo está resaltado en verde, por lo que las palabras se encuentran entre las 10 más predecibles (según el contexto) y con mayor probabilidad de ser generadas por IA.

melhores ferramentas de detecção de IA: sala de teste de modelo de linguagem gigante

Mejor para: Probar GPT-2 y aprender más sobre escritura predecible a través de un análisis de probabilidad en profundidad.

3. Originalidad.AI

  • Precio: Prueba gratuita de 50 créditos, luego US$ 0,01/100 palabras (1 crédito escanea 100 palabras)
  • Pruebas para: ChatGPT, GPT-3, GPT-3.5, GPT-NEO, GPT-J

Originality.AI Chrome Extension, desarrollada por expertos en marketing de contenidos, detecta múltiples versiones de GPT con una precisión de 94%. Califica el texto en una escala de 0 a 100, siendo más probable que la IA produzca una puntuación más alta. También puede utilizar la herramienta para comprobar si hay plagio (beneficiosa para los educadores). Es el más preciso con más de 50 palabras.

En mis pruebas, dije que el párrafo tenía una probabilidad de 99% de ser escrito por IA.

melhores ferramentas de detecção de IA: originality.ai

Mejor para: La extensión de Chrome la hace perfecta para cualquiera que busque un proceso de detección inmediato y fluido al escribir y leer en línea. Los escritores, especialistas en marketing de contenidos y editores web pueden aprovechar esta herramienta; no para académicos.

4. Contenido a escala

  • Precio: Versión gratuita o contáctenos para conocer los precios de API
  • Pruebas para: GPT

El detector de IA de contenido a escala utiliza 3 motores de IA y procesamiento de lenguaje natural para detectar ChatGPT, todas las versiones de GPT y otros generadores. Puede utilizarlo para probar contenido SEO, educativo y de marketing. La herramienta necesita al menos 25 palabras para obtener resultados confiables y puede ingresar hasta 25.000 caracteres.

Los resultados de mi prueba no fueron concluyentes porque la herramienta no podía decir con certeza si el párrafo fue generado por IA. Dio una puntuación de contenido humano de 51% con una previsibilidad de 17%.

melhores ferramentas de detecção de IA: conteúdo em escala

Dijo con seguridad que la última frase la genera IA.

melhores ferramentas de detecção de IA: conteúdo em escala

Mejor para: Creadores de contenido centrados en SEO y marketing para obtener desgloses de texto línea por línea y analizar contenidos más largos (hasta 25.000 caracteres).

5. Escritor de IA

  • Precio: Versión gratuita o contáctenos para conocer los precios de API
  • Pruebas para: ChatGPT y otros generadores

El detector de contenido de Writer AI estima cuánto texto genera la IA. Las versiones gratuita y de pago tienen un límite de 300 palabras (1500 caracteres) y los resultados proporcionan una predicción porcentual de qué parte del texto es contenido generado por humanos.

Marcó mi párrafo como 87% generado por humanos, con una recomendación de editar el texto hasta que haya menos contenido de IA detectable.

escritor

Mejor para: B2B y empresas y agencias que buscan revisar y editar contenido antes de publicarlo.

6. Herramientas de detección de IA de Hive

  • Precio: Demostración gratuita, comuníquese con ventas para conocer los precios de API
  • Pruebas para: ChatGPT, GPT-3, DALL-E, Midjourney, transmisión estable

Hive ofrece un conjunto de herramientas de detección de IA para imágenes, texto y deepfakes.

La herramienta de detección de texto proporciona una puntuación de confianza sobre la probabilidad de que algo sea generado por IA y estima qué secciones son más predecibles. También estima qué secciones de texto tienen más probabilidades de ser generadas por IA. Funciona a partir de 750 caracteres con una longitud recomendada de 1500 caracteres.

Tuve que ingresar palabras adicionales para alcanzar el límite de caracteres, y predijo que era probable que el párrafo contuviera 99.99% contenido generado por IA.

melhores ferramentas de detecção de IA: moderação de hive

La herramienta de reconocimiento de medios identifica los medios generados por IA, proporciona una calificación (generada por IA o no), una puntuación de confianza (≤ 1) y una fuente de generación de imágenes (como DALL-E). (Documentación, página de herramientas)

La herramienta de detección de deepfake prueba si las imágenes o los vídeos son deepfake mediante la clasificación facial. (Documentación)

Mejor para: Trabajos de detección para detectar contenido de IA o para que los sitios web detecten y moderen imágenes y texto generados por IA.

7. Bonificación: clasificador de texto OpenAI

  • Precio: Gratis (requiere cuenta)
  • Pruebas para: Todas las versiones GPT

El clasificador de texto de OpenAI puede distinguir entre texto generado por IA y texto escrito por humanos. Funciona mejor con más de 1000 caracteres y texto en inglés.

OpenAI señala que no es completamente confiable y solo identifica correctamente 26% a partir de texto AI y etiqueta incorrectamente texto escrito por humanos como AI 9% algunas veces, pero la confiabilidad aumenta para textos más largos. Recomienda utilizar el clasificador como complemento de otros métodos de prueba.

Mejor para: Detectando GPT

¿Cuál es la mejor herramienta de detección de IA?

He descrito los puntajes de las pruebas individuales de cada herramienta arriba, pero aquí hay una tabla que compara los puntajes.

Herramienta puntuación
CeroGPT 88,57% de contenido de IA
Sala de pruebas del modelo de lenguaje gigante Sólo probabilidad
Originalidad.IA Contenido de IA 99%
Contenido a escala Contenido de IA 49%
Escritor de IA Contenido de IA 13%
colmena 99,99% de contenido de IA

A partir de estas clasificaciones,

  • El primer lugar es un empate. entre Originality.AI, GLTR y Hive AI
  • Segundo lugar es ceroGPT
  • Tercer lugar es escritor AI
  • Cuarto lugar Es contenido a escala

Para ti

La detección de IA hace que sea mucho más fácil distinguir entre texto generado por máquina y texto generado por humanos. A medida que las herramientas de IA se vuelvan cada vez más precisas, la detección de IA seguirá siendo importante para ayudar a las personas a determinar la legitimidad del contenido que consumen.

Nova frase de chamariz