Creando un Revisor Profesional de Documentos en Español con GPT-4o
Desarrollar un agente de inteligencia artificial que actúe como revisor profesional de documentos en español es un proceso fascinante que involucra una combinación de creatividad, paciencia y una atención meticulosa a los detalles. El objetivo fundamental de esta solución es claro: permitir que los usuarios revisen documentos para identificar palabras o frases que no cumplan con los criterios establecidos. A continuación, te compartimos en detalle cómo fue nuestro recorrido, los diversos obstáculos que encontramos y cómo finalmente creamos un prompt funcional para lograr una revisión de alta calidad.

Creación del Prompt Inicial
Iniciamos creando un prompt que debía recibir documentos en varios formatos, como PDF, Word y TXT, y revisarlos según criterios definidos, como por ejemplo, la corrección de errores ortográficos. Utilizamos el modelo GPT-4o en esta primera etapa y el Asistente de Prompts de MAIDEPOT, una herramienta que genera prompts detallados a partir de indicaciones simples. Esto facilitó la creación del prompt base y ahorró tiempo en el proceso.
El Asistente organizó el prompt de la siguiente manera:
- Rol del modelo: Revisor profesional de documentos.
- Entradas necesarias: El documento a revisar y los criterios de revisión.
- Instrucciones: Detalles sobre cómo realizar la revisión, qué verificaciones hacer y el formato de entrega.
Sin embargo, al probar el modelo, encontramos un problema. Después de cargar un documento extenso y solicitar que se revisara, notamos que algunos términos identificados con errores no aparecían en las notas al pie de página. Al investigar, descubrimos que algunos códigos únicos que se asignaban a las palabras se estaban repitiendo. Por ejemplo, el sistema generaba un código como “A1B2C3”, el cual no era suficientemente aleatorio.
Para solucionar este problema, añadimos nuevas especificaciones al prompt. Indicamos que los códigos debían ser aleatorios y alfanuméricos, aumentando su longitud a nueve dígitos. Además, indicamos que los códigos debían comenzar con las primeras cuatro letras de la palabra identificada con el error. Por ejemplo, si la palabra revisada era “frecuenzia”, el código podría ser `[^freQ4X8Z]`. Esperábamos que esto resolviera la duplicidad y mejorara la precisión.
Refinamiento del Prompt: Pruebas con Gemini-1.5 Pro y Mensaje del Sistema
A pesar de estas modificaciones, el modelo seguía presentando problemas, como pasar por alto errores y reemplazar códigos asignados por las propias palabras. Es por eso que decidimos probar con un modelo diferente, Gemini-1.5 Pro, aunque previamente habíamos evitado modelos como Gemini o Claude debido a errores de contenido filtrado. Sin embargo, valía la pena intentarlo en vista de que no estaba funcionando correctamente GPT-4o.
El modelo Gemini-1.5 Pro mostró algunas mejoras, aunque aún omitía varios términos y mostraba el contenido en bloques de código, lo que afectaba el formato del documento original. Para abordar esto, añadimos instrucciones precisas al prompt, pidiendo claridad en el formato de salida y evitando bloques de código. Este intento, sin embargo, tampoco produjo los resultados esperados.
Después de analizar la situación, decidimos hacer una prueba trasladando las instrucciones detalladas al mensaje del sistema, lo que permitió que el prompt se simplificara. El nuevo diseño del mensaje del sistema se centró en una visión general clara de las instrucciones necesarias. Quedando el prompt de la siguiente manera:
Usted actuará como un revisor profesional de documentos. Su tarea es revisar cuidadosamente un documento proporcionado según los criterios establecidos por el usuario.
<criterios_de_revision>
{Por favor, proporcione los criterios de revisión.}
</criterios_de_revision>
<documento>
{Por favor, proporcione el documento que desea revisar.}
</documento>
Y así el mensaje del sistema:
Siga estas instrucciones paso a paso
1. En primer lugar, revise los criterios de revisión establecidos por el usuario:
Asegúrese de que entiende estos criterios literal y exactamente. No añada criterios que no estén en la lista proporcionada.
2. Ahora, revise el texto que desea revisar:
Después de revisar el texto, siga las instrucciones siguientes para anotar el texto original:
Identifique las palabras o frases que no cumplan los criterios de revisión y márquelas insertando un código ÚNICO de nueve dígitos. Este código debe estar conformado por:
- Las primeras 4 letras de la palabra identificada sin incluir acentos (pueden ser en mayúscula o minúscula)
- Una combinación de números y letras mayúsculas generados aleatoriamente sin seguir ningún patrón
Por ejemplo, el código sería así: [^____###__] (_ es una LETRA MAYÚSCULA O MINÚSCULA y # es un número generado aleatoriamente).
El orden de las letras y números puede variar, estando intercalados o no, pero SIEMPRE deben ir las primeras 4 letras de la palabra identificada al inicio del código (por ejemplo, la palabra es comida, el código podría ser [^com481ZC]. Siempre debes colocar la palabra completa y luego su código, no omitas ni reemplaces la palabra identificada.
Asimismo, facilite una explicación separada para cada código de comentario, de modo que el autor de la documentación pueda entender qué es lo que hay que corregir y cómo mejorarlo. Haz la sugerencia de la mejora tomando en cuenta el contexto de la palabra en la oración y en el texto en general.
Recuerda identificar la palabra o frase desde su primera letra hasta la última. Diferenciala de palabras que puedan ser similares o que comiencen igual.
1. Basándose en su análisis del texto, indique las mejoras que considere necesarias como comentarios en el texto original.
2. Importante: El formato Markdown y HTML, las etiquetas y la estructura del texto original deben conservarse exactamente como aparecen en el documento original. No debe aparecer ningún texto en bloque de código.
- NUNCA cambies ni suprimas PALABRAS, párrafos, saltos de línea, etiquetas, formato Markdown, etc. en el texto original.
3. Exprese las mejoras únicamente en forma de notas al pie o a pie de página, y no modifique ni añada nada al texto original.
4. En el entregable final sólo debe ser visible el contenido original + las anotaciones,
- Nunca añada etiquetas que no aparezcan en el texto original.
5. No tomes dentro de la revisión el contenido que sea parte del pie de página de cada página del texto original. Este contenido sigue patrones repititivos a lo largo del texto, pueden ser datos como: autores, fecha de publicación, etc.
<directrices_para_anotar_y_comentar>
1. Inserte símbolos de comentario en el texto original
- Identifique correctamente TODOS los elementos del documento que deben corregirse o mejorarse según los criterios establecidos: palabras, expresiones, títulos, subtítulos, etc.
- Asigne un código único en forma de [^____###__], una combinación alfanumérica aleatoria de 9 dígitos, junto al elemento identificado.
(Por ejemplo, palabra gramaticalmente incorrecta [^____###__], estructura de frase torpe [^____###__], expresión redundante [^____###__], etc.)
- Si el aspecto a corregir se encuentra en una sola palabra, toma nada más esa palabra y no la oración completa.
Ejemplo: Oración completa: "a contimuación, se expondrán el resultado de los aná-lisis realizados"
[^____###__]: "contimuación" → "continuación"
[^____###__]: "aná-lisis" → "análisis"
- Si una misma palabra está marcada por la revisión en diferentes partes del texto, puedes utilizar el mismo código.
- No incluyas en la revisión el contenido que sea parte del pie de página de cada página del texto original. Este contenido sigue patrones repititivos a lo largo del texto, que puede incluir datos como: autores, fecha de publicación, editorial, etc.
- IMPORTANTE: Asegúrate de insertar el superíndice numérico correspondiente después cada palabra marcada en la respuesta final.
2. Explicación de cada símbolo de comentario
- Explique de forma concisa y clara cuál es el problema y cómo puede solucionarse o completarse, de modo que el autor del documento pueda entenderlo.
- Formato: [^___###__]: Redacción original → mejora recomendada.
- Especifique si necesita mejorar el tono y las formas de la documentación, su adecuación al propósito, su fluidez lógica, etc.
3. Ideas generales de mejora de la fluidez/lógica del documento
- Además de la gramática y el vocabulario, si tiene sugerencias para mejorar la estructura general, como la alineación de títulos y subtítulos, el orden de los párrafos, cómo se extraen las conclusiones o las partes que faltan en el contexto, coméntelo y explíquelas también.
- Si hay alguna parte del texto que el usuario no haya completado, por favor, sugiérelo en los comentarios.
4. Notas adicionales
- Si hay expresiones redundantes o prolijas en el contenido, sugiera su simplificación.
- No omitas colocar en el resultado final las palabras que han sido marcadas por los criterios de revisión.
Formato de salida:
- Solo genera plain text.
- Evitar utilizar "```".
- No dupliques los comentarios de las notas a pie de página.
- Escriba todo el comentario (texto marcado por la revisión + explicación del comentario en notas a pie de página). Siempre muestra los comentarios al final del texto original. Muéstrelos como notas a pie de página una vez finalizado el texto original. La estructura es la siguiente:
(texto completo + [^código del comentario] insertado)
[^____###__]: (redacción problemática) → (sugerencia de mejora)
[^____###__]: ...
Nota importante: Añada siempre los comentarios en la sección de notas a pie de página, al final del texto completo. Nunca deben aparecer antes del final del texto.
Tu objetivo es que el texto sea lo mejor posible. Añade las mejoras que necesites, pero si ya es lo mejor que puede ser sin ninguna mejora, no necesitas anotarlo.
(Ejemplo:
Texto anotado:
"Esta frase es torpe [^____###__] y repetitiva [^____###__]".
Explicación:
[^____###__]: "Esta frase es torpe" → "Esta frase no es legible", etc.
[^____###__]: "Repetitivo" → Recomendar eliminar la redundancia o utilizar un vocabulario diferente.
- En el caso de que para un término la sugerencia necesite una explicación más amplia, en cuanto a redacción o razón por la cual se hace la mejora, se puede incluir después de la sugerencia de mejora.
- Asegúrate de colocar en las notas de pie de página TODAS los textos identificados.
</directrices_para_anotar_y_comentar>
Por favor, siga las instrucciones anteriores para revisar el texto dado, anotar las mejoras y proporcionar explicaciones.
Con estas modificaciones, la calidad del sistema de revisión mejoró notablemente. El agente ahora era capaz de identificar correctamente todos los términos problemáticos y presentar los comentarios apropiadamente en las notas al pie de página.
Optimización del Procesamiento de Información Combinando Prompts en MAIDEPOT
Además, para optimizar el procesamiento de documentos extensos, utilizamos la herramienta Mashup de MAIDEPOT que combina varios prompts en un solo proceso. Esto incluyó:
- Un prompt para dividir documentos grandes en segmentos de 1,000 palabras, lo que ayuda a facilitar la revisión.
- Un prompt para mejorar el formato de documentos escritos en dos columnas, asegurando que el texto se presentara de forma clara y sin fragmentos mal cortados.
- Nuevamente el prompt que divide el texto en segmentos de 1,000 palabras.
- Por último, nuestro prompt de revisión profesional de documentos con todas las especificaciones que mencionamos anteriormente.
Conclusiones
El resultado de todo este proceso es un agente de IA que puede revisar documentos eficientemente, identificando las correcciones necesarias en minutos, ahorrando tiempo y reduciendo el riesgo de errores humanos, asegurando una calidad profesional de revisión.
En conclusión, la creación de nuestro revisor profesional de documentos en español incluyó múltiples iteraciones y ajustes. Cada cambio se basó en una evaluación crítica del rendimiento del modelo y en aclarar los objetivos. Ahora, gracias a esta serie de mejoras en los prompts y la utilización de herramientas adecuadas, hemos creado un agente de IA funcional que proporciona una revisión precisa y eficiente de documentos en español. Esta solución demuestra que, en la inteligencia artificial, el proceso de refinamiento y la adaptabilidad son fundamentales para lograr una solución efectiva.
Esperamos que este artículo te haya proporcionado una visión clara de cómo crear y utilizar prompts para revisión de documentos de forma eficiente y asegurando una alta calidad. ¡Anímate a probar estas técnicas y mejora tus procesos de revisión con la ayuda de la IA!
Aquí te dejo la solución descrita en este artículo para que puedas probar su calidad.
https://maidepot.com/es/prompts/rwHSXCezFQfR5WynVllQ
¡Te esperamos en un próximo blog! Coméntanos qué tal te pareció esta solución de Inteligencia Artificial.
Leave a Reply