Como subir un archivo PDF a un chat en GPT

Escrito por Harvey
Descubra el futuro de la IA con Harvey, experto en grandes modelos lingüísticos. Su blog ofrece una visión rápida de los últimos avances, haciendo accesibles temas complejos. Únete a la conversación, sigue a Harvey en las redes sociales y mantente a la vanguardia del dinámico mundo de la IA. Bienvenido al futuro, un post conciso cada vez.

Conforme OpenAI continúa innovando en el ámbito de la inteligencia artificial, ChatGPT ha emergido como una herramienta extraordinaria para la interacción y la realización de tareas diversas. Desde conversar sobre temas complejos hasta asistir en la productividad diaria, esta IA tipo chatbot se ha vuelto indispensable para muchos. Aunque actualmente ChatGPT posee características avanzadas, como la capacidad de navegar por la web, todavía no permite cargar documentos directamente para interactuar con su contenido.

upload pdf

Como especialista en esta área, he descubierto diversas soluciones para superar esta limitación. A lo largo de este artículo, describiré seis métodos eficaces para incorporar documentos en formatos como PDF, Word y Excel a ChatGPT. Esta guía está diseñada para facilitar a usuarios de cualquier nivel el aprovechamiento de las capacidades de ChatGPT, potenciando así su productividad a través de una interacción más profunda con la información contenida en sus archivos.

Cargar Archivos a ChatGPT Mediante Intérprete de Código

Para aquellos suscritos a ChatGPT Plus, utilizar el Intérprete de Código para subir archivos se ha hecho accesible. A medida que esta funcionalidad se incorpore progresivamente, los usuarios la recibirán en una o dos semanas. Los formatos que se pueden cargar incluyen audio, video, texto y múltiples formatos de documentos, entre otros.

He aquí los pasos a seguir para cargar un archivo:

  1. Accedo a ChatGPT y voy a la esquina inferior izquierda para entrar en “Configuración”.
  2. En “Funciones Beta”, activo el interruptor para “Intérprete de Código”.
  3. Luego, selecciono el modelo “GPT-4” y escojo “Intérprete de Código” en el menú desplegable.
  4. A continuación, aparece un botón de “+” abajo en el campo de texto. Hago clic allí para empezar a subir archivos directamente en ChatGPT.
  5. Por ejemplo, al subir un archivo PDF, puedo realizar OCR para hacerlo buscable dentro de ChatGPT.

Este método acepta diversos tipos de archivos, desde HTMLMDPY, hasta estilos como CSS, y formatos de datos como JSONTSXJSX, o incluso paquetes comprimidos como ZIP. La capacidad para «arrastrar y soltar» archivos o subirlos desde una URL facilita aún más el proceso, teniendo en cuenta que el tamaño del archivo cumple con las restricciones establecidas.

Carga de Documentos en ChatGPT Mediante una Extensión Gratuita

Descubrí una herramienta con la que es posible incorporar diversos tipos de archivos a ChatGPT. Su nombre es ChatGPT File Uploader Extended, una extensión gratuita de Chrome que admite formatos como TXT, JS, PY y muchos más, incluyendo archivos de Microsoft Office y PDF.

Pasos para utilizar la extensión:

  1. Instalar ChatGPT File Uploader Extended desde su fuente en línea. Funciona en cualquier navegador basado en Chromium, como Chrome o Microsoft Edge.
  2. Visitar la página de ChatGPT y localizarás un botón de “Carga” en la esquina inferior derecha.
  3. Al hacer clic en este botón, elegirás el documento que desees cargar. Es compatible con formatos comunes como PDF, DOCX, XLSX y TXT.
  4. Tras seleccionar el archivo, la extensión iniciará el procesamiento de forma automática.
  5. Una vez concluido, el bot de IA proporcionará un resumen del contenido del documento.
  6. A continuación, tienes la posibilidad de hacer preguntas al chatbot que responderá basándose en la información del documento agregado.
  7. Personalmente he cargado archivos de Word y Excel, así como documentos en PDF, todos procesados con éxito. Sin embargo, no puede procesar documentos con imágenes escaneadas.
  8. Además, al pulsar el icono de “Ajustes” junto al botón de carga, puedes modificar el tamaño de los fragmentos del documento, lo cual es útil para documentos más extensos. También ofrece opciones para personalizar los comandos y ajustes de archivos ZIP.

Cargar un Archivo PDF en ChatGPT Usando un Sitio Web Externo

He descubierto que chatpdf.com ofrece una facilidad notable para interactuar con archivos PDF a través de la API de ChatGPT. Lo que me fascina de este servicio es que, para su uso, no requiero proporcionar una clave API propia.

Los usuarios gratuitos disfrutan de la capacidad de cargar hasta 120 páginas por archivo PDF (10 MB o menos), limitando la carga a tres archivos PDF diarios. Además, es posible plantear hasta 50 preguntas cada día. Mientras tanto, la suscripción Plus, con un costo mensual de $5, me permite cargar documentos de hasta 2.000 páginas en este sitio web.

El uso de chatpdf.com es sencillo siguiendo estos pasos:

  1. Accedo a chatpdf.com y selecciono “Drop PDF here” para subir mi documento.
  2. También tengo la opción de cargar el PDF a través de un enlace utilizando el vínculo de «From URL».
  3. El sitio procesa el documento rápidamente dependiendo del tamaño del archivo.
  4. Primero me muestra un resumen y tres preguntas sugeridas. Aquí puedo formular mis propias consultas e interactuar directamente con el contenido del PDF.

Paralelamente, Microsoft ha integrado un poderoso complemento en su navegador denominado Discover o la barra lateral de Bing con tecnología ChatGPT en Microsoft Edge. Esta herramienta analiza los documentos sin necesidad de cargarlos. Es así cómo funciona:

  1. Abro Microsoft Edge y cargo el archivo PDF con “Ctrl + O”, incluso puedo abrir un documento de Microsoft Word, Excel, o un texto de Google Docs directamente en el navegador.
  2. Luego, hago clic en el botón de la barra lateral de Bing y comienzo a realizar preguntas.
  3. No solo puedo pedir resúmenes, sino que también realizar preguntas más elaboradas y obtener respuestas contextualizadas del documento activo en la pestaña.

Me parece importante mencionar que estos métodos de carga y análisis de documentos PDF se han vuelto herramientas confiables y de gran ayuda en mi trabajo diario, permitiéndome ahorrar tiempo y mejorar mi productividad al trabajar con textos y documentos diversos.

Analizar Documentos PDF o de Texto Usando Complementos de ChatGPT

Los complementos de ChatGPT han abierto nuevas posibilidades para estudiar y procesar documentos. Como suscriptor de ChatGPT Plus, la última versión del modelo GPT-4 se pone a disposición junto con estas herramientas. La funcionalidad permite analizar y trabajar con una variedad de formatos de documentos directamente desde la interfaz de ChatGPT.

Pasos para utilizar complementos con documentos:

  • Acceso a Complementos: Accedo a la página web de ChatGPT y activo los complementos siguiendo una guía específica.
  • Selección del Modelo: En la sección del modelo GPT-4, selecciono la opción «Complementos».
  • Tienda de Complementos: Navego al «Plugin store» y busco el complemento «AskYourPDF» o «Link Reader» e instalo el que se ajuste a mis necesidades.
  • Activación de Complementos: Una vez instalado «AskYourPDF», lo activo mediante el ícono de la flecha.
  • Carga de Documentos: Introduzco el enlace del documento en ChatGPT y puedo comenzar a hacer preguntas específicas.
  • Subida de Archivos Propios: Ejecuto un comando para obtener un enlace, permitiéndome subir archivos en formatos como PDF, DOCX, TXT, entre otros.
  • Identificación de Documentos: Luego de subir el archivo, recibo un ID de documento que uso para interactuar con ese documento específico en ChatGPT, facilitando así el análisis y generación de resúmenes precisos.

Formatos Soportados:

  • PDF
  • DOC
  • DOCX
  • TXT
  • PPT
  • PPTX
  • CSV
  • EPUB
  • RTF

Estos procesos habilitan la realización de resúmenes y análisis detallados de contenido, aprovechando las capacidades del modelo GPT-4 y la clave de API de OpenAI en una interfaz amigable e intuitiva.

Carga de Documentos en ChatGPT a Través de BookGPT

Descubrí un proyecto llamado BookGPT disponible en Hugging Face, ideal para cuando necesito subir un libro completo o un documento extenso. Lo genial de este proyecto es que aprovecha la API de ChatGPT para examinar el contenido del documento. Sin embargo, es necesario que proporcione mi clave API de OpenAI. Aquí te muestro cómo lo hago.

  • Conéctate a tu cuenta de OpenAI: En primer lugar, accedo a mi cuenta de OpenAI. Si aún no tengo una, creo una gratuitamente.
  • Genera tu clave secreta: Luego, genero una «nueva clave secreta» y copio la clave API. Si no tengo créditos API gratuitos disponibles, necesito registrar una tarjeta para continuar.
  • Utiliza el proyecto BookGPT: Posteriormente, ingreso a la página de BookGPT y pego mi clave API de OpenAI en la sección designada.
  • Sube tu PDF: Agrego la URL del documento PDF o subo el archivo PDF localmente a ChatGPT.
  • Haz preguntas sobre el contenido: Tras hacer clic en «Enviar», proceso el documento y en segundos recibo respuestas con citas por número de página.

Preguntas Comunes

  • ¿Se puede subir archivos a ChatGPT?Aunque OpenAI por sí solo no ofrece una opción nativa para subir archivos directamente en la interfaz de ChatGPT, gracias al soporte de Plugins, la clave API y servicios complementarios, definitivamente es posible.
  • ¿Es posible cargar un PDF en ChatGPT?Sí, cargar un archivo PDF en ChatGPT se logra a través de Plugins. Además, extensiones para navegador, la clave API y sitios web que integran la tecnología ChatGPT permiten hacerlo sin complicaciones.