Cómo Chatear por Voz con ChatGPT en Android 2023

Escrito por Harvey
Descubra el futuro de la IA con Harvey, experto en grandes modelos lingüísticos. Su blog ofrece una visión rápida de los últimos avances, haciendo accesibles temas complejos. Únete a la conversación, sigue a Harvey en las redes sociales y mantente a la vanguardia del dinámico mundo de la IA. Bienvenido al futuro, un post conciso cada vez.

En la actualidad, el campo de la inteligencia artificial continúa sobrepasando barreras, y su integración con los dispositivos móviles es una muestra clara de ello. Me he dado cuenta de que, aunque usar ChatGPT con Siri en un iPhone es bastante sencillo, conseguir que esta interacción funcione con Google Assistant en dispositivos Android requiere de un esfuerzo considerable. Afortunadamente, existen herramientas que hacen posible esta comunicación, permitiendo establecer diálogos por voz con ChatGPT mediante la API de GPT y soluciones adicionales como Elevenlabs.

tasker app

Estoy consciente de la importancia que tiene la inteligencia artificial en la educación y cómo su accesibilidad a través de múltiples idiomas puede ser un cambio significativo en la forma en que adquirimos conocimientos. Por eso, es relevante mencionar un tutorial detallado que descubrí, el cual facilita la interacción por voz con ChatGPT en teléfonos Android. Este proceso representa un avance notable, proporcionando una herramienta educativa más accesible y diversificada.

Paso 1: Obtención de Claves API de OpenAI y ElevenLabs

Para interactuar con ChatGPT en Android y obtener respuestas precisas, es esencial tener una clave API de OpenAI. Mi procedimiento para conseguirla es el siguiente:

  • Accedo a platform.openai.com/account/api-keys y selecciono «Crear nueva clave secreta«.
  • Asigno un nombre a dicha clave y confirmo la creación.
  • Copio la clave API de OpenAI y la guardo con seguridad para uso futuro.

En cuanto a ElevenLabs, que permite conversaciones más naturales mediante texto a voz, sigo estos pasos:

  • Creo una cuenta gratuita en su plataforma.
  • Ingreso a «Perfil» en la esquina superior derecha.
  • Revelo la clave API y la copio cuidadosamente, para luego guardarla para su empleo posterior.

Estos pasos me permiten equipar mi dispositivo Android con la capacidad de comunicarse efectivamente mediante los modelos de lenguaje avanzados, como GPT-3, GPT-3.5, GPT-4, y también Whisper, priorizando la precisión en cada prompt.

Paso 2: Configuración del Proyecto ChatGPT en Tasker

Para los usuarios de Android interesados en integrar ChatGPT a su dispositivo, un paso esencial es la instalación y configuración de Tasker. Esta aplicación de automatización no requiere de acceso root. Yo utilicé un OnePlus 7T con Android 12 sin necesidad de modificar el sistema.

Aquí los pasos a seguir:

  • Instalación: Dirígete a la tienda de aplicaciones y descarga Tasker. Este programa te permite automatizar tareas, similar a las «Shortcuts» en iOS.
  • Configuración inicial: Al abrir Tasker, selecciona “Tasker (The full experience!)”. Otorga los permisos necesarios y deshabilita la optimización de batería para asegurar su funcionamiento en segundo plano.
  • Importación del proyecto: Accede a un enlace específico para importar el proyecto de ChatGPT a Tasker. Al tocar “Importar”, la aplicación se abrirá automáticamente para que confirmes la acción.
  • Personalización: En la siguiente pantalla, puedes personalizar la interfaz de ChatGPT a tu gusto. Por defecto, yo mantuve las configuraciones originales.
  • API de OpenAI: Es el momento de introducir la clave API de OpenAI que obtuviste previamente. Si se cierra el diálogo, intenta importar de nuevo y sobrescribe las tareas existentes.
  • Activación: Finaliza el proceso dando tu consentimiento para importar y habilitar el perfil en Tasker. Tasker te podría ofrecer automáticamente la función adicional de un bot de WhatsApp, la cual es opcional.

Para utilizar la función del bot de WhatsApp es necesario instalar la aplicación AutoNotification. Yo obvié esta opción, pero podrás encontrar más detalles en un artículo dedicado a cómo usar ChatGPT en WhatsApp.

Paso 3: Integrar el Proyecto de Síntesis de Voz de ElevenLabs a Tasker

Para enriquecer Tasker con la capacidad de síntesis de voz, sigo estos pasos:

  • Accedo al enlace proporcionado y selecciono el botón de Importar. Luego confirmo la acción en la aplicación Tasker pulsando en «Sí».
  • Concedo los permisos solicitados y, al aparecer la ventana emergente, presiono «Sí» nuevamente.
  • A continuación, introduzco la clave API de ElevenLabs que guardé previamente.
  • Elijo entre las varias voces de asistente ofrecidas por ElevenLabs. Mantengo presionada cada voz para escuchar una muestra y seleccionar la que más me agrada.
  • Por último, escojo el idioma que deseo utilizar para mis interacciones de audio, teniendo la opción de escoger entre «Inglés» o «Varios idiomas», lo que me permite entablar una conversación casual en diversas lenguas, incluyendo el inglés.

Mi configuración está lista para interactuar mediante voz con ChatGPT en dispositivos Android.

Paso 4: Interacción por Voz con ChatGPT en Teléfonos Android

Para entablar una conversación por voz con ChatGPT en un dispositivo Android, inicio desde la pantalla principal manteniendo presionado en un espacio vacío, y luego selecciono «Widgets». Desplazo hacia abajo hasta la sección de «Tasker».

Mantengo presionado el icono de «Tarea» y lo ubico en la pantalla principal. Entonces, se muestra el menú de selección de tareas. Aquí escojo «Voice Chat ChatGPT Elevenlabs«. Al regresar, se guarda el widget.

Aparece un icono de «Chat de Voz ChatGPT» en mi pantalla principal. Al presionarlo, puedo iniciar una interacción directa con ChatGPT. En ocasiones, debido a la alta demanda en los servidores de OpenAI, podría experimentarse alguna tardanza en las respuestas.

Tras cada pregunta y su respuesta correspondiente, el diálogo de voz se muestra automáticamente, permitiéndome continuar la conversación sin necesidad de pulsar nuevamente el widget de «Chat de Voz». Es más, si hablo en otro idioma, como el español, la interacción se mantiene en ese mismo idioma.

Para ajustes adicionales, accedo a Tasker y navego hasta la pestaña de «Tareas». Desde aquí, puedo ejecutar tareas de forma individual pertenecientes a los dos proyectos importados. También es posible crear un acceso directo para el chat de texto siguiendo pasos similares.

Intenté utilizar ChatGPT con el Asistente de Google, pero hasta ahora no he tenido éxito en gatillar la tarea de forma automática. Cambiar el nombre de la tarea tampoco ha dado resultados. Continúo explorando posibilidades y actualizaré la guía si encuentro una solución.