15 feb7 Min. de lectura

ChatGPT vs. Gemini de Google

Duelo de IA: ChatGPT vs. Gemini de Google – ¿Cuál Domina el Escenario?

Este mes, Google presentó su último esfuerzo por destronar a ChatGPT de la posición que ha mantenido desde su lanzamiento como el rey de los chatbots de IA generativa.

Bard – ahora renombrado como Gemini – se lanzó a principios de 2023 siguiendo la innovadora interfaz de chat impulsada por LLM de OpenAI. Y, para ser sinceros, a menudo ha parecido que ha estado tratando de ponerse al día.

Desde el primer día, Bard fue capaz de acceder a internet gracias a su integración con la tecnología de búsqueda de Google. Mientras tanto, la versión de lanzamiento de ChatGPT estaba limitada al conocimiento que se le había proporcionado durante su entrenamiento.

Pero OpenAI pronto agregó conectividad y la capacidad de acceder a información externa a ChatGPT a través de una conexión con Bing de Microsoft. Y dejando de lado la conectividad, el consenso general siempre ha tendido a ser que ChatGPT es simplemente más útil para una gama más amplia de tareas de procesamiento de lenguaje.

Ahora, Google está haciendo todo lo posible, renombrando Bard con el nombre del modelo de lenguaje que realiza el trabajo entre bastidores, y permitiendo el acceso a su servicio Avanzado mediante suscripción, con un precio competitivo frente a ChatGPT.

Entonces, ¿está listo para entrar al ring e ir mano a mano con el campeón indiscutible?

Aquí daré un resumen de ambas plataformas, destacando las diferencias que querrás conocer si estás decidiendo cuál usar.

Duelo de IA: ChatGPT vs. Gemini de Google – ¿Cuál Domina el Escenario?
Los Modelos de Lenguaje
- ¿Ganador?
Recuperación de Información
- ¡Empate!
Capacidades Multi-Modales
- ¿Ganador?
Entonces, ¿Cuál Es El Mejor, Chat GPT o Gemini Ultra?
Fuentes utilizadas para este articulo

Los Modelos de Lenguaje

Es importante señalar que tanto Gemini como ChatGPT se basan en modelos de lenguaje grandes (LLM) increíblemente vastos y poderosos, mucho más avanzados que cualquier cosa disponible públicamente en el pasado.

Recuerda, ChatGPT es solo la interfaz a través de la cual los usuarios se comunican con el modelo de lenguaje – GPT-4 (usuarios de pago de ChatGPT Pro) o GPT-3.5 (usuarios gratuitos).

En el caso de Google, la interfaz se llama Gemini (anteriormente Bard), y se utiliza para comunicarse con el modelo de lenguaje, que es una entidad separada pero también se llama Gemini (o Gemini Ultra si pagas por el servicio Avanzado de Gemini).

Algo importante a considerar es que, aunque los llamamos ambos chatbots, la experiencia de usuario intencionada es ligeramente diferente. ChatGPT está diseñado para habilitar conversaciones y ayudar a resolver problemas de manera conversacional, como si estuvieras charlando con un experto en un tema.

Gemini, por otro lado, parece diseñado para procesar información y automatizar tareas de manera que ahorre tiempo y esfuerzo al usuario.

Desde una perspectiva técnica, la potencia de los modelos LLM a menudo se mide por el número de parámetros (valores entrenables) dentro de la red neuronal. Se ha informado que las redes de GPT-4 contienen alrededor de un billón de parámetros, pero no se conocen hechos sólidos sobre el número de parámetros utilizados por Gemini.

Esto podría no ser importante, sin embargo, ya que podría ser suficiente con saber que ambos son muy, muy poderosos.

Un profesor de IA de la Universidad Estatal de Arizona, Subbarao Kambhampati, recientemente le dijo a Wired, “Hemos llegado básicamente a un punto donde la mayoría de los LLM son indistinguibles en métricas cualitativas”.

En otras palabras, el tamaño técnico y la potencia del modelo no es lo que importa, sino cómo ha sido ajustado, entrenado y presentado para ayudar a los usuarios a resolver problemas lo que realmente cuenta.

¿Ganador?

Después de usar ambos durante un tiempo para sostener diversas conversaciones sobre diferentes temas, me parece claro que ChatGPT sigue siendo la interfaz de chat más poderosa, gracias a la fuerza proporcionada por GPT-4. ¡Aunque Gemini está cerrando la brecha!

Recuperación de Información

Una ventaja de Gemini es que, por defecto, considera toda la información a su alcance, incluyendo internet, el vasto grafo de conocimiento de Google y sus datos de entrenamiento.

ChatGPT, por otro lado, a menudo todavía opta por tratar de responder una pregunta confiando únicamente en sus datos de entrenamiento. Esto puede llevar ocasionalmente a información desactualizada. Sin embargo, puedes sortear esto instándolo a buscar en la web para obtener los datos más recientes y actualizados. Pero esto sigue introduciendo un paso extra que Gemini ha demostrado que no es realmente necesario.

En mi experiencia usando ambas plataformas, tendría que decir que Gemini demuestra ser ligeramente más hábil que ChatGPT cuando se trata de buscar en línea e integrar la información que encuentra en sus respuestas.

Cuando ChatGPT se dirige en línea y busca información, sus respuestas tienden a perder algo de su dinamismo. A menudo parece como si fuera a responder preguntas o proporcionar respuestas basadas en una única búsqueda web y una única fuente de información en lugar de realizar un análisis exhaustivo de toda la información a la que puede acceder y llegar a una conclusión.

Aquí hay un rápido ejemplo de lo que esto significa. A menudo uso chatbots de IA para darme una visión general rápida de una empresa o sus productos o servicios. Usando el mismo prompt (“cuéntame sobre [URL]”), ChatGPT a menudo simplemente regurgita un discurso de marketing del sitio web.

En el breve tiempo que he tenido para probarlo, Gemini parece tomar un enfoque más matizado. Resume la información que puede encontrar mientras intenta generar una visión equilibrada de las características.

Por lo tanto, diría que esta es un área donde Gemini supera ligeramente a su rival.

Pero eso está lejos de ser el final de la historia. Cuando se trata de interpretar inteligentemente la información con la que ha sido entrenado para formular una respuesta, ChatGPT sigue saliendo como el ganador.

¡Empate!

Vamos a llamar a esto un empate, con Gemini siendo mejor cuando se trata de formular respuestas a partir de texto en línea y ChatGPT siendo mejor en consultas sin internet.

GPT Vs Gemini: Capacidades Multi-Modales

Las IA multimodales son aquellas que son capaces de procesar más de un tipo de datos. Las versiones tempranas de ChatGPT solo leían y generaban texto. Pero desde que OpenAI actualizó su "motor" a GPT-4, ganó la capacidad de procesar datos visuales y auditivos, haciéndolo multimodal. Gemini, por otro lado, fue multimodal desde el principio (aunque no todas sus características se activaron inmediatamente).

ChatGPT genera imágenes usando el modelo DALL-E, que también fue desarrollado por OpenAI. Gemini, por otro lado, utiliza el motor Imagen 2 de Google. Ambos son claramente muy poderosos y pueden generar resultados asombrosos.

Sin embargo, diría que ChatGPT es más consistente cuando se trata de crear una imagen que se ajuste estrechamente a lo que estaba buscando cuando los comparamos en base al mismo prompt.

Una diferencia que otros han señalado es que Imagen 2 y Gemini son ligeramente mejores en la producción de imágenes fotorrealistas, muy detalladas. ChatGPT, por otro lado, sobresale cuando se trata de gestionar las relaciones espaciales entre objetos en sus imágenes, y es mejor interpretando creativamente los prompts.

Ambos también son capaces de entender y escribir código informático en una amplia gama de lenguajes de programación. Hay pequeñas diferencias en cómo lo hacen, sin embargo.

No hay duda de que las superiores habilidades conversacionales de ChatGPT le otorgan algunas ventajas significativas aquí. Si no estás del todo seguro de qué debería hacer tu código o sobre la mejor manera de integrarlo, es mejor cuando se trata de generar orientación clara y útil y ofrecer sugerencias y consejos.

¿Ganador?

Voy a darle este a ChatGPT nuevamente. Mientras que Gemini crea mejores imágenes fotorrealistas, ChatGPT gana cuando se trata de generar imágenes que se ajustan estrechamente a lo que el usuario está pidiendo con su prompt. Gemini parece ser ligeramente mejor en la creación de código técnico, pero no puede igualar a ChatGPT como una interfaz conversacional para usar mientras se construye y experimenta.

(Nota rápida: la generación de imágenes de Gemini aún no se ha lanzado para los usuarios en Europa; esperemos que se agregue pronto.)

Entonces, ¿Cuál Es El Mejor, Chat GPT o Gemini Ultra?

Bueno, ninguno es perfecto por ningún medio. Ambos todavía sufren de alucinaciones y proporcionarán, bastante frecuentemente, información que simplemente es incorrecta. Por ejemplo, Gemini me dijo que Dall-E 2 de OpenAI no utiliza tecnología de modelo de difusión (lo hace). Y ChatGPT me dijo que Gemini no es capaz de generar imágenes (lo es).

Pero por mi dinero, si solo vas a suscribirte a uno, estaría inclinado a optar por ChatGPT Pro en este momento.

Hay algunas advertencias: si estás muy integrado en el ecosistema de Google, entonces la capacidad de Gemini para interactuar con Gmail y Google Docs probablemente será una gran atracción para ti. De manera similar, si eres un programador experimentado y tu necesidad principal es la codificación, definitivamente echa un vistazo a Gemini (pero también echa un vistazo a Co-Pilot de Microsoft).

Para escribir y crear documentos, resumir, generación de imágenes de propósito general y aprender a través de conversaciones, diría que ChatGPT es mejor en este momento. Por esta razón, mantiene su lugar como el mejor que está disponible actualmente.

Fuentes utilizadas para este articulo

En TechRepublic, se discuten las opciones de API para ambos, destacando que Google anunció el acceso a Gemini Pro en diciembre de 2023, disponible a través de varias plataformas como Google AI Studio y Vertex AI. Este artículo también resalta las ventajas y desventajas de cada uno, mencionando que Gemini está disponible en tres tamaños y diseñado para ser multimodal, mientras que ChatGPT es ampliamente utilizado y ofrece acceso API a varios modelos.

Tech co señala que Google planea implementar Gemini en más productos a lo largo de 2024, abarcando áreas como búsqueda, anuncios, Chrome y Duet AI. Aunque Gemini Ultra se promociona como superior a ChatGPT en muchas categorías, esta versión no estará disponible hasta algún momento en 2024. La comparación actual entre Gemini Pro y la versión gratuita de ChatGPT, GPT-3.5, no ha impresionado mucho a los usuarios según los informes iniciales.

Mockey ai ofrece una comparación detallada entre Gemini y ChatGPT, destacando que Gemini Pro superó a GPT-3.5 en pruebas de referencia, y se espera que Gemini Ultra supere a los modelos avanzados de GPT-4 en 30 de 32 pruebas, incluyendo reconocimiento de imágenes y razonamiento. Este artículo también menciona las ventajas de Gemini en términos de velocidad, capacidades multimodales y aprendizaje en tiempo real, sugiriendo que Gemini podría ser una herramienta mejor que ChatGPT para ciertas aplicaciones.

ChatGPT vs. Gemini de Google

Duelo de IA: ChatGPT vs. Gemini de Google – ¿Cuál Domina el Escenario?

Los Modelos de Lenguaje

¿Ganador?

Recuperación de Información

¡Empate!

GPT Vs Gemini: Capacidades Multi-Modales

¿Ganador?

Entonces, ¿Cuál Es El Mejor, Chat GPT o Gemini Ultra?

Fuentes utilizadas para este articulo

Entradas Recientes

Comments