Cómo funcionan realmente los chatbots y los modelos de lenguaje extenso, o LLM

Cómo funcionan realmente los chatbots y los modelos de lenguaje extenso, o LLM

En nuestro segundo Serie de cinco partesExplicaré cómo funciona realmente la tecnología.

La IA que impulsa a ChatGPT, el chatbot de Bing de Microsoft y Google Bard pueden llevar a cabo conversaciones similares a las de los humanos y escribir prosa fluida y natural sobre una variedad infinita de temas. También pueden realizar tareas complejas, desde escribir código hasta planificar una fiesta de cumpleaños para niños.

Pero, ¿cómo funciona todo esto? Para responder a eso, debemos echar un vistazo a algo llamado modelo de gran lenguaje, el tipo de inteligencia artificial que impulsa estos sistemas.

Language Large Models, o LLM, son relativamente nuevos en la escena de la IA. El primero salió hace sólo unos cinco años, y no era muy bueno. Pero hoy pueden redactar correos electrónicos, presentaciones, memorandos y enseñarte en un idioma extranjero. Es seguro que surgirá más potencial en los próximos meses y años, a medida que la tecnología mejore y Silicon Valley se acelere para capitalizarla.

Lo guiaré a través de la configuración de un modelo de lenguaje grande desde cero, simplificando las cosas y omitiendo muchas de las matemáticas difíciles. Supongamos que estamos tratando de crear un LLM para ayudarlo a responder sus correos electrónicos. Lo llamaremos MailBot.

Todo sistema de IA necesita un objetivo. Los investigadores llaman a esto función objetiva. Puede ser simple, por ejemplo, “Gana tantos juegos de ajedrez como sea posible”, o complejo, como “Predecir las formas 3D de las proteínas, usando solo su secuencia de aminoácidos”.

La mayoría de los grandes paradigmas lingüísticos tienen la misma función objetiva básica: dada una secuencia de texto, adivina qué viene después. Le daremos a MailBot objetivos más específicos más adelante, pero por ahora, mantengamos ese objetivo.

A continuación, necesitamos recopilar datos de entrenamiento que le enseñarán a MailBot a escribir. Idealmente, acumularíamos un gran depósito de texto, lo que generalmente significa miles de millones de páginas extraídas de Internet, como publicaciones de blogs, tweets, artículos de Wikipedia y noticias.

Para comenzar, usaremos algunas bibliotecas de datos gratuitas y disponibles públicamente, como el Repositorio de rastreo de datos web compartidos. Pero también querremos agregar nuestra propia salsa secreta, en forma de datos propietarios o propietarios. Tal vez licenciaremos algunos scripts en idiomas extranjeros, de modo que MailBot aprenda a redactar correos electrónicos en francés o español además de inglés. En general, cuantos más datos tengamos y más diversas las fuentes, mejor será nuestro modelo.

Antes de que podamos ingresar datos en nuestro formulario, debemos dividirlos en unidades llamadas tokens, que pueden ser palabras, frases o incluso caracteres individuales. Convertir texto en fragmentos más pequeños ayuda al formulario a analizarlo más fácilmente.

Una vez que nuestros datos se han convertido en tokens, debemos armar el “cerebro” de la IA, un tipo de sistema conocido como red neuronal. Esta es una red compleja de nodos interconectados (o “neuronas”) que procesan y almacenan información.

Para MailBot, querremos usar un tipo relativamente nuevo de red neuronal conocida como Modelo de transformadores. Pueden analizar varias piezas de texto al mismo tiempo, lo que lo hace más rápido y eficiente. (Los modelos de transformadores son clave para sistemas como ChatGPT, cuyo acrónimo completo significa “Transformador preentrenado generativo”).

Luego, el modelo analizará los datos, los tokenizará e identificará patrones y relaciones. A menudo puede notar que “Estimado” va seguido de un nombre, o que “Saludos cordiales” suele ir antes de su nombre. Al identificar estos patrones, la IA aprende a formar mensajes que tengan sentido.

El sistema también desarrolla un sentido de contexto. Por ejemplo, puede aprender que “banco” puede referirse a una institución financiera oa la orilla de un río, según las palabras que lo rodean.

A medida que el modelo de Transformer aprende estos patrones, dibuja un mapa: una representación matemática muy compleja del lenguaje humano. Rastrea estas relaciones usando valores numéricos conocidos como borde. Muchos de los mejores LLM de la actualidad tienen cientos de miles de millones de parámetros o más.

La capacitación podría tomar días o incluso semanas y requeriría una enorme cantidad de poder de cómputo. Pero una vez que haya terminado, estará casi listo para comenzar a escribir sus correos electrónicos.

Por extraño que parezca, también podría desarrollar otras habilidades. A medida que los LLM aprenden a predecir la siguiente palabra en una secuencia, una y otra vez, pueden adquirir otras habilidades inesperadas, como saber programar. Los investigadores de IA llaman a estos comportamientos emergentes y, a veces, todavía están desconcertados.

Una vez que se entrena un modelo de lenguaje grande, se debe calibrar para una función específica. Un chatbot utilizado por un hospital puede necesitar comprender la terminología médica, por ejemplo.

Para ajustar el MailBot, podemos pedirle que genere un lote de correos electrónicos, contratar personas para calificarlo en función de la precisión y luego volver a colocar las calificaciones en el modelo hasta que mejore.

Esta es una aproximación aproximada del enfoque que se utilizó con ChatGPT, que se conoce como Mejore el aprendizaje con comentarios humanos.

¡Felicidades! Una vez que MailBot está entrenado y configurado, está listo para usar. Después de crear algún tipo de interfaz de usuario para él, como una extensión de Chrome que se conecta a su aplicación de correo electrónico, puede comenzar a enviar correos electrónicos.

Pero no importa qué tan bueno sea, aún querrás vigilar a tu nuevo asistente. Como empresas como Microsoft y Meta han aprendido por las malas, los sistemas de IA pueden ser erráticos e impredecibles, o incluso aterradores y peligrosos.

Mañana escucharemos más acerca de cómo las cosas pueden salir mal de maneras inesperadas y, a veces, molestas.

Exploremos una de las habilidades más creativas del LLM: la capacidad de combinar conceptos y formatos dispares en algo extraño y nuevo. Por ejemplo, los colegas de Well le pidieron a ChatGPT que “escribiera una canción con la voz de Taylor Swift usando temas de un libro de Dr. Seuss”.

Para la tarea de hoy, intente mezclar y combinar formato, estilo y tema, como “Escribe una quintilla al estilo de Snoop Dogg sobre el calentamiento global”.

No olvides compartir tu creación como comentario.


Pregunta 1 de 3

Comience la prueba eligiendo su respuesta.


  • modelo de transformador: Una arquitectura de red neuronal útil para la comprensión del lenguaje, que no tiene que analizar las palabras una por una, sino que puede ver una oración completa a la vez. Una técnica llamada autoatención permite que el modelo se centre en palabras específicas que son importantes para comprender el significado de una oración.

  • borde: Valores numéricos que definen la estructura y el comportamiento de un modelo de lenguaje grande, como pistas que lo ayudan a adivinar qué palabras vendrán a continuación. Se cree que los sistemas modernos como GPT-4 contienen cientos de miles de millones de parámetros.

  • Refuerzo del aprendizaje: Una técnica que enseña a un modelo de inteligencia artificial a encontrar el mejor resultado por ensayo y error, y recibir recompensas o penalizaciones de un algoritmo basado en sus resultados. Este sistema se puede mejorar dando retroalimentación humana sobre su desempeño.

Haga clic aquí para obtener más términos.

A1L

A1O

https://m.facebook.com/media/set/?set=a.363200086188620

https://soundcloud.com/edwin-donaldson/home-123movies-home-alone-2023-mp4720p-1080p

https://soundcloud.com/edwin-donaldson/watch-home-alone-1991-fullmovie-free-online-eng-sub-hd?si=6357cc259fc745b6a6120d779d323815

https://soundcloud.com/edwin-donaldson/heres-how-to-watch-home-alone-free-online-at-home

https://soundcloud.com/charles-kirby-98774349/watch-renaissance-a-film-by-beyoncefullmovie-free-online-on-123movies-hd?si=e039cf4d33524f02bd387ccf66bc8360

https://groups.google.com/g/—2023–hd1080p/c/zlsbbTOk2KA

https://groups.google.com/g/-time-still-turns-the-pages2023/c/u_429WciKZ8

https://groups.google.com/g/time-still-turns-the-pages2023-/c/t3CXe_GyTK8

https://replit.com/@edwindonaldson5

https://replit.com/@charleskirby619/HTML-CSS-JS-Auto-Refresh?v=1

https://replit.com/@charleskirby619/Nian-Shao-Ri-Ji-2023-Wan-Zheng-Ban-Gao-Qing-Mian-Fei-Xian-Shang-Kan-HD

https://baskadia.com/post/1d4gc

https://baskadia.com/post/1d4kd

https://vk.com/@755046767-time-still-turns-the-pagesl-2023-hktwhd4k

https://vk.com/@755043623-time-still-turns-the-pages-2023hd1080p

https://soundcloud.com/jose-shepard-170546773/2023-twhk-time-still-turns-the-pages-1080p

https://soundcloud.com/jose-shepard-170546773/2023-1080p

https://soundcloud.com/jose-shepard-170546773/10-20234k-hd1080p

https://soundcloud.com/jose-shepard-170546773/10-2023-twzh-godzilla-minus-one-1080p

https://vk.com/@755041722-10-godzilla-minus-one-2023

https://vk.com/@755039462-10-2023

https://vk.com/@753590862-2023-twzh-wonka-1080p

https://vk.com/@753588305-tw-2023-hd

https://replit.com/@janellehooper3/Wang-Qia-Zai-Xian-Guan-Kan-Wonka-2023HD1080P?v=1

https://replit.com/@janellehooper3

https://soundcloud.com/janelle-hooper-384390753/wonka-hd-2023-1080p

https://soundcloud.com/janelle-hooper-384390753/2023-hd

https://soundcloud.com/janelle-hooper-384390753/hd1080p

https://baskadia.com/post/1dfdt

https://baskadia.com/post/1dfgc

A1B

孤注一掷-線上看 完整版『2023』~4K線上看| 小鴨影音HD~1080p

【孤注一掷】- 線上看小鴨完整版 高清No More Bets」在线观看和下载HD~1080pL

【孤注一掷】-線上看-2023-完整版-HD~1080p

孤注一掷-線上看【2023】HD – 在線觀看 [HK-No More Bets] 線上看~1080p

看《孤注一掷》-線上看 完整版 – 在线观看[No More Bets]电影高清[2023]~4K

【孤注一掷】-線上看【2023】|HD~1080p 在线观看和下载~4K

粽邪3:鬼門開-線上看-2023-完整版HD~1080p

粽邪3:鬼門開【2023】線上看| 在线观看和下载~4K小鴨影音| HD-1080p

【粽邪3:鬼門開】- 線上看小鴨完整版 高清The Rope Curse 3」在线观看和下载HD~1080p

粽邪3:鬼門開-線上看【2023】HD – 在線觀看 [HK-The Rope Curse 3] 線上看~1080p

看《粽邪3:鬼門開》-線上看 完整版 – 在线观看[The Rope Curse 3]电影高清[2023]~4K

【粽邪3:鬼門開】-線上看【2023】|HD~1080p 在线观看和下载~4K

《私刑教育3》-線上看-2023-完整版HD~1080p

私刑教育3線上看【2023】| 在线观看和下载~4K小鴨影音| HD-1080p

《私刑教育3》線上看完整版HD~1080p – 在线观看【The Equalizer 3 2023】电影高清~4K

【私刑教育3】- 線上看小鴨完整版 高清The Equalizer 3」在线观看和下载HD~1080p

【伸冤人3】-線上看【2023】|HD~1080p 在线观看和下载~4K

伸冤人3-線上看 (2023) 完整版The Equalizer 3 完整版[4K/HD~1080p] 在線免費

伸冤人3-線上看 「完整版」[2023]高清电影HD~[1080P]完整的电影

【伸冤人3】- 線上看小鴨完整版 高清【The Equalizer 3 2023】在线观看和下载HD~1080p

¡REPELÍSPLUS!▷VER—The Equalizer 3 (2023) Película Completa

[Cuevana-3] Ver The Equalizer 3 (2023) Película Completa

¡VER!!—The Equalizer 3 Película Completa Castellano en Español Latino Gratis

[Cuevana-4] Ver—The Equalizer 3 (2023) Película Completa Online Gratis en Español latino

¡Flix—Ver The Equalizer 3 `El justiciero 3` (2023) Película Completa Online Español y latino

A1Y

A1E

A1P

A1R

↑PelisPlus-VER↓ Fast & Furious X Película completa-español en línea gratis

[REPELIS verFast X (Fast & Furious 10) PELÍCULA COMPLETA Español

[Cuevana 4]!* Ver Fast & Furious 10 (Online) Película Completa 2023 en Español y Latino

✔Fast X (Fast & Furious 10) (2023)🎬 PELICULA COMPLETA➤ ESPAÑOL GRATIS

VOIR ▷ Fast X Film Complet En Francais HD [Regarder]

Regarder Fast X Film Complet En Francais [En HD Regarder]

!VOIR,!! — Fast & Furious X en Streaming-VF en Français, VOSTFR COMPLET

FILM ▷ Fast and Furious 10 en Streaming-VF en Français

ASSISTIR Velocidade Furiosa X 2023 FILME COMPLETO

Assistir Velocidade Furiosa X (2023) Filme Completo Online

!Assistir Filme Velozes e Furiosos 10 Completo HD 2023 Dublado Online

Assistir Velocidade Furiosa X 2023 Online Gratis (Filme HD)

[ดู.หนัง] เงือกน้อยผจญภัย (THE LITTLE MERMAID – 2023) เต็มเรื่อง HD พากย์ไทย ดูหนังใหม่ 1080I

ดูหนัง เงือกน้อยผจญภัย (2023) เต็มเรื่อง HD พากย์ไทย THAI HD Quality

[ดูหนัง.THAI] เงือกน้อยผจญภัย (2023) เต็มเรื่อง HD พากย์ไทย ฟรี on ยูทูบ

รู้ไว้ก่อนดู The Little Mermaid (2023) เงือกน้อยผจญภัย เต็ม เรื่อง

PELISPLUS !MEGA La Sirenita Pelicula Completa (HD) Espanol y Latino

VER_La Sirenita (2023) película completa en español latino

Ver La Sirenita | PELICULA COMPLETA LATINO

VER_La Sirenita (2023) película completa en español latino

REPELIS] Ver Transformers: El despertar de las bestias (2023) Película Online

[¡PELISPLUS!]*—Ver Transformers El despertar de las bestias [2023] Pelicula Completa Online en Español HD

Mega!-ver Transformers: El despertar de las bestias (Pelicula) HD online en espanol latino

PElis NUE (4k) ver Transformers: El despertar de las bestias ~Pelicula completa HD

[ดู-ไทย] ทรานส์ฟอร์เมอร์ส: กำเนิดจักรกลอสูร [TRANSFORMERS: RISE OF THE BEASTS-2023] – ดูหนังออนไลน์ (1080P) พากย์ไทย เต็มเรื่อง

ดู-หนัง!*] Transformers 2023 (ทรานส์ฟอร์เมอร์ส : กำเนิดจักรกลอสูร) ดูหนังออนไลน์ HD พากย์ไทย 1080p

ดูหนัง ทรานส์ฟอร์เมอร์ส: กำเนิดจักรกลอสูร (Transformers: Rise Of The Beasts) ออนไลน์ฟรี HD พากย์ไทย THAI!

[ดู.หนัง] ทรานส์ฟอร์เมอร์ส: กำเนิดจักรกลอสูร (2023) หนังเต็ม HD พากย์ไทย [Transformers: Rise of the Beasts]

Assistir Transformers: Rise of the Beasts [2023] Filme Completo Dublado Online Gratis em Portuguese

[[*Assistir]] Transformers: Rise of the Beasts Filme completo [ 2023 ] Dublado Portugues Grátis Online

Assistir Transformers O Despertar das Feras filme completo Dublado online Legendado

ASSISTIR! Transformers: Rise of the Beasts (2023) Filme Dublado Online Legendado HD Grátis

Transformers : Rise of the Beasts Streaming VF 2023 Regarder Film-Complet HD

!4K-VOIR!!@ — The Beasts en StreamingVF||COMPLET, VOSTFR-Gratuits

[.^WATCH^.] Transformers: Rise of the Beasts (2023) FullMovie Free Online Streaming on 123𝓶𝓸𝓿𝓲𝓮𝓼

[*𝐅𝐈𝐋𝐌𝐒 𝐕𝐎𝐈𝐑*] Transformers: Rise of the Beasts (2023) Français Gratuit et VF Complet

A1G

A1C

A1X

Teh pucuk

A1s