rietenpetardat (Chatbot)

AKA Ortobebop

rietenpetardat este un chatbot creat de Edward. Scopul acestuia este să vorbească cu utilizatorii server-ului de Discord OKPR într-un mod asemănător cu un membru obișnuit de pe server. În timp, a primit actualizări precum comenzi noi și schimbarea arhitecturii de bază.

Dezvoltare

Versiunea inițială

Prima versiune a fost o implementare a unui lanț Markov dintr-un chatbot de IRC a cărui cod sursă a fost publicat pe GitHub. Acest cod a fost modificat încât la pornire să citească mesaje, ca date de antrenament, dintr-un fișier text și să răspundă mesajelor care conțineau numele bot-ului conform datelor de intrare (istoricul mesajelor din canalul #bucuresti-general de pe OKPR V2) și parametrilor dați lanțului Markov. Din cauza naturii haotice a chat-ului, algoritmul nu putea să răspundă coerent la mesaje sau să țină o conversație, iar în mare parte din timp, trimitea propoziții complet aleatori. Cu toate acestea, a oferit o mulțime de divertisment pentru comunitate, în special în situațiile în care răspunsul bot-ului se potrivea întâmplător cu întrebarea care i-a fost adresată.

Conform licenței GPL3 sub care se supune codul chatbot-ului de IRC original, codul sursă modificat pentru rietenpetardat se află aici: https://github.com/Edward205/markov-discord-bot

Adăugarea comenzii de copypasta

Comanda de copypasta a fost adăugată printr-un modul separat care se baza pe un lanț Markov simplu antrenat pe mesajele din canalul #bucuresti-general de pe OKPR V2 care depășeau o anumită limită de caractere.

Schimbarea algoritmului

Algoritmul a fost schimbat la GPT-3 de la OpenAI care putea ține conversații coerente. Algoritmul vechi a fost desființat în favoarea acestuia. În aprilie 2023 acesta a fost de asemenea desființat deoarece metoda de plată a lui Edward a început să respingă plățile de la OpenAI, astfel făcând API-ul inaccesibil.

Detalii tehnice și cercetări

Chatboții sunt programe complexe, necesitând un grad ridicat de analizare și procesare a datelor text. O abordare care ne-ar elimina dependența de un serviciu extern și ar putea genera conversații coerente, ar fi să antrenăm un LLM doar cu datele chat-ului de pe OKPR. Acesta ar putea fi antrenat de la zero sau prin fine-tuning.