14 marca OpenAI zaprezentowało nową wersję swojego produktu – Chat GPT-4. Od teraz chatbot rozumie nie tylko tekst, ale także potrafi interpretować zdjęcia czy dane. Do tego – jak przekonuje OpenAI – jest bardziej kreatywny, rzadziej zawodzi i może obsługiwać bardziej zniuansowane polecenia użytkowników. Po sześciu miesiącach intensywnych treningów nowy model osiąga wyraźnie lepsze wyniki od poprzedniego w tzw. masowym wielozadaniowym rozumieniu języka (z ang. „massive multitask language understanding”), a także potrafi zdać egzamin do amerykańskiej izby adwokackiej czy osiągnąć wynik na poziomie 10 proc. najlepszych uczniów w teście do szkół średnich. Minusy? Wciąż zmaga się z niektórymi bolączkami poprzednika – np. ma skłonność do „halucynacji”, czyli zmyślania odpowiedzi.
Chat GPT-4 jest dostępny wyłącznie dla subskrybentów ChatGPT Plus. Abonament kosztuje 20 dolarów miesięcznie.
Czym wyróżnia się Chat GPT na tle innych rozwiązań opartych na algorytmach sztucznej inteligencji? I dlaczego rozwój SI ma być przełomem na miarę wynalezienia elektryczności? O tych i innych sprawach rozmawiamy z Wojciechem Zarembą — polskim współtwórcą OpenAI.
FORBES: Firma analityczna CB Insights przygotowała ankietę, w której pyta, jak dużym przełomem technologicznym będzie generatywna sztuczna inteligencja. Są cztery odpowiedzi do wyboru: takim jak iPhone, jak internet, jak żadne z nich, nie wiem. Co byś wybrał?
Wojciech Zaremba: Biorąc pod uwagę, że sztuczna inteligencja ma szansę zmienić praktycznie każdy element naszego życia, porównałbym ją raczej do prądu. Zanim powstał, trudno było sobie wyobrazić, do czego może być używany. Niektórzy sądzili, że da się przy jego pomocy rozświetlić pomieszczenie, ale nikt nie przypuszczał, że przyczyni się do powstania radia czy komputera. A teraz prąd jest wokół nas. I podobnie będzie z AI.
Z AI czy z ChatGPT, za którym stoi twoja firma?
ChatGPT jest całkiem sensownym produktem, ale sporo mu jeszcze brakuje do ideału. To tylko demonstracja naszych możliwości. Próbka, która pokazuje, w jakim kierunku rozwija się technologia sztucznej inteligencji i do czego można ją wykorzystać. Widać chociażby to, że w ciągu kilku najbliższych lat mogłaby zrewolucjonizować edukację.
Już ją zmienia. ChatGPT zaczyna być wykorzystywany do chodzenia na skróty – do automatycznego odrabiania prac domowych i plagiatowania…
To tylko pokazuje, że nauka musi zostać przedefiniowana. Tak jak została zmieniona, gdy powstał kalkulator – dziś już nikt nie oczekuje, że uczniowie będą wykonywać w pamięci skomplikowane obliczenia. I tak jak zaczęliśmy odchodzić od skupiania się na zapamiętywaniu faktów, kiedy pojawiła się wyszukiwarka Google. Sztuczna inteligencja niesie ze sobą kolejną rewolucję, która zmieni wymagania wobec uczniów. Zmiana pójdzie w kierunku większej personalizacji nauki, ponieważ system, w którym trzydziestu uczniów z danej klasy uczy się tego samego, niezależnie od swoich zainteresowań, predyspozycji i tempa przyswajania wiedzy, nie jest zoptymalizowany pod dzieci. Potwierdzają to zresztą dane, z których wynika, że zindywidualizowana nauka przyczynia się do wzrostu ilorazu inteligencji. Nie mam wątpliwości, że AI pomoże w tym procesie.
Powiedziałeś, że ChatGPT to tylko demonstracja możliwości. Czemu ona ma służyć? Zderzeniu technologii z użytkownikami, przyciągnięciu do waszej spółki inwestorów?
Przede wszystkim uważamy, że skoro ludzie mają za jakiś czas korzystać ze sztucznej inteligencji na co dzień, warto, aby już teraz zaczęli się z nią zapoznawać. To, co pokazujemy, nie jest zupełną nowością, ponieważ już jakiś czas temu można to było wyczytać z naszych prac naukowych – choćby to, że modele OpenAI są w stanie przejść różnego rodzaju egzaminy matematyczne. Ale większość osób nie zagląda do tych publikacji. Chcieliśmy pokazać szerszemu społeczeństwu, na jakim etapie rozwoju jest ta technologia, jakie już teraz daje możliwości, jak wygląda interakcja z takim AI. Jednym z najważniejszych celów tej demonstracji było więc ukazanie ludziom pewnej perspektywy i umożliwienie im korzystania z tego rozwiązania – także po to, aby wciągnąć osoby takie jak ty czy moja mama w dyskusję na temat tego, jak AI powinna być używana. Aby uzyskać informację zwrotną od użytkowników. To jeden z kroków na drodze do naszego ostatecznego celu, jakim jest zbudowanie AGI (ang. General Artificial Intelligence – red.), czyli ogólnej sztucznej inteligencji, a następnie doprowadzenie do tego, aby jak najwięcej osób mogło korzystać z jej możliwości.
Jak zamierzacie zbudować AGI, skoro ChatGPT nie czerpie z aktualnych informacji, tylko z danych wygenerowanych do 2021 roku?
To tymczasowy problem techniczny. Nie widzę żadnych fundamentalnych powodów, dla których nie dałoby się go naprawić. W końcu naukowcy wymyślą, jak to rozwiązać.
Naukowcy czy wy?
Zakładam, że my. OpenAI.
Yann LeCun, jeden z ojców deep learningu i główny badacz AI w Mecie, powiedział, że ChatGPT nie jest wielce innowacyjny. Że techniki leżące u podstaw waszej technologii nie są prekursorskie. Że zaprezentowaliście ładnie wykonany produkt, ale tak naprawdę dziesiątki innych laboratoriów, nie tylko Mety i Google, pracują nad podobnymi rozwiązaniami. Ma rację?
Yann był moim promotorem na doktoracie i do pewnego stopnia się z nim zgadzam, choć użyłbym innych słów do opisu tego, co dzieje się w przestrzeni AI. Obecną sytuację porównałbym do branży motoryzacyjnej. Samochody wymyślono już ponad sto lat temu, ale dzisiejsze auta i pierwszy model Forda są jak niebo i ziemia. W wypadku deep learningu i AI jest podobnie. Pierwsze techniki, na których w jakimś stopniu bazują również dzisiejsze modele, zostały zaprezentowane trzydzieści, czterdzieści lat temu. A mimo to dzisiaj wszyscy pytają o nasz sekretny sos.
To jaki jest wasz sekret?
Trenowanie sieci neuronowych wymaga różnego rodzaju zaangażowania na różnych etapach procesu. Potrzebne są wysokiej jakości dane, algorytmy muszą być poprawne numerycznie, a w kodzie nie powinno być błędów, ponieważ bardzo trudno jest je potem odnaleźć. Nasz sukces to w dużej mierze zasługa tego, że jesteśmy wyczuleni na detale, a każdy kolejny element potrzebny do wyszkolenia naszych modeli wykonujemy bardzo, ale to bardzo dobrze. Jedną z naszych przewag jest także to, że rzadko trafiają się laboratoria sztucznej inteligencji, w których współpracuje ze sobą kilkuset naukowców, inżynierów i ludzi potrafiących budować start-upy. Teoretycznie już jedna osoba jest w stanie stworzyć coś, co przypominałoby ChatGPT, ale byłoby to bez porównania gorsze od rozwiązania, za którym stoi potężny zespół kompetentnych osób, wspólnie pracujących nad tym, aby każdy element procesu był przemyślany do spodu. Do tego dochodzi jeszcze to, że w branży sztucznej inteligencji często największy wpływ na rozwój technologii mają najprostsze rozwiązania. A OpenAI słynie z tego, że potrafi skupiać się na działaniach, które naprawdę mają znaczenie. Tylko tyle i aż tyle.
Tworzenie AI jako sztuka upraszczania?
Tak, trafnie to ująłeś.
A jest coś, co na poziomie technologicznym spędza wam sen z powiek?
Jak każda nowa technologia ChatGPT ma różne problemy. Jednym z nich jest brak aktualnych danych, o którym wspominałeś, a innym to, że nasz model czasem halucynuje – daje odpowiedzi, które nie są prawdziwe.
Zauważyłem…
Intensywnie pracujemy nad tym, aby tego nie robił. I wiemy, że ten problem jest rozwiązywalny.
Czy to prawda, że ChatGPT–4 będzie nawet 500 razy potężniejszy niż ChatGPT–3?
Nic nie mogę powiedzieć na ten temat.
A jak doszło do tego, że organizacja non profit, która zaczęła się od kilku zamożnych przedsiębiorców i dziewięciu naukowców, przeistoczyła się w potężny komercyjny start-up?
Od początku towarzyszyło nam przekonanie, że chcemy stworzyć ogólną sztuczną inteligencję i doprowadzić do tego, aby wywarła jak największy wpływ na świat. Nie znaliśmy natomiast szczegółów. Wydawało nam się, że najlepszą strukturą dla OpenAI będzie organizacja non profit. Ale z czasem się okazało, że jeśli mamy osiągnąć sukces, potrzebny nam jest potężny komputer. Żeby go mieć, potrzebne jest potężne finansowanie. A żeby je zdobyć, musieliśmy zmienić strukturę organizacji. Ale co istotne, już siedem lat temu rozmawialiśmy o rzeczach, nad którymi teraz pracujemy. Nasz cel się nie zmienił. Różnica jest taka, że wtedy mieliśmy odległe plany, a teraz wdrażamy je w życie.
Jak znalazłeś się w gronie tych dziewięciu naukowców?
Mam unikatowe kompetencje z zakresu sztucznej inteligencji. To istotna w tej dziedzinie kombinacja umiejętności matematycznych i informatycznych. Poza tym znałem się z pozostałymi badaczami. A z Ilyą Sutskeverem (współtwórcą i głównym naukowcem OpenAI – red.) znamy się i współpracujemy już od ponad dziesięciu lat.
Podobno na pierwsze spotkanie w sprawie OpenAI zaspałeś, mimo że umówiliście się późnym popołudniem…
To prawda. Funkcjonowałem wówczas w taki sposób, że spałem w dzień, a pracowałem w nocy. W OpenAI to normalne, że ludzie działają w nietypowych cyklach. Na przykład Alec Radford, który wymyślił GPT–1 i GPT–2, ostatnio kładzie się o pierwszej po południu – co jakiś czas przesuwa swój cykl snu o godzinę. Mamy pełną dowolność w organizowaniu czasu pracy, więc każdy szuka dla siebie optymalnego rozwiązania.
Jesteś formalnym współtwórcą OpenAI. Udziałowcem również?
Pracownicy OpenAI mają udziały w firmie.
Ale czy masz ich więcej niż szeregowi pracownicy?
Niestety, o tym też nie mogę rozmawiać.
A zajmujesz się w ogóle rozwojem tego biznesu?
Nie, skupiam się na naukowej stronie projektu. Rozwijanie biznesu nie jest moją najmocniejszą kompetencją. Choć posiadam umiejętności z zakresu prowadzenia projektów.
Co to znaczy?
Uwielbiam czytać i publikować prace naukowe, zderzać swoje pomysły ze współpracownikami, budować zespoły. Kilka z nich stworzyłem od zera – najpierw byłem odpowiedzialny za robotykę, potem za Codex (model AI, który analizuje język naturalny, a następnie generuje na jego podstawie kod – red.), a później za przygotowywanie danych dla ChatGPT. Teraz buduję czwarty zespół, którego celem jest uzyskanie od ludzi informacji, w jaki sposób powinno się zachowywać nasze AI – dzięki temu będziemy wiedzieć, jak wyszkolić model, aby właściwie reagował na polecenia użytkowników.
Wielu znanych przedsiębiorców było lub jest zaangażowanych w rozwój OpenAI – chociażby Elon Musk, który był z wami do 2018 roku. Nauczyłeś się czegoś od niego?
Elon to przede wszystkim niewiarygodnie inspirujący człowiek. Zaraził mnie myśleniem w kategoriach first principles (pierwszych zasad – red.). Chodzi o rozpatrywanie problemów w taki sposób, aby jak najszybciej dojść do ich prawdziwych fundamentów. To bardzo przyspiesza pracę.
W swojej karierze zaliczyłeś już kilka big techów: Nvidię, Google, Facebooka. OpenAI jest od nich inne?
Każda firma różni się na poziomie kultury organizacyjnej oraz celów, jakie sobie stawia. W Google głównym celem było stworzenie jak najlepszej wyszukiwarki. Z nim powiązane były wszelkie firmowe wysiłki. Ale jednocześnie Google bardzo zależało na tym, aby każdy pracownik świetnie się tam czuł – stąd te wszystkie masaże, maszyny do lodów czy szefowie kuchni. Tymczasem dla OpenAI najistotniejsze jest zbudowanie AI. Wszyscy wkładają w to maksymalny wysiłek. Cała organizacja jest skupiona wokół tego wyzwania.
Ilu Polaków pracuje w OpenAI?
Kilkunastu.
Jak wypadamy na tle innych narodów?
Mamy jedną z największych reprezentacji.
Wybrałeś OpenAI, mimo że miałeś na stole lukratywne propozycje z innych firm technologicznych. To była trudna decyzja?
Nieszczególnie. Choć moja mama mówiła: „Wojtek, idź do Google, tam jest darmowe jedzenie”. Z jej perspektywy najważniejsze były moja wygoda i bezpieczeństwo finansowe. Z mojej kluczowe było to, abym mógł pracować nad problemem, który mnie fascynuje. I żebym mógł to robić z jak najlepszymi ludźmi. A w OpenAI jest niewiarygodna koncentracja talentu. Wciąż jestem pod wrażeniem tego, co potrafią Sam Altman, Greg Brockman, Ilya Sutskever czy John Schulman.
I wy wszyscy uważacie, że gdy już stworzycie ogólną sztuczną inteligencję, ludzie będą w stanie korzystać z niej w sensowny i etyczny sposób?
To będzie na pewno wymagało sporo wysiłku, który już teraz wkładamy w nasz projekt. Jestem technofilem i uważam, że sztuczna inteligencja to jedna z najlepszych rzeczy, jakie spotkają ludzkość. Dzięki niej będziemy w stanie w ćwierć wieku rozwiązać problem, z którym w innym wypadku uporalibyśmy się w 250 lat – na przykład globalnego ocieplenia. AI jest jak silnik. Kiedy został odkryty, ludzie też się obawiali, że ten mięsień mechaniczny, który może zmiażdżyć ludzką czaszkę, będzie strasznym wynalazkiem. Że przez niego ludzie pracujący na roli stracą pracę. I rzeczywiście do tego doszło – kiedyś około 60 proc. ludzkości zajmowała się produkcją żywności, a dziś zaledwie 2 proc. Tyle że nikt nie chce powrotu do sytuacji sprzed lat. A wspomniany prąd? Przecież to niewidzialny zabójca. Kiedy go odkryto, robiono pokazy, na których dowodzono, że może uśmiercić nawet słonia. A prąd w ścianie? Nie ma mowy. Nawet jeden z prezydentów USA miał ludzi do obsługi światła, ponieważ bał się dotknąć włącznika. A dzisiaj wszyscy nosimy prąd w kieszeni. Historia pokazuje, że każdej dysruptywnej technologii towarzyszy strach. I dlatego wprowadzając sztuczną inteligencję, trzeba podjąć dialog ze społeczeństwem i wspólnie ustalić zasady jej funkcjonowania i dystrybucji, aby okazała się jak najkorzystniejsza dla ludzkości.