Testy, testy, testy…. Tym hasłem bombardują nas od tygodni lekarze, politycy i publicyści – nie celując, rzecz jasna, w wirusy komputerowe, a tym bardziej w sztuczną inteligencję. My jednak, sprowokowani ogólną atmosferą testowania i diagnozowania (oczywiście ważnego i potrzebnego), weźmiemy za przedmiot dyskusji właśnie sztuczną inteligencję. Dokładniej zaś: możliwe testy, które mogłyby potwierdzić, że coś, to znaczy jakiś program, system lub maszyna, ją posiada.
W ramach rozgrzewki przed dyskusją warto rozważyć następujące pytania:
Czym w ogóle jest inteligencja (w szczególności: ludzka)?
Czy testując system informatyczny pod kątem inteligencji, wystarczy obserwować wyniki jego działania (jakie problemy rozwiązuje, jak szybko to robi, w jaki sposób komunikuje i wyjaśnia rozwiązania…), czy może trzeba zajrzeć do jego wnętrza?
A może potrzebny jest inny jeszcze rodzaj testu…?
Zagadnienie inteligencji maszyn, w szczególności zaś drugie z powyższych pytań, postawił po raz pierwszy Alan Turing w słynnym artykule Computing Machinery and Intelligence. Przedstawił w nim werbalny test nierozróżnialności, nazywany dzisiaj Testem Turinga (TT).
Mówiąc najkrócej, idea testu jest następująca: jeśli w wyniku swobodnej rozmowy z maszyną, rozmowy na dowolny temat, nie potrafimy odróżnić maszyny od człowieka, winniśmy uznać ją za inteligentną (w sensie przypisywanym człowiekowi).
Sam Turing opisał swój pomysł następująco:
Nową postać problemu (PS: problemu testowania myślenia lub inteligencji maszyn) można opisać przy pomocy gry, którą nazywamy „grą w naśladownictwo”. W grze tej biorą udział trzy osoby: mężczyzna (A), kobieta (B) i człowiek zadający pytania (C), który może być dowolnej płci. Pytający znajduje się w pokoju oddzielonym od pokoju zajmowanego przez dwu pozostałych. Jego zadaniem w grze jest rozstrzygnięcie, który z dwu pozostałych uczestników gry jest mężczyzną, a który kobietą. Zna ich on jako X i Y i przy końcu gry mówi: „X jest A, a Y jest B” lub „X jest B, a Y jest A”.
Pytającemu wolno zadawać pytania A i B w ten sposób:
C: Proszę X, aby mi powiedział jak długie ma włosy?
Teraz przypuśćmy, że X jest faktycznie A, wobec czego A musi odpowiedzieć. Celem A w grze jest dołożenie wszelkich starań, aby C źle go zidentyfikował. Wobec tego jego odpowiedź mogłaby być następująca: „Moje włosy są ostrzyżone, a najdłuższe kosmyki mają około dziewięć cali długości”.
Aby brzmienie głosu nie mogło pomóc pytającemu w dokonaniu identyfikacji, odpowiedzi powinny być pisane odręcznie, a jeszcze lepiej na maszynie. Idealnym środkiem porozumiewania się między pokojami jest dalekopis. Pytania i odpowiedzi mogą być też przekazywane przez pośrednika.
(…)
Teraz zapytujemy się: „Co stanie się, gdy maszyna zastąpi A w tej grze?”. Czy pytający będzie decydował błędnie tak samo często jak wtedy, gdy w grze bierze udział mężczyzna i kobieta? Pytania te zastąpią nasze pytanie początkowe” „Czy maszyny mogą myśleć?”.
Zaletą nowego problemu jest ostre rozgraniczenie między fizycznymi i intelektualnymi możliwościami człowieka. Żaden inżynier ani chemik nie twierdzi, że potrafi wyprodukować materiał, który niczym by się nie różnił od skóry ludzkiej. Możliwe, że kiedyś można będzie to zrobić, ale nawet gdybyśmy rozporządzali takim wynalazkiem, to i tak nie miałoby większego sensu usiłowanie ubrania myślącej maszyny w takie sztuczne ciało w celu uczynienia jej bardziej ludzką. To nasze przekonanie znajduje odbicie w sposobie postawienia problemu, a mianowicie w postaci zakazu, który nie pozwala pytającemu widzieć, dotykać i słyszeć pozostałych uczestników gry.
Niektóre inne zalety proponowanego kryterium można pokazać na przykładzie pytań i odpowiedzi. A zatem:
P: Napisz mi sonet na temat Forth Bridge.
O: Nie licz na mnie. Nigdy nie umiałem pisać wierszy.
P: Dodaj 34 957 do 70 764.
O: (Po 30-sekundowym namyśle odpowiada) 105 621.
P: Czy grasz w szachy?
O: Tak.
P: Mam K na K1 i innych figur nie mam. Ty masz tylko K na K6 i R na R1. Jest twój ruch. Jakie zrobisz posunięcie?
O: (Po 15-sekundowym namyśle) R-R8 mat.
Wydaje się, że metoda pytań i odpowiedzi nadaje się do wprowadzenia do prawie każdej dziedziny ludzkiej działalności, do której chcemy ją wprowadzić.
Zaproponowana przez Turinga metoda – o której więcej można przeczytać w oryginalnym artykule – nie wszystkich przekonuje. I dlatego właśnie poddajemy ją pod dyskusję :).
Z jednej strony ma wyraźne zalety. Na przykład: abstrahuje od trudnouchwytnych zjawisk psychologicznych typu świadomość czy przeżycia podmiotu poznającego; a ponadto, nawiązuje do faktu, że w przypadku ludzi to język właśnie (wypowiedzi językowe) jest najlepszym wyrazem myśli.
Z drugiej strony jednak, rodzi wiele pytań, te zaś mogą prowadzić do przekonania o bezużyteczności podejścia Turinga. Przykładowo: czy obserwacja zachowania maszyny (w tym przypadku: werbalnego), a nie jej wewnętrznych struktur i operacji, jest wystarczająca? Czy sam wynik maszyny pozwala wnioskować o jej inteligencji?
Ku której opinii Państwo się skłaniacie: aprobującej TT, czy odrzucającej go?
A jeśli to drugie, to jak należy TT wzmocnić?
Lub ogólniej: jaki inny test należałoby zastosować, aby móc zasadnie stwierdzać inteligencję maszyn?
A zatem: testy, testy, testy…
Czekamy na pomysły i wspierające je argumenty!
Jakiego rodzaju testy na inteligencję informatycznych maszyn wydają się Państwu adekwatne?
Zachęcamy gorąco do rozmowy – Paweł Stacewicz i Marcin Koszowy.