Sztuczna inteligencja. Jeden kolor, trzy metafory…

Gdyby ktoś zadał mi pytanie „Z jakim kolorem kojarzy ci się sztuczna inteligencja?” bez wahania odpowiedziałbym, że… z czarnym. Miałbym po temu trzy powody.

Po pierwsze, coraz częściej w debacie publicznej pojawiają się czarne scenariusze przyszłości, w których sztuczna inteligencja niszczy naszą cywilizację. W najłagodniejszych z nich przyczynia się do stopniowej, poznawczej i społecznej, degradacji człowieka. Przykładowo: wypierając ludzi z rynku pracy (co już się dzieje), SI sprawia, że człowiek traci poczucie sensu własnej pracy i zdobywania jakichkolwiek nowych kwalifikacji. W scenariuszach najczarniejszych SI przejmuje nad nami całkowitą kontrolę. Podporządkowuje nas sobie, a gdy uzna, że jest to korzystne dla jej samorozwoju, eliminuje nas ostatecznie.  Mamy także scenariusze inne, w których to sami ludzie, używając broni opartej na SI lub dewastując dla potrzeb SI swoje środowisko naturalne, doprowadzają się do samozagłady. O sprawach tych dyskutowaliśmy już kilkukrotnie, w różnych odsłonach i kontekstach (zob. np. Sztuczna inteligencja. Czy mamy się czego bać?), ale myślę, że i tutaj możemy odnieść się do tak typowego dla współczesnych debat nad SI czarnowidztwa.

Po drugie, sztuczna inteligencja kojarzy mi się z czernią, bo coraz chętniej porównuje się ją do czarnej skrzynki. Porównanie to rozumiem tak, że nawet wyjątkowej klasy specjaliści, a co dopiero mówić o laikach, nie mają szczegółowego dostępu do tego, co dzieje się wewnątrz systemów SI, gdy realizują powierzone im zadania. Nie do końca wiadomo zatem, jakie algorytmy są w danym momencie realizowane, które ich parametry odpowiadają za konkretne działania systemów, na jakich danych system się uczył, w jaki sposób się uczył etc…
Owa niepokojąca nieprzejrzystość sztucznej inteligencji ma co najmniej dwie przyczyny. Z jednej strony, twórcy systemów SI, a przede wszystkim zatrudniające ich korporacje, obawiają się konkurencji i z tego powodu nie ujawniają pełnej informacji o sposobie działania swoich produktów. Z drugiej strony jednak, niezależnie od praktyk biznesowych w sektorze SI, większość współczesnych systemów (w tym tzw. LLM-y) opiera się na sztucznych sieciach neuronowych, a te cechuje gigantyczna złożoność strukturalna (setki tysięcy sztucznych neuronów i połączeń między nimi). Wiedza w ich wnętrzu jest kodowana w postaci ogromnej liczby rozproszonych po całej sieci wag połączeń międzyneuronalnych. Wydobycie z nich przejrzystych dla człowieka wyjaśnień jest skrajnie trudne lub w ogóle niewykonalne. Zwłaszcza, że właściwą podstawą dla nich są zachodzące wewnątrz sieci, niskopoziomowe, realizowane na poziomie pojedynczych neuronów i wiążących je połączeń, procesy samoorganizacji. Kwestie te dyskutowaliśmy już przy okazji wpisu Zaufanie do systemów sztucznej inteligencji. Rola wyjaśniania, ale tu stawiam je w nowym kontekście.
Wszystko to powoduje, że coraz częściej możliwości systemów SI sprawdza się eksperymentalnie. Traktuje się system jak czarną skrzynkę, na której wejścia podaje się różne kombinacje danych (w tym: pytania) i sprawdza się, jak system reaguje. Badania formalne, odwołujące się do matematycznych własności wykorzystywanych struktur danych i algorytmów, należą do rzadkości. System informatyczny – mimo, że został zaprojektowany zgodnie z opracowaną przez człowieka specyfikacją – traktuje się jak obiekt czysto empiryczny. Bada się go eksperymentalnie, podobnie jak zjawiska przyrodnicze i społeczne.
Czy jesteśmy na to skazani i czy nie jest możliwe inne, bardziej matematyczne, podejście…? Oto jeden z ciekawych tematów do dyskusji – być może nawet, zasługujący na osobny wpis.

Przejdźmy na koniec do metafory trzeciej, być może najbardziej zaskakującej. Otóż sztuczna inteligencja coraz silniej kojarzy mi się z czarną dziurą. Niczym czarna dziura w przestrzeni kosmicznej SI pochłania wszelką materię i energię wokół siebie. Przy czym tutaj chodzi o materię poznawczą i energię intelektualną 😊.
Możemy to obserwować niemal codziennie: badania, projekty naukowe, rozwiązania technologiczne, debaty społeczne, dyskusje filozoficzne… wszystko to ciąży coraz bardziej ku tematyce sztucznej inteligencji.
Metafora jest oczywiście mocno przesadzona. Mimo wszystko jednak, zwraca uwagę na zjawisko, które na naszych oczach, również w tym blogu i w tym wpisie, pochłania ludzką wyobraźnię.

Zapraszam serdecznie do rozmowy, w której ujawnią się, być może, inne jeszcze, niekoniecznie czarne, metafory – Paweł Stacewicz.

Zaszufladkowano do kategorii Dydaktyka logiki i filozofii, Filozofia informatyki, Światopogląd informatyczny, Światopogląd racjonalistyczny | 41 komentarzy

Uwagi w kwestii „arytmetyki sumienia”

Nie mogąc ze względów technicznych uczestniczyć zdalnie w seminarium w PW (poświęconym filozofii nauki) z odczytem dra Andrzeja Malca pt.  „Czy sumienie komputera może być autonomiczne?”, a będąc ciekaw jego poglądów w kwestiach aksjologii i teorii prawa, skorzystam z dostępności Jego książki „Arytmetyka sumienia. Teoria odpowiedzialności słusznościowej”, żeby na jej podstawie postawić Autorowi pytania, które bym zadał uczestnicząc w spotkaniu. Odpowiedź mógłbym pewnie wyczytać ze starannej lektury tej książki (podczas gdy obecne pytania biorą się z lektury dość pobieżnej, na zasadzie wertowania),  ale skorzystanie w tym celu z bloga ma tę przewagę, że może przybliżyć tematykę książki także osobom, które w wymienionym spotkaniu nie brały udziału.

Oto kilka moich pytań:

1) W nawiązaniu do uwag metodologicznych na stronie 13, zapytuję: czy przekonanie o prawdziwości aksjomatów arytmetyki Peano jest występkiem przeciw etyce badawczej zalecanej przez filozofię analityczną? Jeśli tak, to co do mnie, to jestem osobnikiem występnym. Zaczynam od przykładu z arytmetyką w sensie dosłownym, żeby lepiej wniknąć w sens metafory „arytmetyka sumienia”.

2) Czy dobrze rozumiem, że według Autora, gdyby zaksjomatyzować jego aksjologię, to byłyby to aksjomaty o treści podobnie obiektywnej (choć zgoła w innej materii), a więc zdania posiadające wartość logiczną. Jeśli istotnie tak Autor sądzi, to się z nim zgadzam, a jeśli nie, to gotów jestem do polemiki.

3) Popieram gorąco krytykę poglądu Russella (s.130) o racjonalności komunizmu. Ogrom absurdów jest w komunizmie piorunujący; przykładem, który powinien był przekonać Russella jest dokonana przez von Misesa w latach 20-tych ubiegłego wieku analiza horrendalnej nieobliczalności w centralnym planowaniu gospodarczym, a to z powodu kolosalnej złożoności, którą trzeba by ogarnąć planowaniem. Idąc tym tropem, doradzałbym w dalszych badaniach Autora korzystać z pojęcia złożoności algorytmicznej, które zawdzięczamy informatyce  (Chaitin etc.).

4) Podjąłbym polemikę ze smętnymi rozważaniami Baumana o niepewności.  Takie jest uwarunkowanie ludzkiej kondycji. A jak sobie z nim radzić nie kwękając, pokazał już Pascal w regule zwanej po angielsku „rule of expected utility” (nie znam dobrego polskiego przekładu).  Weszła ona do podstaw matematycznej teorii gier i decyzji von Neumanna i Morgensterna, i w tej nowoczesnej postaci jest bardzo godna polecenia uwadze filozofów z cechu aksjologicznego.

Do tych uwag zainspirował mnie ostatni człon tytułu książki brzmiący „wersja próbna”. Brzmi to ujmująco skromnie. I zachęca czytelnika takiego jak niniejszy do włączenia się z propozycjami co do kontynuacji.

Zaszufladkowano do kategorii Bez kategorii | 11 komentarzy

Od sztucznej inteligencji do (samodoskonalącej się) superinteligencji

Z ogromną przyjemnością publikuję w naszym blogu tekst Wojciecha Głażewskiego (inżyniera i filozofa z Uniwersytetu w Białymstoku), szkicujący autorski scenariusz przejścia od aktualnie konstruowanych systemów sztucznej inteligencji do systemów superinteligentnych.
W scenariuszu tym na plan pierwszy wybijają się dwie oryginalne tezy.
Pierwsza mówi, że warunkiem koniecznym  posiadania przez system prawdziwej inteligencji (a nie jej zaprogramowanej imitacji) jest zdolność systemu do samodoskonalenia się. Druga wskazuje na niezbędną podstawę samodoskonalenia, jaką są  jakościowe zmiany struktury fizycznej systemu, wykraczające poza zmiany struktur danych czy programów sterujących pracą systemu.

Oczywiście tezy te nie wyczerpują spostrzeżeń, argumentów i propozycji Autora. Mam nadzieję też, że zachęcą Państwa do dyskusji, która je wesprze, osłabi, rozwinie lub postawi w innym świetle…

A oto otwierający dyskusję tekst Wojciecha Głażewskiego:

*********************

Refleksje nad scenariuszami dla sztucznej inteligencji

Mniej więcej rok temu odbyła się tutaj ciekawa dyskusja o cechach systemów AI, które miałyby świadczyć o ich inteligencji (https://marciszewski.eu/?p=11519). Pojawiło się wiele interesujących głosów, wśród których najczęściej wskazywano na umiejętność rozwiązywania problemów (zwłaszcza dzięki uczeniu się na podstawie własnych doświadczeń), zdolność do generalizacji oraz kreatywność (innowacyjność). Nie sposób wyliczyć ile już razy stawiano to pytanie. Na tym blogu nie wypada nie zacytować prof. Marciszewskiego:

Czy jest możliwe skonstruowanie inteligencji maszynowej, która by pod każdym względem dorównała ludzkiej inwencji? Jeśli nie, to pod jakim względem dorówna, a pod jakim przegra? A może da się skonstruować maszynę inteligentniejszą od człowieka? Jeśli tak, to pod jakim względem? (Marciszewski, 1998, s.117)

Rok to dużo czasu w epoce wykładniczego wzrostu. Okres zdobywania globalnego rynku nie jest już liczony w latach, ale w miesiącach. Scenariusz dla superinteligencji opisany przez Nicka Bostroma, wydaje się coraz bardziej realny (Bostrom, 2014). W tempie nomen omen potęgowym, sztuczna inteligencja osiągnie przewagę nad ludzkością, zostawiając nam bezsilność chyba najgorszego gatunku – intelektualną. Warto więc zapytać, co po tym roku osiągnęła technologia AI. Jaki scenariusz jej rozwoju właśnie się realizuje? Czy sztuczna inteligencja staje się bardziej inteligentna? Spróbuję wciągnąć Państwa do dyskusji stawiając przewrotną tezę: systemy AI, jakie nas obecnie otaczają, nie są inteligentne.

Kontynuując myśl prof. Marciszewskiego:

Żeby podjąć te zagadnienia, trzeba zdobyć pojęcie inteligencji na tyle operatywne, żeby móc zaproponować jakiś praktyczny test – sprawdzian, który pozwoli ocenić, jakie zachowania komputera świadczą o rodzaju i stopniu jego inteligencji. (Marciszewski, 1998, s.118)

W miejsce opisowych definicji inteligencji, które trudno zarówno umocować, jak i zanegować, z uwagi na ich ogólnikowy charakter, postawię warunek samodoskonalenia, czyli  zdolności do ulepszenia samego siebie, jako cechy systemu inteligentnego, możliwej do stwierdzenia, na mocy tak postawionej jego definicji.

Pomimo wielu spojrzeń na inteligencję i wielu przykładów problemów zaliczanych do kategorii wymagających inteligencji, zadanie ulepszenia samego siebie wydaje mi się jednym z takich, które zawiera w sobie konieczność posiadania praktycznie wszystkich cech przypisywanych zwyczajowo działaniu inteligentnemu. Wymaga zdobycia wiedzy na temat własnego zachowania, czyli uczenia się z doświadczeń, wymaga też umiejętności generalizacji niezbędnej do wyciągnięcia wniosków z tych doświadczeń. Wymaga stawiania hipotez, a więc samodzielnego posługiwania się pojęciami. Wymaga podejmowania autonomicznych decyzji o tym, kiedy i w jaki sposób wpłynąć na własne zachowanie. Wreszcie wymaga kreatywności i innowacyjności w zaproponowaniu nowego, lepszego rozwiązania dla nowej wersji samego siebie. Matematyk Irvin John Good określił tę umiejętność jako “ultrainteligencję”. W 1966 roku opisał maszynę o takich możliwościach:

Let an ultraintelligent machine be defined as a machine that can far surpass all the intellectual activities of any man however clever. Since the design of machines is one of these intellectual activities, an ultraintelligent machine could design even better machines; there would then unquestionably be an „intelligence explosion,” and the intelligence of man would be left far behind. (Good, 1966, s.33)

Cała nowa maszyna potrzebna byłaby w przypadku odkrycia przez bieżącą maszynę fundamentalnie nowej zasady konstrukcyjnej. W przypadku wypracowania jedynie usprawnienia, proces samodoskonalenia mógłby mieć charakter inkrementalny – łańcucha poprawek. Współczesny badacz sztucznej inteligencji, Eliezer Yudkowsky, nazywa umiejętność ulepszenia własnych procesów “rekursywnym samodoskonaleniem”, a system, który miałby taką możliwość, “zalążkową SI”:

A seed AI is a strongly self-improving process, characterized by improvements to the content base that exert direct positive feedback on the intelligence of the underlying improving process. (Yudkowsky, 2007, s.96)

Cechą wyróżniającą maszyny ultrainteligentnej byłaby więc zdolność do zaprojektowania maszyny lepszej niż ona sama. Nie wydaje mi się, żeby ta właściwość pojawiła się dopiero na poziomie ultrainteligencji. Wszystkie elementy procesu realizowania tego zadania posiada przecież człowiek, a super- lub ultrainteligencja ma być systemem przewyższającym go możliwościami. Każdy więc system rzeczywiście inteligentny powinien tę zdolność mieć, a różnica w stopniu inteligencji będzie dotyczyła poziomu jego rozwoju, od zalążkowego, poprzez poziom zbliżony do ludzkiego, dalej superinteligentny, a poziom ultrainteligentny byłby już w pewien sposób granicznym, zapewne ze względu na limity fizycznej rzeczywistości. Warunek samodoskonalenia sztucznej inteligencji można więc sformułować jako zwiększenie możliwości inteligentnego działania w sztucznym systemie, zrealizowane wyłącznie własnymi procesami tego systemu.

W tym miejscu należy odróżnić zwiększenie fizycznych parametrów lub zasobów systemu, od rozwoju jakości realizowanych przez system procesów. Bostrom wyróżnia trzy formy superinteligencji: szybką, zbiorową i jakościową. Dwie pierwsze wydają się właśnie dotyczyć parametrów ilościowych systemów inteligentnych, natomiast ta trzecia dotyka istoty właściwego pojęcia inteligencji. Dla przykładu – zwiększenie liczby książek na półkach oraz przyspieszenie kroku przez pracowników biblioteki nie są zmianami w procesie obsługi czytelników, chociaż zwiększają możliwości biblioteki w jej roli udostępnienia jak największego zasobu literatury jak największej ilości osób. Zmiana organizacji katalogu książek lub zmiana heurystyki realizacji kwerendy, dla samego procesu funkcjonowania systemu biblioteki, byłaby już zmianą jakościową. Naturalnie nasuwa się tu zastrzeżenie, że jeśli system będzie posiadał więcej “wiedzy”, to jego możliwości będą większe. Pozostanę jednak przy ujęciu rozróżniającym zasoby i procesy, w którym kieszonkowy kalkulator dodający dwie kilkucyfrowe liczby realizuje proces o tej samej jakości, co komputer z wielordzeniowym procesorem, dodający dwie liczby kilkudziesięciocyfrowe. Interesująca nas różnica nie bierze się bowiem z porównania zasobów, ale z porównania procesów.

Aby uniknąć definiowania systemu inteligentnego opisowo (lista cech) lub tautologicznie (“system inteligentny to taki, który zachowuje się inteligentnie”), sformułuję warunek konieczny inteligencji, oparty na zdolności do samodoskonalenia strukturalnego:

System jest inteligentny wtedy, kiedy jest w stanie wypracować taką wersję swojej kolejnej struktury funkcjonalnej, która nie powtarza struktury wcześniejszej.

Przy czym, mówiąc o strukturze funkcjonalnej, mam na myśli fizyczną postać systemu, a więc rodzaj i układ jego elementów, co determinuje rodzaj ich wzajemnych zależności. Architektura wydaje się pojęciem zbyt wąskim, ponieważ te same architektury pamięci mogą być wypełnione innymi informacjami, dając systemowi inne możliwości. Program w pamięci komputera to także za mało, ponieważ możliwości systemu zależą od organizacji mikroprocesora. Sieć neuronowa wraz z wyuczonymi wagami wydaje się być najbliższa intuicji takiej struktury. Nie mam tutaj gotowych odpowiedzi, jest to jeden z tematów mojej pracy badawczej.

Wracając do samej definicji, to przy takim jej sformułowaniu mam nadzieję oprzeć ją na rzeczywistych danych możliwych do zebrania oraz na ustanowieniu zależności między nimi, możliwych do analitycznego wyznaczenia. Dla fizycznych parametrów lub zasobów systemu jest to oczywiste (np. różnica częstotliwości taktowania procesora, ilości danych w pamięci), jednak dla opisowych definicji inteligencji już takie nie jest. Jeśli jedną z cech systemu inteligentnego jest kreatywność, to jak porównać stopień kreatywności pomiędzy różnymi jego wytworami? Jak odróżnić nauczenie się na jednym doświadczeniu od nauczenia się na innym doświadczeniu? Powyższa definicja systemu inteligentnego rozwiązuje problem tych niejasności poprzez zamknięcie ich w zadaniu samodoskonalenia. Aby je poprawnie wykonać, należy zebrać doświadczenia, należy dokonać generalizacji, należy wypracować nowatorskie rozwiązanie. Zamiast porównywać “nowatorstwo” odpowiedzi systemu, ocenione zostaną konsekwencje działania zbudowanego na ich podstawie nowego systemu. Ponieważ znana jest struktura obecnego systemu oraz znane są struktury poprzednich wersji, można analitycznie wyznaczyć ich różnicę. Rozkład różnicy w czasie ujawni charakter postępu – czy był dodatni, czy ujemny, czy też zerowy.

Najprostszym przypadkiem byłby system, który nie jest w stanie wypracować kompletu informacji opisujących swoją własną strukturę, to znaczy system nie dający się zamknąć w pętlę samorozwoju. Do tej kategorii zaliczę wszystkie systemy wąskiej sztucznej inteligencji, powtarzając swoja tezę ze wstępu. Na naszych oczach eksploduje ich popularność, nie idzie za nią jednak zdolność do nowatorskiej kreatywności i do autonomicznego samorozwoju. Są narzędziami, programami komputerowymi o wielkich możliwościach. Kwestia samodoskonalenia do poziomu superinteligencji ich nie dotyczy.

Jeśli system potrafi wypracować komplet informacji, “przepis” na sztuczny system inteligentny, świadczy to o posiadaniu wiedzy ogólnej – z zakresu matematyki, informatyki, technologii maszyn, problematyki kognitywistycznej czy nawet filozoficznej. Na pewno o umiejętności wytworzenia obrazów (planów, schematów), tekstów (opisów technologii, instrukcji działania) oraz kodu (listingi programów). System taki będzie można zaliczyć do kategorii AGI i pewnie wkrótce możemy się spodziewać jego powstania. Czy jednak będzie inteligentny w tym jakościowym sensie, analogicznym do ludzkiego? Sądzę, że tylko postawienie mu zadania tak trudnego jak to, które postawił przed sobą człowiek – zaprojektowania sztucznej inteligencji – pozwoli uzyskać jednoznaczną odpowiedź. Będzie to jeden z najciekawszych eksperymentów w historii ludzkości.

Czemu nie zrobić takiego eksperymentu dla ChatGPT? Czy istnieje niebezpieczeństwo, że uzyskany wynik będzie dodatni? ChatGPT jest programem komputerowym uruchomionym na komputerze, co determinuje rezultat jego działania. W moim przekonaniu, system tego typu nie jest w stanie wypracować odpowiedzi o charakterze dodatnim informacyjnie, w stosunku do tego, co zawiera w strukturze swojego algorytmu. Dzieje się tak dlatego, że komputer realizuje wyłącznie operacje arytmetyczno-logiczne, a więc dedukcyjne w swojej naturze. Odpowiedzi systemu zawierają się już w przesłankach, od których wychodzi. Obliczony dla takich operacji zysk informacyjny ze wzoru Shannona da wartość zero. Mówiąc jeszcze inaczej, systemy komputerowe same z siebie nie mogą się dowiedzieć więcej niż już wiedzą. Wynika to stąd, że procesory komputerów realizują wyłącznie procesy fizyczne, a więc działają zgodnie z kierunkiem entropii. Zwiększenie złożoności informacyjnej jest działaniem przeciw entropii, więc możliwość taką może mieć tylko system, który potrafi zmienić swoją strukturę fizyczną. Takiej możliwości krzemowy mikroprocesor nie posiada.

Aby eksperyment dał rezultat dodatni, nowy system, zbudowany na podstawie kompletu dokumentacji wypracowanego przez poprzedni system, musi różnić się w swoim działaniu od systemu poprzedniego. Musi różnić się swoją strukturą fizyczną, ponieważ tylko taka różnica umożliwi inny przebieg zachodzących w nim procesów. Nie tylko musi się różnić, ale ta różnica musi wprowadzać do struktury nową jakość. Określa to druga część definicji – jeśli struktura powtarza wcześniejszą, to system albo się ustabilizował i grozi mu nieskończone zapętlenie na określonym poziomie, albo degraduje się i dotarł do którejś z wcześniejszych, mniej inteligentnych struktur. Charakter tego nowego pierwiastka, czy był korzystny czy nie, można oczywiście sprawdzać mierząc odpowiedzi nowego systemu na zestaw problemów testowych czy porównując ilości punktów zdobytych w zadaniach kontrolnych, byłyby to jednak testy wąskie, ograniczone, trudne często do porównań i niejednoznaczne. Szukając odpowiedzi na najważniejsze, postawione na wstępie pytanie, czyli jaki scenariusz rozwoju sztucznej inteligencji się realizuje, można spróbować obserwować trend różnic kolejnych struktur. Dodatni rezultat potwierdzi obecność jakościowej inteligencji, porównywalnej z ludzką. Jeśli wtedy zdecydujemy o alokacji zasobów oraz umożliwimy systemowi realizację kolejnych wcieleń, otworzymy mu drogę do superinteligencji.

Eksperyment już się zaczął. AI jest używana do doskonalenia technologii AI. Czy jednak wytworzy nową, lepszą wersję samej siebie? Tak się w tej chwili nie dzieje. Owszem, programy komputerowe zwane sztuczną inteligencją są wykorzystywane w optymalizacji technik sztucznej inteligencji, ale nadal jako narzędzia dla zajmujących się tym programistów. Są niezwykle użyteczne, ale wciąż wymagają kuratora. To człowiek jest źródłem inteligencji dla tych sztucznych systemów. Źródłem inteligentnego ich zaprojektowania, inteligentnego promptu, czy wprost źródłem danych, które przecież pochodzą z jego inteligentnej działalności. Przywołując jeszcze raz prof. Marciszewskiego, w kwestii systemów inteligentniejszych od człowieka:

Czy wystarczy jako środek dostatecznie złożony software, bez rewolucji w rozwiązaniach sprzętowych? Czy też konieczne będzie wytworzenie jakiegoś nowego rodzaju urządzeń, może biologicznych? (Marciszewski, 1998, s.117)

Jeśli system będzie oparty na krzemowym mikroprocesorze, to jak miałby zmienić swoją fizyczną postać? Aby zrealizować zadanie samodoskonalenia, system sztucznej inteligencji musiałby prawdopodobnie być oparty na innym rodzaju substratu informacyjnego, ale to już temat na inną opowieść.

Literatura

  1. Bostrom, N. (2014). Superintelligence: Paths, dangers, strategies. Oxford University Press.
  2. Good, I.J. (1966). Speculations Concerning the First Ultraintelligent Machine. Comput., 6, 31-88.
  3. Marciszewski, W. (1998). Sztuczna Inteligencja. Społeczny Instytut Wydawniczy Znak
  4. Yudkowsky, E. (2007). Levels of Organization in General Intelligence. In: Goertzel, B., Pennachin, C. (eds) Artificial General Intelligence. Cognitive Technologies. Springer, Berlin, Heidelberg.

WOJCIECH GŁAŻEWSKI

*************************

Najserdeczniej zapraszam do dyskusji nad powyższym tekstem — Paweł Stacewicz.

Zaszufladkowano do kategorii Dydaktyka logiki i filozofii, Filozofia informatyki, Filozofia nauki, Światopogląd informatyczny, Światopogląd racjonalistyczny | 74 komentarze

Do czego i dlaczego informatycy potrzebują filozofii?

Obecnym wpisem chciałbym odświeżyć, ale też nieco inaczej ukierunkować, dyskusję sprzed 11 lat (!), która nosiła tytuł „Czy informatykom jest potrzebna filozofia?”. Tytuł ten był wyrazem wstępnego rozpoznania „stanu ducha” ówczesnych studentów informatyki, którzy raczej stronili od filozofii. Postrzegali ją jako dyscyplinę radykalnie różną od informatyki (czy nauk pokrewnych) i stąd zastanawiali się, czy w ogóle, w jakimkolwiek stopniu, może się ona im przydać.

Tym razem, zadaję pytanie mniej ostrożne, a nawet ciut tendencyjne:  „Do czego i dlaczego informatycy potrzebują filozofii?”. Nie pytam zatem „Czy…„, lecz przyjmując, że odpowiedź jest pozytywna, dopytuję o szczegóły i przyczyny ich zainteresowania filozofią.  Sugeruję tym samym, że stan ducha przyszłych programistów, analityków danych  i specjalistów od sztucznej inteligencji (…) istotnie się zmienił.
Przekonałem się o tym podczas ostatnich zajęć na wydziale MiNI PW, kiedy to większość osób (aktywnie!) dyskutujących relację [informatyka a filozofia] była głęboko przekonana o pożytkach, jakie mogą płynąć ze znajomości filozofii. Były oczywiście głosy sceptyczne, ale te pozytywne względem filozofii  przeważały.
Jedni wskazywali na etykę – jako źródło zasad i norm, które mogłyby zapobiec niekontrolowanemu i szkodliwemu dla człowieka wykorzystywaniu systemów informatycznych, w tym sztucznej inteligencji.
Inni wybijali na pierwszy plan zdolność do krytycznego myślenia – którą filozofia mogłaby kształtować w sposób ogólny, przydatny również w kwestiach technicznych.
Jeszcze inni mówili o pozytywnej roli filozofów w objaśnianiu takich zjawisk, jak świadomość, myślenie twórcze czy wolna wola – które musimy zrozumieć, chcąc oceniać aktualne i potencjalne możliwości systemów sztucznej inteligencji. W szczególności wtedy, gdy potraktujemy serio możliwość skonstruowania  maszyn autonomicznych, zdolnych do stawiania i realizacji własnych  celów.

Dlaczego tak się stało?
Dlaczego po 11 latach filozofia ma w oczach studentek i studentów tego samego wydziału zdecydowanie lepsze notowania?

Czy chodzi o to, że współcześni informatycy muszą posiadać tzw. umiejętności miękkie, a te kształtuje m.in. filozofia? Na przykład, podczas swobodnych dyskusji o miejscu informatyki we współczesnej kulturze.
A może chodzi o pewien akademicki trend, przychodzący do nas m.in. ze Stanów, polegający na włączaniu treści filozoficznych do programów studiów technicznych. Za ich sprawą informatycy mieliby uzyskać szersze horyzonty i szerszy ogląd swojej dyscypliny.
A może idzie o rosnące konsekwencje społeczne informatycznych wynalazków?
Na przykład o to, że ktoś może ich użyć w sposób nieetyczny  (co to znaczy?). Albo, że ich reguły działania i złożoność w wielu przypadkach nie pozwalają wyjaśniać podejmowanych przez nie decyzji (czym jest dobre wyjaśnienie?).
A może informatyków niepokoi fakt, że zaczynają wkraczać w sfery zdecydowanie wykraczające poza ich kompetencje – tworzą coś, co może być świadome (czym jest świadomość?),  co może czuć (czym są doznania i przeżycia?), co może być podmiotem własnych działań (czym jest podmiotowość i co to znaczy działać intencjonalnie?).
Jednym słowem, informatycy dotykają sfery filozoficznych pytań i chcą się dowiedzieć, jak filozofowie próbowali i próbują na nie odpowiadać…

Sformułowawszy swoje spontaniczne domysły, otwieram DYSKUSJĘ :).
A zatem:
Do czego i dlaczego informatycy potrzebują filozofii?

A może pomyliłem się, stawiając diagnozę, że stan ducha  studentek i studentów kierunków informatycznych stał się bardziej filozoficzny…
Jeśli tak, to ciekaw jestem również głosów sceptycznych i antyfilozoficznych.

Zapraszam serdecznie do rozmowy wszystkich czytelników bloga — Paweł Stacewicz.

Zaszufladkowano do kategorii Dydaktyka logiki i filozofii, Filozofia informatyki, Filozofia nauki, Światopogląd informatyczny, Światopogląd racjonalistyczny | 57 komentarzy

Computing, obliczenia i liczby

Uczestniczyłem ostatnio w kilku konferencjach  i seminariach, które miały w swoich tytułach termin computing —  tłumaczony najczęściej jako obliczanie. Słuchając różnych referatów i dyskusji, uświadomiłem sobie, że nawet w tak wąskim kontekście jak informatyka i jej komputerowe zastosowania, różne osoby używają tego terminu w różnych znaczeniach.
Przykładowo: w znaczeniu wykonywania obliczeń, przetwarzania danych, realizacji algorytmów, rozwiązywania problemów… a nawet jako nazwy dyscypliny naukowej, Computing właśnie, która zajmuje się po trochu wszystkimi wymienionymi czynnościami lub procesami.
W ślad za wieloznacznością idzie tendencja do łączenia computing z przymiotnikami, które mają wskazywać na konkretne formy lub aspekty obliczeń; niekiedy jednak tak od siebie różne, że trudno dopatrzeć się w nich wspólnego mianownika. Mamy zatem: digital computing,  analog computing, quantum computing, hyper-computing, physical computing, natural computing, mortal computing etc…

Dla zobrazowania powyższych obserwacji warto przytoczyć kilka ogólnych określeń specjalistów. Każde z nich próbuje uchwycić istotę computing, lecz wzięte łącznie ukazują  dobrze typową dla współczesnych dyskusji wieloznaczność i wieloaspektowość obliczeń. Rozwinięcie kolejnych cytatów wymagałoby oczywiście osobnego wpisu (może nawet wykładu😊), lecz nie o to tu chodzi. Chodzi o ukazanie różnorodności znaczeń i sprowokowanie dalszej dyskusji…

A oto wybrane przeze mnie przykłady:

To compute is to execute an algorithm (Jack Copeland).

The Church-Turing thesis identifies the intuitive concept of what means “to compute” with a formal model of computation (Paula Quinon).

Computing can be seen as an epistemic process evolving in time, by means of which an agent (or community), aided by some machinery or instrumentation, obtains an answer with respect to a certain state-of-affairs (mathematical or physical) that the agent interprets as a problem, and can express mathematically (Philippos Papayonnopoulos).

Computing, today more than ever before, is a multi-faceted discipline which collates several methodologies, areas of interest, and approaches: mathematics, engineering, programming, and applications (Giuseppe Primiero).

Computing is the manipulation of representations of numbers (Corey Maley).

Sformułowanie ostatnie, poprzez zawarte w nim odniesienie do liczb,  jest najbliższe duchowi polskiego tłumaczenia, o którym wspomniałem na początku:  computing = obliczanie.
Polskie obliczanie odnosi się do liczb w sposób ewidentny. Widać to wyraźnie w zdaniach typu „Oblicz coś…”. Na przykład: „Oblicz pole trójkąta”, „Oblicz wymiary działki”, „Oblicz kąt przy podstawie trójkąta równoramiennego” czy „Oblicz prędkość ciała po 2 sekundach swobodnego spadku w kierunku ziemi”. W każdym z przywołanych kontekstów wynikami czynności obliczania są pewne wartości liczbowe, które uzyskuje się poprzez przekształcanie innych wartości liczbowych za pomocą specjalnie dobranych wzorów i reguł. Wartości te mogą dotyczyć przy tym i obiektów abstrakcyjnych (jak pola figur geometrycznych), i fizycznych (jak wymiary działki).

Właśnie ze względu na swój „liczbowy” charakter polskie obliczanie wydaje się – przynajmniej na pierwszy rzut oka – dużo węższe niż angielskie computing. Spostrzeżenie to może prowadzić do wyboru innych tłumaczeń, spośród których na pierwszy plan wysuwa się przetwarzanie danych. Przetwarzając dane bowiem, niekoniecznie musimy operować na ich reprezentacjach liczbowych. Nie musimy też zakładać, że na pewnym – koniecznym dla informatycznej teorii – poziomie, dane redukują się do jakichś liczb, a operacje na danych do operacji arytmetycznych. Nie musimy zatem posługiwać się nacechowanym „liczbowo” terminem obliczanie – dla którego zresztą w języku angielskim istnieje różny od computing odpowiednik, tj. calculating.

Być może jednak za powszechną praktyką utożsamiania computing z obliczaniem stoi coś istotnego. Być może takie tłumaczenie, choć przy pierwszym spojrzeniu zbyt wąskie a nawet mylące, oddaje jednak istotę czynności nazywanej computing: istota ta polegałaby  na teoretycznej konieczności definiowania różnych rodzajów computations/obliczeń za pomocą różnego rodzaju liczb i operacji na liczbach. Przykładowo: digital computing byłoby definiowane poprzez odniesienie do własności liczb naturalnych  (własność bodaj najprostsza to dyskretność zbioru tych liczb), a pewne przynajmniej postaci analog computing  wymagałyby definicji w kategoriach własności liczb rzeczywistych (jak ciągłość).

Formułując ostatnie zdania, uświadomiłem sobie, że kilka lat temu dyskutowaliśmy o podobnych sprawach przy okazji wpisuO teoretycznej (nie)zbędności pojęcia liczby w informatyce teoretycznej i jej metodologii”. Dyskutowaliśmy nawet dość zażarcie.

Nie będę tutaj powtarzać formułowanych tam argumentów, ALE…

Bardzo jestem ciekaw, jak zapatrujecie się Państwo na:
a) wieloznaczność terminu computing,
b) naturę związków między computations/obliczeniami a światem liczb…?
A także:
c) czy wspomnianą w punkcie (a) wieloznaczność da się istotnie ograniczyć poprzez taką czy inną redukcję computing do operacji na liczbach (co zdaje się sugerować polskie tłumaczenie computing = obliczanie)?

Serdecznie zapraszam do rozmowy  — Paweł Stacewicz.

Zaszufladkowano do kategorii Dydaktyka logiki i filozofii, Epistemologia i ontologia, Filozofia informatyki, Światopogląd informatyczny | 29 komentarzy

Życie w erze informacji: między zależnością a uzależnieniem

Obecny wpis zamieszczam w blogu w imieniu Pani Mai Dąbrowskiej, studentki wydziału WEiTI PW, która podczas dyskusji na prowadzonych przeze mnie zajęciach w bardzo intrygujący sposób argumentowała na rzecz tezy, że „żyjemy w erze informacji”. Żyjemy w niej, bo jesteśmy od informacji zależni.
Przykładowo, od dostępu do informacji  i narzędzi  jej efektywnego przetwarzania zależą:  nasz status społeczny, sukces zawodowy, jakość relacji z innymi ludźmi…
Co więcej jednak, w bardzo wielu przypadkach – które być może stają się powoli niepokojącą normą – zależność przechodzi w uzależnienie

Dalsza część obecnego wpisu to już głos Mai Dąbrowskiej :)

***********

Jeśli spojrzymy na etymologię słowa informacja (łac. informatio ‘wyobrażenie’, ‘wyjaśnienie’, ‘zawiadomienie’), możemy dojść do wniosku, że jest ona obecna już od początków komunikacji międzyludzkiej (niewerbalnej i werbalnej) i nawet wówczas stanowiła podstawę społeczeństwa. Więcej: stanowi ona według niektórych wyznacznik człowieczeństwa i warunek życia wychodzącego poza prostą walkę o przetrwanie. Czy wobec tego mówienie o pewnej wyjątkowej zależności współczesnego człowieka od informacji nie jest przesadą? Może lepszym określeniem byłaby zależność od nowych technologii?

Z pewnością informatyka odgrywa tu niebagatelną, a nawet kluczową rolę, jednak w XX i XXI wieku możemy zauważyć również wzrost ilości informacji niezwiązanej z urządzeniami elektronicznymi. Człowiek nadaje coraz więcej nazw, identyfikatorów, form rzeczom i pojęciom: sam posiada numer PESEL, stworzył ideę kodów pocztowych, upowszechnił znaki drogowe; w systemie zdrowia nawet choroby mają określone numery identyfikacyjne. Społeczeństwa zmierzają w stronę formalizacji, dążą do gromadzenia i przekazywania coraz większej ilości informacji, ponieważ ułatwia to ich organizację — niezależnie od tego, czy informacja ta ma formę cyfrową, czy nie.

Zależność, ale w jakim ujęciu?

Aby zrozumieć, dlaczego i w jaki sposób jesteśmy zależni od informacji, przyjrzyjmy się najpierw definicji zależności:

zależność ż V 1. <<związek zachodzący między czymś a czymś, polegający na tym, że istnienie, jakość, itp. czegoś warunkuje istnienie, jakość, itp. czegoś innego>>. 2. <<stan kogoś (czegoś), kto (co) w swym działaniu jest krępowany, ograniczany czyjąś wolą.

Słownik Języka Polskiego, PWN

Kluczowe w powyższej definicji jest według mnie słowo działanie: to, czy jest się zależnym od kogoś (czegoś), czy też nie, określa się na podstawie tego, jakie działanie wykonuje lub chce wykonać osoba (rzecz) potencjalnie zależna. Dlatego, gdy mówimy, że jesteśmy zależni od informacji, musimy się zastanowić w jakim obszarze ta zależność występuje.

Czy można dziś przeżyć bez informacji?

Wydaje się, że informacja nie zawładnęła jeszcze życiem człowieka na tyle, aby brak informacji zupełnie je uniemożliwiał (w rozumieniu biologicznym) –  zwłaszcza w krajach, które nie uległy jeszcze informatyzacji. Postawię jednak tezę, że nie jest bez niej możliwe życie na wysokim lub nawet średnim poziomie komfortu. Większość zawodów wymaga kontaktu z informacją pewnego rodzaju, wiele z nich można wykonywać dopiero po zdobyciu edukacji (w oczywisty sposób nieodłącznie związanej z informacją). Bez interakcji z danymi nie da się również uzyskać dostępu do opieki zdrowotnej (składki, formularze, podpisy), a także opłacić ubezpieczenia.

Prawna zależność od informacji

Istotną zmianą w stosunku do poprzednich wieków jest również obecny w wielu państwach wymóg prawny rozumienia, interpretowania i dostarczania informacji wobec każdego obywatela. Sformalizowana jest większość wydarzeń w ludzkim życiu — narodziny, choroby, ślub, posiadanie miejsca zamieszkania. Prawnie jesteśmy zobowiązani do zdobycia wykształcenia podstawowego i płacenia podatków — to wszystko bez uzyskiwania, przetwarzania i zapisu informacji po prostu nie jest możliwe.

Społeczna zależność od informacji

Człowiek jest istotą społeczną, więc kontakty interpersonalne są elementem jego rzeczywistości. Życie społeczne przeniosło swój środek ciężkości w realia Internetu — nie tylko ze względu na umożliwienie szybkiej i wygodnej komunikacji. Od momentu, w którym ludzie zrozumieli, że mogą łatwo generować i skutecznie rozpowszechniać wiele informacji, Internet stał się dostawcą opinii publicznej, oknem na stan społeczeństwa. Żeby to społeczeństwo rozumieć, żeby się w nim odnajdywać, człowiek zdaje się nie mieć wyboru — musi uczestniczyć w jego życiu informacyjnym.

Dochodzimy tu jednak do pewnej granicy. Zależność człowieka od informacji w kontekście pewnych podstaw życia: edukacji, pracy, opieki zdrowotnej, prawa wydaje się dosyć oczywista. Aktywne uczestniczenie w życiu społecznym zdaje się być czymś więcej, czymś nie aż tak niezbędnym, choć przecież bardzo ludzkim. Nasuwa się jednak pytanie: czy jesteśmy dziś w stanie (jako jednostka) wieść satysfakcjonujące życie społeczne bez urządzeń nowej technologii i dostępu do odpowiednio wysokiej (coraz większej!) ilości informacji? Osobiście jestem skłonna sądzić, że tak – społeczny charakter życia człowieka nie wymaga globalnej sieci powiązań, ale poczucia przynależności i kontaktu z pewną lokalną grupą osób — mogą być to sąsiedzi, studenci jednego kierunku, rodzina. Można więc wysunąć tezę, że uczestniczenie w wirtualnym życiu społeczeństwa nie jest podstawową potrzebą, ale czymś, co człowiek świadomie wybiera. Dlatego widzę podstawy, by twierdzić, że w życiu społecznym człowiek jest tylko w pewnej mierze od informacji zależny — bardziej czyni się od tej informacji zależnym, co prowadzi nas do definicji uzależnienia:

uzależnić — uzależniać «uczynić zależnym od kogoś lub czegoś»

Słownik Języka Polskiego, PWN

Rozumiemy, że jako całość społeczeństwa jesteśmy niejako “winni” faktu, że edukacja, praca, zdrowie, etc. zależne są od informacji, więc jako społeczeństwo uzależniliśmy się od niej. Natomiast jako jednostka w tych dziedzinach po prostu jesteśmy od niej zależni: nie czynimy się, ale rodzimy się takimi. Istnieją jednak domeny, w których jednostka sama uzależnia się od informacji: wspomniane wyżej życie społeczne jest chyba najbardziej wyraźnym przykładem, ale dzieje się tak również chociażby w przypadku rozrywki czy zakupów.

W tym kontekście widzę dwa rodzaje takiego uzależnienia. Pierwszym jest prosta konsekwentność działań — nawiązałem relację z pewną osobą na komunikatorze i chcę ją kontynuować; wykupiłem serwis streamingowy i obejrzałem kilka seriali, nie chcę zmarnować pieniędzy z subskrypcji; za zakupy w sklepie internetowym przysługują mi rabaty, więc je wykorzystam. Drugim natomiast, i o wiele bardziej złożonym, jest uzależnienie w biologicznym i psychologicznym tego słowa znaczeniu.

Uzależnienie psychiczne i fizjologiczne od informacji

Co pozytywnego, przyjemnego widzi nasz mózg w informacji?

Istnieje wiele (niewykluczających się wzajemnie) koncepcji z tym związanych. Jedna z nich sugeruje, że poszukiwanie informacji jest mechanizmem obecnym już w czasach pierwotnych, ponieważ duża ilość informacji o otoczeniu zwiększała wówczas szanse na przeżycie (zob. tutaj) — stąd zachęta ze strony ewolucji w postaci pozytywnej reakcji fizjologicznej na nowe wiadomości. Reakcję taką większość publikacji opisuje jako wyrzut dopaminy i uaktywnienie ośrodka nagrody. Jedne z badań pokazują, że człowiek ma tendencję do przeceniania informacji zanim pozna jej treść — krócej, jest istotą ciekawą. Takiemu oczekiwaniu i otrzymywaniu informacji towarzyszy uaktywnienie tych części mózgu, które odpowiadają za czerpanie przyjemności z jedzenia, pieniędzy i narkotyków (zob. tutaj). Stałe otrzymywanie dopaminy przyzwyczaja organizm do tego stanu, co prowadzi do uzależnienia. Jednak oprócz wydzielania wspomnianego hormonu w odpowiedzi na informacje same w sobie, jej wyrzut następuje także dzięki pozytywnym kontaktom społecznym budowanym poprzez wymianę wiadomości (zob. tutaj).

Czytając o tym, zadałam sobie pytanie: dlaczego więc nie uzależniają nas książki naukowe — niezgłębione źródło informacji? Dlaczego studenci coraz rzadziej uczęszczają na wykłady, dlaczego nudzą nas bogate w treści teksty?

Osobiście skłaniałabym się do wyjaśnienia, że wiedza naukowa jest w naszym pojęciu czymś relatywnie statycznym; mamy świadomość, że treść danych publikacji nie zmieniła się od pewnego czasu, więc nawet, jeśli tej treści nie znamy, nie wydaje nam się ona czymś naprawdę nowym. Teza o poszukiwaniu informacji pozwalającej na przeżycie mogłaby to potwierdzać — szans na przetrwanie nie zwiększa znacząco wiedza o niezmiennych cechach otoczenia, ale zwiększa wiedza o jego aktualnym stanie, o zmianach lub ich braku. Jest to jednak tylko jeden z pomysłów odpowiedzi na to pytanie.

Można także tłumaczyć to szybszym tempem życia i komunikacji. Satysfakcji (w postaci dopaminy) nie daje dokładne zgłębienie i zrozumienie tematu, ale oczekiwanie na informację i moment pierwszej styczności z nią. Stąd, częstsze otrzymywanie niewielkich porcji informacji jest bardziej satysfakcjonujące dla naszego mózgu niż rzadsze zdobywanie dużych porcji.

Między zależnością, uzależnieniem a… ZALEŻNOŚCIĄ?

Współczesna zależność od informacji w podstawowych obszarach życia coraz częściej przechodzi w uzależnienie — zależność zaistniałą w wyniku procesu, na który niejako wyraziliśmy zgodę. Być może jednak nie jest to stan, na którym poprzestaniemy. Film The Social Dilemma opisuje chyba powszechnie już znane zjawisko tworzenia algorytmów dobierania treści i subtelnej manipulacji skutkującej zamknięciem nas w bańkach informacyjnych oraz fizjologicznym uzależnieniem. Gdy jednak weźmiemy pod uwagę intensywny rozwój sztucznej inteligencji i rosnące wraz z nim możliwości manipulacji, a także tworzenia fikcyjnych treści w sposób wysoce wiarygodny — być może jako ludzkość przejdziemy do stanu, w którym nasze uzależnienie od informacji zamieni się w obejmującą wiele obszarów ZALEŻNOŚĆ, na jaką w żadnym momencie nie wyraziliśmy żadnego rodzaju zgody?

***********

Serdecznie ZAPRASZAMY do dyskusji — Maja Dąbrowska i Paweł Stacewicz.

Zaszufladkowano do kategorii Dydaktyka logiki i filozofii, Filozofia informatyki, Filozofia nauki, Światopogląd informatyczny, Światopogląd racjonalistyczny | 48 komentarzy

Zaufanie do systemów sztucznej inteligencji.
Rola wyjaśniania.

W tym tygodniu ukazała się współredagowana przeze mnie książka pt. „Zaufanie do systemów sztucznej inteligencji”: http://www.wydawnictwopw.pl/index.php?s=karta&id=3800. W jej drugim rozdziale stawiam pewne tezy, które chciałbym niniejszym poddać pod dyskusję. Dotyczą one funkcji wyjaśniających systemów SI oraz ich roli w kształtowaniu relacji zaufania użytkownika do systemu.

Bardzo proszę, aby nie mieć do tych tez zaufania :), spojrzeć na nie krytycznie i wskazać ich słabe punkty…

Tezy są następujące:

1.
Wśród czynników, które wzmacniają zaufanie człowieka do systemów sztucznej inteligencji (SI) na pierwszy plan wybijają się: a) skuteczność – system skutecznie rozwiązuje problemy wchodzące w zakres jego kompetencji, b) zdolność do wyjaśniania – system potrafi wyjaśnić, w sposób przekonujący dla człowieka, dlaczego w danej sytuacji podjął taką a nie inną decyzję; c)  elastyczność i otwartość na krytykę – system może zmienić sposób podejmowania decyzji zależnie od interakcji z użytkownikiem; zwłaszcza w przypadku nieskutecznych działań czy  błędnych decyzji.

2.
Istnieją systemy SI, które wykazują bardzo ograniczoną zdolność do wyjaśniania podejmowanych decyzji, wskutek czego nazywa się je czarnymi skrzynkami (ang. black boxes).  Duża część takich systemów jest oparta na sztucznych sieciach neuronowych (SSN), które nabywają swoje zdolności w drodze niskopoziomowego uczenia się, polegającego na (masowym) modyfikowaniu własności neuronów i połączeń między nimi. Własności te nie przekładają się jednak wprost na wiedzę użytkownika systemu o przyczynach podjęcia przezeń konkretnej decyzji.

3.
Do ogólnych powodów słabych zdolności wyjaśniających niektórych systemów SI (niekoniecznie SSN)  należą: a) zbyt duża złożoność strukturalna systemu (w tym: sterującego nim programu), b) interakcja systemu ze środowiskiem (w tym: uczenie się), c) naśladowanie naturalnych układów do przetwarzania informacji (nie dość dobrze poznanych), d) operowanie na danych niepewnych, e) brak procedur translacji operacyjnych reguł niskiego poziomu na czytelne dla człowieka reguły symboliczne.

4.
Funkcje wyjaśniające systemów SI nie są czymś zbędnym.  Odpowiadają na  naturalną dla człowieka – jako istoty racjonalnej – potrzebę uzasadniania żywionych i przyswajanych sądów, w tym wydawanych i przyjmowanych decyzji.

5.
W aspekcie praktycznym funkcje wyjaśniające są szczególnie ważne wtedy, gdy użytkownik przyjmuje wobec systemu SI zasadę  ograniczonego zaufania (ZOZ): nie ufa mu bezgranicznie, licząc się z możliwością popełniania przezeń błędów. Zgodnie z ZOZ,  zaufanie do systemu jest stopniowalne, a jego poziom musi być tym wyższy, im w większym stopniu system potrafi eliminować błędy i doskonalić swoje działanie.

6.
W świetle zasady ZOZ istotne jest, że systemy generujące wyjaśnienia, są postrzegane przez użytkowników jako systemy zawierające pewien mechanizm monitorujący, który prócz generowania wyjaśnień, pozwala rozpoznać i usunąć odpowiednie błędy. Ponadto, informacje zawarte w wyjaśnieniach, zwłaszcza te, które dotyczą wewnętrznych parametrów systemu, mogą pomóc w udoskonaleniu systemu przez człowieka, np. programistę.

Zachęcam wszystkich do dyskusji nad przytoczonymi tezami. Ich szersze omówienia można znaleźć we wspomnianej wyżej książce, w rozdziale drugim (mojego autorstwa) pod tytułem „Wyjaśnianie, zaufanie i test Turinga”.
Przytaczam niżej obszerny fragment tego rozdziału, który nieco pełniej niż powyższe punkty naświetla mój punkt widzenia.

*****  FRAGMENT ROZDZIAŁU pt. „Wyjaśnianie, zaufanie i test Turinga”
Z KSIĄŻKI „Zaufanie do systemów sztucznej inteligencji”  *****

(…)

Zaufanie a wyjaśnianie. Kontekst psychologiczny

Zaufanie jest relacją natury psychicznej, która polega na tym, że pewna osoba, nazwijmy ją podmiotem zaufania, żywi określonego rodzaju przekonanie co do możliwych  działań drugiej strony, na przykład osoby, zwierzęcia, instytucji, urządzenia czy systemu. Jest ona mianowicie przekonana, że działania te będą zgodne z jej oczekiwaniami, które z kolei mają swoje uzasadnienie w deklaracjach, zobowiązaniach lub technicznych specyfikacjach (w przypadku artefaktów) drugiej strony. Relacja ta ma charakter kontekstowy. Znaczy to, że oczekiwania podmiotu zaufania zależą silnie od tego, czym jest druga strona relacji i jaką funkcję pełni.  Na przykład, czy osoba, której podmiot miałby zaufać, jest pracodawcą, usługodawcą, współpracownikiem, partnerem życiowym etc…

Ponieważ jądrem relacji zaufania są oczekiwania wobec pewnego obiektu (np. osoby), psychologowie bardzo często określają zaufanie za pomocą pojęcia wiarygodności. Oto objaśniający tę kwestię fragment pracy psychologów poznawczych: „Decyzja o zaufaniu opiera się najczęściej na ocenie wiarygodności drugiej osoby. Wiarygodność jest więc podstawą zaufania, a także niezbędnym czynnikiem dla pełnej relacji zaufania. Wiarygodność drugiej osoby oznacza przekonanie, że osoba ta będzie zachowywać się w sposób zgodny z oczekiwaniami.” [Jaklik, Łaguna, 2015]

Kluczową dla relacji zaufania cechę wiarygodności możemy – za M. Szynkiewiczem [2014] – zróżnicować dalej na wiarygodność merytoryczną i wiarygodność etyczno-moralną. Pierwsza zależy od wiedzy, doświadczenia i kompetencji dziedzinowych adresata postawy zaufania, druga – od przejawiających się w jego działaniu norm, zasad i poglądów etycznych. Wiarygodność merytoryczna ma charakter bardziej podstawowy, ponieważ sądy i wybory etyczne muszą dotyczyć działań, które bez należytej wiedzy i bez odpowiednich kompetencji nie mogłyby zostać ani zaplanowane, ani podjęte. Ona też będzie nas interesować w sposób szczególny, ponieważ na obecnym etapie rozwoju systemów informatycznych trudno mówić o maszynach, które autentycznie dokonują samodzielnych wyborów etycznych. Ewentualna etyka czy moralność jest kwestią zewnętrzną – powiązaną z decyzjami ludzi, którzy tak a nie inaczej programują maszyny czy ich używają.

Wyróżniony typ wiarygodności jest weryfikowany w praktyce przez skuteczność działań adresata postawy zaufania. Jest to cecha wpływająca najsilniej na poziom zaufania:  im bardziej efekty działań są zgodne z oczekiwaniami, czyli dają oczekiwany skutek, tym większe zaufanie.  Przykładowo, jeśli pewien chirurg, stawiał w przeszłości trafne diagnozy i przeprowadził wiele udanych operacji, darzymy jego umiejętności wysokim zaufaniem i bez wahania skierujemy się do niego w potrzebie. Warto zauważyć, że wobec niemożności osiągnięcia przez jakikolwiek podmiot idealnej skuteczności działań, zaufanie do niego musi być silnie uzależnione od jego zdolności do poprawy tejże efektywności. Im dany podmiot jest bardziej otwarty na krytykę, im bardziej jest w stanie eliminować błędy w swoim działaniu i zwiększać w ten sposób swoją skuteczność, tym bardziej jest on godny zaufania.
Relacja zaufania pozostaje zatem zakotwiczona w praktyce, jest też ukierunkowana na przyszłość i stopniowalna. Skoro jest stopniowalna, to powstaje pytanie o dodatkowe czynniki, które  istotnie wzmacniają jej siłę.

Twierdzimy, że oprócz kluczowej dla zaufania skuteczności działań (w tym eliminacji błędów zwiększających skuteczność), niezwykle istotną rolę odgrywa tutaj zdolność do wyjaśniania – wyjaśniania motywów działań, stojących za nimi decyzji i przyświecających im celów. Zdolność ta ma zarówno pewne walory praktyczne (o czym powiemy szerzej w kontekście systemów SI), jak i czysto psychologiczne, związane z naturalną dla człowieka potrzebą poszukiwania i uzyskiwania wyjaśnień.

W bliskim psychologii kontekście epistemologicznym kwestia druga wiąże się z samym pojęciem wiedzy, ku której człowiek – jako istota rozumna – w sposób naturalny podąża. W każdej definicji wiedzy podkreśla się czynnik uzasadnienia: jest to zbiór sądów, które oprócz innych własności, muszą posiadać dostatecznie dobre uzasadnienie (por. [Ajdukiewicz, 2006], [Chisholm 1994], [Stacewicz, 2021]). To ostatnie zaś, w formie dostępnej dla człowieka czyli intersubiektywnie komunikowalnej, przyjmuje postać wyjaśnienia, które odpowiada na pytanie „dlaczego?”. Na przykład: „Dlaczego lekarz interpretujący wyniki badań wydał sąd określający konkretną diagnozę i konkretną terapię”. Dostępności tego rodzaju wyjaśnień oczekujemy od każdego eksperta i każdego systemu, który wchodzi w jego rolę. Z samej definicji wiedzy jako czegoś intersubiektywnie dostępnego i komunikowalnego [Ajdukiewicz, 2003] wynika zatem, że wiarygodność merytoryczna – zależna od wiedzy i zdolności jej wykorzystywania – musi być weryfikowana między innymi w oparciu o wyjaśnienia adresata postawy zaufania.

Zaufanie a wyjaśnianie. Kontekst systemów sztucznej inteligencji

Relacja zaufania człowieka do systemów informatycznych – jako relacja natury psychologicznej, której główną stroną jest człowiek –  musi mieć swój mentalny wzorzec w relacjach międzyludzkich. Obserwacja ta idzie w parze z ideą testu Turinga, który nakłada na program sztucznej inteligencji sztywne więzy podobieństwa systemów SI  do człowieka. Wymóg podobieństwa sprawia, że na zaufanie człowieka do systemu niejako podwójnie wpływają wzorce kształtowane w kontaktach międzyludzkich: po pierwsze dlatego, że podmiotem relacji jest człowiek, po drugie zaś dlatego, że system informatyczny ma przypominać człowieka.
Mając to wszystko na uwadze, uwzględniając przy tym nowy kontekst interesującej nas relacji, możemy uwypuklić ponownie dwa czynniki wzmacniające zaufanie i dodać do nich trzeci. Są to:

    • skuteczność – system skutecznie rozwiązuje problemy wchodzące w zakres jego kompetencji (im lepsze statystyki poprawnie realizowanych zadań, tym większe zaufanie użytkownika);
    • zdolność do wyjaśniania – system potrafi wyjaśnić, w sposób przekonujący dla człowieka, dlaczego w danej sytuacji podjął taką a nie inną decyzję (jednym z możliwych sposobów wyjaśniania jest zrozumiała dla człowieka rekonstrukcja kroków, które doprowadziły do decyzji);
    • elastyczność i otwartość na krytykę – system może zmienić sposób podejmowania decyzji zależnie od interakcji z użytkownikiem; zwłaszcza w przypadku nieskutecznych działań, błędnych decyzji etc…

Z dwoma ostatnimi czynnikami wiąże się coś, co moglibyśmy nazwać zasadą  ograniczonego zaufania: użytkownik nie ufa systemowi bezgranicznie, licząc się z możliwością popełniania przezeń błędów. W świetle tak rozumianej zasady zaufanie do systemu jest stopniowalne, a jego poziom musi być tym wyższy, im w większym stopniu system potrafi eliminować błędy i doskonalić swoje działanie. Sprzyjają temu obecne w jego oprogramowaniu moduły uczenia się, ale ponadto, silnie powiązana z mechanizmami naprawczymi zdolność do generowania wyjaśnień.
Stawiamy tezę, że przy akceptacji zasady ograniczonego zaufania istotnie wzrasta rola zdolności do generowania wyjaśnień jako czynnika wzmacniającego wiarygodność systemu. Jeśli użytkownik akceptuje zasadę, a więc jest świadom możliwych błędów w działaniu maszyny, to w sposób naturalny łączy wiarygodność ze zdolnością do poprawy tegoż działania. Chodzi przy tym o perspektywę długoterminową, wykraczającą poza wąski horyzont aktualnie realizowanych zadań. Im większe zdolności naprawcze systemu, tym wyższy poziom zaufania do niego w długoterminowej perspektywie aktualnych i przyszłych zadań.

Mechanizm generowania wyjaśnień jest w tym kontekście niezwykle ważny. Generując wyjaśnienia, system nie tylko zaspokaja pewną epistemiczną potrzebę użytkownika (potrzebę poznania uzasadnień czy wyjaśnień), lecz dostarcza mu silnej przesłanki za tym, że w systemie istnieje pewien mechanizm monitorujący, który prócz generowania wyjaśnień, pozwala rozpoznać i usunąć odpowiednie błędy. Ponadto, informacje zawarte w wyjaśnieniach, zwłaszcza te, które dotyczą wewnętrznych parametrów systemu, mogą pomóc w udoskonaleniu systemu przez człowieka, np. programistę. W kontekście możliwej przebudowy układ taki jest więc bardziej godny zaufania niż układ nie dostarczający wyjaśnień.

Chociaż obydwa powiązane ze sobą czynniki – zdolność do generowania wyjaśnień i zdolność do uczenia się – uznaliśmy za pozytywnie wpływające na zaufanie, to trzeba zwrócić uwagę na inny, bardziej negatywny aspekt ich wzajemnej relacji. Otóż mechanizm uczenia się, a dokładniej zmiany powstające w wyniku jego działania,  uznaje się za jedną z głównych przyczyn nieprzejrzystości poznawczej systemów informatycznych oraz trudnej interpretowalności uzyskiwanych przezeń wyników [Zednik 2021], [Stacewicz, Greif, 2021]. Typowy proces narastania nieprzejrzystości polega na tym, że w efekcie uczenia się do systemu są wprowadzane pewne techniczne parametry, które mają na celu dostosowanie działania systemu do wymogów realizowanego zadania, nie pozwalają natomiast uchwycić istotnej i zrozumiałej dla człowieka relacji między danymi a wynikami. Problem ten pogłębia się, gdy proces uczenia się zależy istotnie od kroków losowych, które (ponownie) mają zapewnić efektywność systemu, nie zaś przejrzystą dla człowieka formę wyjaśnienia. Okazuje się zatem, że chociaż zdolność do uczenia się skutkuje poprawą jakości działania systemu i jako taka wzmacnia relację zaufania, to w przypadku pewnych form uczenia się – takich mianowicie, które prowadzą do nieprzejrzystości poznawczej układu – relacja zaufania zostaje osłabiona.

Narzucającym się rozwiązaniem tego problemu jest powiązanie uczenia się z wyjaśnianiem w taki sposób, aby w obydwa procesy był zaangażowany ten sam mechanizm monitorowania pracy systemu. Z jednej strony, wyniki działania tego mechanizmu, czyli rejestrowane zmiany systemu, byłyby podstawą uczenia się (korzystnych zmian w systemie), a z drugiej strony, byłyby one wykorzystywane w procesie wyjaśniania (odnoszącym się również do stanów wewnętrznych systemu).

(…)

Jeszcze raz zachęcam wszystkich do dyskusji :).

W dalszej rozmowie mogą okazać się przydatne również pewne dodatkowe materiały:

1)  The “black box” metaphor in machine learning
2)  Fragment mojej książki, dotyczący problemu czarnej skrzynki
3)  Starszy wpis w blogu o przejrzystości poznawczej systemów algorytmicznych

Paweł Stacewicz

Zaszufladkowano do kategorii Dydaktyka logiki i filozofii, Epistemologia i ontologia, Etyka, Filozofia informatyki, Filozofia nauki, Światopogląd informatyczny | 26 komentarzy

Jakie cechy sztucznej inteligencji miałyby świadczyć o jej inteligencji?

Od systemów sztucznej inteligencji (SI) oczekujemy coraz więcej…
Na przykład: wiarygodności, życzliwości (w tej sprawie zobacz poprzedni wpis),  działań budzących zaufanie czy przestrzegania etycznych norm.
Świadczy to niewątpliwie o tym, że inteligencja systemów SI stała się dla nas czymś oczywistym, naturalnym, nie budzącym wątpliwości. Podobnie jak w stosunku do ludzi, przyjmujemy za oczywiste, że system wykazuje inteligencję, a przyjmując to, idziemy o krok dalej. Stawiamy wymagania dotyczące możliwych sposobów jej wykorzystania, w tym takich, które są dla nas potencjalnie niebezpieczne.
Przykładowo: jeśli system SI zastępuje lekarza lub prawnika, a więc dokonuje odpowiednich ekspertyz i dochodzi do trafnych decyzji, to oczekujemy, by decyzje te spełniały pewne dodatkowe warunki — były opatrzone przejrzystymi dla nas uzasadnieniami, nie godziły w nasze prawa, nie naruszały ogólnie przyjętych norm moralnych itp… Oczekiwania te mają psychologiczny sens pod warunkiem, że systemowi przypisujemy – niejako domyślnie – tego rodzaju zdolności, które w odniesieniu do ludzi nazywamy „inteligencją”.

Czy faktycznie jednak kwestia inteligencji systemów SI jest zamknięta?
W szczególności: czy definiując inteligencję sztuczną na podobieństwo naturalnej, mamy jasność co do typów zdolności, które świadczą o jej istnieniu i pozwalają mierzyć jej poziom?
Która ze zdolności jest tu najważniejsza:  zdolność do rozwiązywania problemów (w domyśle: wystarczająco trudnych),  umiejętność uczenia się, czy może kreatywność i ogólnie pojęte zdolności twórcze…?

A może strategia  definiowania inteligencji, poprzez wskazywanie konstytuujących ją cech (zdolności) prowadzi donikąd? Być może trzeba postąpić tak, jak jeden z pionierów badań nad SI, Marvin Minsky, który charakteryzując nowo-powstającą dyscyplinę, użył  takiego oto  określenia: „Nauka o maszynach realizujących zadania, które wymagają inteligencji wtedy, gdy są wykonywane przez ludzi”.
Poprzez cytowane stwierdzenie Minsky ominął sprytnie pytanie o to, na czym polega inteligencja, czyli jakie cechy ją konstytuują. Zamiast na nie odpowiadać, wystarczy stworzyć katalog problemów, do których rozwiązania jest niezbędna – tak czy inaczej pojęta – ludzka inteligencja. Jeśli maszyny będą potrafiły tym problemom sprostać, będziemy mogli je określić mianem inteligentnych.

Proponuję zastanowić się wspólnie nad różnymi możliwymi strategiami definiowania i rozpoznawania sztucznej inteligencji.
Pytanie główne brzmi: Jakie cechy konstytutywne winna posiadać sztuczna inteligencja?
Ewentualnie, przyjmując strategię Minsky’ego: Jakiego typu problemy powinna rozwiązywać?

Jako materiał pomocniczy do rozmowy proponuję pewien swój tekst, zaczerpnięty z książki „Umysł a modele maszyn uczących się…”. Zwracam w nim uwagę na fakt, że na polu psychologii problem definiowania i pomiaru inteligencji jest wciąż otwarty. Czynię to z intencją uświadomienia czytelnikowi, że ten sam problem dotyczy systemów sztucznych — o których coraz częściej sądzimy, że posiadają inteligencję.

A oto wspomniany tekst (po minimalnych zmianach):

<< Próbując definiować sztuczną inteligencję – czy to jako dyscyplinę naukową, czy to jako pewną właściwość systemów informatycznych – jako naturalny „układ odniesienia” przyjmuje się najczęściej inteligencję ludzką. Czyniąc tak, zakłada się domyślnie, że istnieje jakaś ogólnie przyjęta wykładnia tej ostatniej. Tymczasem, jak dotychczas, ani na polu psychologii, ani na polu neurofizjologii, ani na polu innych nauk o człowieku nie udało się wypracować żadnego powszechnie obowiązującego ujęcia inteligencji. Przeważnie traktuje się ją jako zdolność do rozwiązywania problemów – zdolność stopniowalną i mierzalną za pomocą specjalnych testów (np. testów na IQ). Już tutaj jednak występują znaczne różnice zdań, co do struktury zdolności elementarnych (ich typów, liczby i wzajemnych powiązań), których miałyby dotyczyć niezbędne pomiary. Rozbieżności głębsze ogniskują się wokół następującej alternatywy: czy intelekt należy traktować jako już uformowany zespół umiejętności aktywizowanych w działaniu (tj. przy rozwiązywaniu problemów), czy też jako pewien wiedzotwórczy potencjał, odpowiedzialny za pozyskiwanie nowych umiejętności (tj. uczenie się nowych strategii rozwiązywania problemów). Zgodnie ze stanowiskiem pierwszym miarą inteligencji jednostki byłaby trudność wykonywanych zadań, zgodnie z drugim – stopień trudności materiału, który jednostka jest w stanie, na bazie dotychczasowej wiedzy, przyswoić. Okazuje się, że wielu psychologów opowiada się za stanowiskiem drugim, a tym samym podkreśla dynamiczny i otwarty charakter intelektu. Na przykład W. Stern traktuje inteligencję jako zdolność adaptacji do nowych warunków i do wykonywania nowych zadań, a G.A. Ferguson wprost jako zdolność do uczenia się. >>

Zapraszam wszystkich do dyskusji nad różnymi możliwymi sposobami definiowania i rozumienia inteligencji systemów sztucznych…

Paweł Stacewicz

Zaszufladkowano do kategorii Bez kategorii, Dydaktyka logiki i filozofii, Filozofia informatyki, Filozofia nauki, Światopogląd informatyczny, Światopogląd racjonalistyczny | 51 komentarzy

Turinga i Tarskiego nowoczesny paradygmat matematyki . Porównanie z ujęciem Kazimierza Trzęsickiego

­Witold Marciszewski

If a machine is expected to be infallible, it cannot also  be intelligent. – Alan Turing
Civilization advances by extending the number of important operations which  cannot be  performed without thinking about them.
– A. N. Whitehead

Przez paradygmat nauki rozumie się w artykule sposób jej uprawiania, praktykowany lub zalecany, przez określoną grupę uczonych. Należą do niego przyjmowane przez nich założenia ontologiczne i epistemologiczne (czyli filozofia danej dyscypliny) oraz strategie badań ujmowane w reguły metodologiczne.

Pojęcie więc paradygmatu jest opisowo-socjologiczne, przydatne w badaniach nad dziejami nauki, co w odniesieniu do nauk przyrodniczych czyni Profesor Kazimierz Trzęsicki w artykule „Paradygmat Turinga”, jak też – w odniesieniu do matematyki – autor obecnych rozważań. Pomimo tych różnych odniesień, mamy tu płaszczyznę do porównań, mianowicie wkład Alana Turinga w zasady uprawiania nauki.

wzajem środków rozwiązywania problemów matematycznych drogą dowodzenia. Jednym są reguły strukturalne, które służą do formalizacji czyli algorytmicznej mechanizacji procesu dowodzenia. Ich niezawodność jest oczywista z intuicyjnego punktu widzenia. Do nich zalicza Tarski regułę odrywania; w odcinku §4.4. podaję argument za jej niezawodnością rozważany w perspektywie ewolucyjno-biologicznej. Ma on wykazać niezawodność intuicji logicznej, niezbędnej do weryfikacji hipotez, w odróznieniu od zawodności intuicji odkrywczej (odcinki §4.4 i §4.5). Ta druga da się porównać z wyrocznią w sensie Turinga, której „wyroki” (akty intuicji) wymagają weryfikacji na gruncie intuicji logicznej. Ta odkrywcza nie jest nieomylna, lecz jej omylność jest nieodłączna od twórczych, a więc inteligentnych, poszukiwań badawczych (por. motto).
Tarski w swych fundamentalnych pracach [1933, 1936] wiele uwagi poświęca regule indukcji nieskończonej która nie należy do reguł strukturalnych, gdyż nie operuje algorytmicznie na ciągach symboli (jako obiektów fizycznych) lecz odwołuje się do pojęciowego ujęcia nieskończoności zbioru liczb naturalnych. Pomimo braku cechy algorytmiczności Tarski uważa ją za równie niezawodną jak reguły strukturalne, ponieważ przemawia za nią jej nieodzowność w rozwiązywaniu bardzo licznych i ważnych zagadnień matematyznych; temat ten jest tu dyskutowany w konkluzjach z odcinka §6.6.
Czy jest powód, żeby te zasady badań naukowych Turinga i Tarskiego, określać zaczerpniętym od Kuhna [1962] terminem „paradygmat”? Skąd pomysł, żeby kategoriach Kuhna rozpatrywać twórczość tych autorów, którzy drogą wyników  limitatywnych (w szczególności Gödla i Turinga) odmienili oblicze logiki, a nawet filozofii nauki? Zawdzięczam go inspirowaniu się artykułem Trzęsickiego „Paradygmat Turinga”; bez niego nie powstałaby obecna praca.
Przyjmując terminy „paradygmat” i „zmiana paradygmatu” (paradigm shift), jednocześnie dystansuję się od kuhnowskiego utożsamiania zmiany paradygmatu z rewolucją naukową. Normalny postęp w nauce, podobnie jak w gospodarce i polityce, jest kumulatywny i ewolucyjny. Bierze się z przemyślanych reform, a nie z rewolucyjnych zrywów, które do fundamentów burzą dawny system, żeby zbudować nowy wedle koncepcji doktrynerów. Taka wizja postępu nauki byłaby dla niej deprecjonująca.
Paradygmat Turinga-Tarskiego powstaje na przecięciu dwóch historycznych paradygmatów, z których jeden wiąże się z Kartezjuszem, drugi z Leibnizem. Nowość polega na płodnym scaleniu dwóch linii rozwojowych traktowanych wcześniej rozdzielnie. Precyzując pojęcie paradygmatu na skalę obecnych rozważań, wyróżniam w nim założenia ontologiczne, to jest, jakiego rodzaju indywidua tworzą uniwersum danej dziedziny. W ujęciu kartezjańskim indywidauami są stany umysłu, a w leibnizjańskim – napisy (jako przedmioty fizyczne) lub stany maszyny kodujące owe napisy (np. kodowanie cyfr w układach trybów kalkulatora Leibniza).
Tej różnicy ontologicznej odpowiada zróżnicowanie strategii badawczych czyli podejście metodologiczne. Strategie są określane przez reguły czyli zalecenia odpowiednich procedur. U Kartezjusza są to reguły kierowania umysłem (regulae ad directionem ingenii), u Leibniza – strukturalne reguły operowania symbolami.
Każde z tych ujęć, jako operujące jednym tylko uniwersum i jednym typem reguł można określić jako monistyczne, zaś uniwersum Turinga i Tarskiego jako dualistyczne: ma ono dwa uniwersa (kartezjańskie i leibnizjańskie) oraz dwa typy reguł – strukturalne (algorytmiczne), oraz takie jak reguła nieskończonej indukcji. Ta jest intuicyjna lecz także niezawodna dzięki potwierdzaniu się w niezliczonych płodnych zastosowaniach, bez których nie byłoby matematyki.
Ów charakter dualistyczny jest tym, co znamionuje nowoczesny paradygmat matematyki. Jest on w opozycji do takich mechanicystycznych monizmów, jak np. Wittgensteina i Koła Wiedeńskiego; obecnie zdaje się do nich należeć projekt silnej SI.
Dalszy ciąg tej historii to etap, w którym algorytmy uzyskane dzięki wyrocznej intuicji torują drogę nowym intuicjom. Te zaś nowym algorytmom, i tak dalej – działając na rzecz postępu cywilizacji (por. motto Whiteheada). Jest to proces bez kresu, toteż taki dynamiczny dualizm (intuicja vs algorytm) wnosi w ów proces cechę infinityzmu, obcą kierunkom mechanicystycznym.
Tarski wychodzi od pewnej obserwacji dotyczącej środków dowodowych, którym dał nazwę logicznych reguł strukturalnych. To znaczy takich, że dyktowane nimi operacje na formułach – jako ciągach symboli, każdy o takiej to a takiej strukturze – polegają na przekształcaniu tych struktur czysto mechanicznym, jak opuszczanie lub dopisywanie symboli. Taka jest procedura w czysto formalnym (czyli strukturalnym) prowadzeniu dowodu na papierze i taka sama procedura zapisywania symboli (zer, jedynek) na taśmie maszyny Turinga. W tym sensie dowodzenie lub obliczanie za pomocą samych reguł strukturalnych ma charakter mechaniczny.
Tarski zauważa, że – wbrew doktrynie i oczekiwaniom mechanicystów – reguły strukturalne nie starczą do uprawiania matematyki. To, co można przez nie uzyskać, to cząstka wielkiego skarbca wyników matematycznych. Oto myśl przewodnia artykułu [1936] (wersja w [1956, s. 411]).
Istnieją reguły dowodzenia różne od strukturalnych, które z intuicyjnego punktu widzenia są tak jak tamte nieomylne, tzn. prowadzące niezawodnie od zdań prawdziwych do prawdziwych, lecz nie dające się do tamtych sprowadzić („cannot be reduced”).
Szczególnie w tej klasie reprezentatywna jest zdaniem Tarskiego reguła indukcji nieskończonej. Za jej przyjęciem przemawia to, że umożliwia ona rozstrzyganie wielkiej liczby zagadnień, które na gruncie reguł strukturalnych są nierozstrzygalne. Przykładem teoria liczb, która swój imponujący zakres rozstrzygalności zawdzięcza regule indukcji. Ze względu na jej infinistyczny charakter, czyli z tego powodu, że obejmuje ona nieskończenie wiele tez, nigdy jej nie wydrukuje taka maszyna jak UMT. (zob. Tarski [1933], w wydaniu [1995] s. 149])
W tym punkcie zbiegają się drogi Tarskiego i Turinga. Trudno o lepszy przykład tego, czym jest, jak działa, oraz jak jest niezbędna w matematyce wyrocznia, niż ten przypadek, jaki stanowi reguła nieskończonej indukcji. Podobnie jak Turing za konieczne dla postępu matematyki uznaje komplementarność UMT i wyroczni, tak Tarski odnotowuje komplentarność reguł strukturalnych (typowych dla UMT) oraz tych reprezentowanych przez regułę indukcji.
Porównawczy charakter obecnych rozważań bierze się stąd, że Trzęsicki inne niż obecny artykuł wkłada treści w pojęcie paradygmatu Turinga. Przyjmując T. Kuhna pojęcie rewolucji naukowej w sensie radykalnej zmiany paradygmatu, ujmuje on dzieje nauki jako arenę dwóch rewolucji. W pierwszej paradygmat Arystotelesa został wyparty przez Galileusza; druga zaś rewolucja polega na zastąpieniu paradygmatu Galileusza przez turingowski. Za wynik tej zmiany paradygmatu Trzęsicki zdaje się uważać (jeśli dobrze rozumiem) kosmologię Konrada Zusego. Pojmuje ona Wszechświat jako samoprogramujący się automat komórkowy (równoważny UMT?).
Rodzi to listę pytań. Jak w kategoriach informatycznych określić w takim uniwersum miejsce ludzi? Czy są też automatami, będąc elementami tego giga-automatu? Czy te ludzkie komponenty są determinowane przez program będący dziełem Wszechświata? Czy algorytmiczność jego egzystencji skutkuje determinizmem? Jakby się on miał do determinizmu typu Laplace’a?
Szczególnie ważne jest pytanie: czy właściwości Wszechświata jako automatu komórkowego dopuszczają zachodzenie w nim procesów analogowych, na wzór procesów w ludzkim mózgu? Jeśli nie, to jak pogodzić istnienie we wewnętrzu Wszechświata elementów analogowych, jakimi są mózgi?
To nie koniec pytań, a ich wielość i waga jest miarą śmiałości ujęcia Trzęsickego, która czyni to ujęcie obiecującym tematem dyskusji na gruncie filozofii nauki.

Zaszufladkowano do kategorii Bez kategorii | Dodaj komentarz

O życzliwości w życiu, etyce i rozmyślaniach nad sztuczną inteligencją

Obecny wpis umieszczam w blogu w imieniu kolegów, dr Bartłomieja Skowrona i dr Marcina Rojszczaka, którzy wystąpili ostatnio na prowadzonym przeze mnie Seminarium z Filozofii Nauki, z intrygującym referatem pt. „Koncepcja życzliwej sztucznej inteligencji. Zagadnienia etyczne i prawne„.

W centrum referatu stało etyczne pojęcie życzliwości (w odróżnieniu od potocznego!) oraz jego rola w projektowaniu wiarygodnych, czyli budzących zaufanie użytkownika, systemów sztucznej inteligencji (SI). Projektowanie było rozumiane szeroko, również w kontekście czegoś, co można by nazwać „infrastrukturą legislacyjną” — a więc takim kształtem regulacji prawnych, które sprzyjałyby tworzeniu systemów życzliwych dla człowieka. W tym kontekście zostały przedstawione najnowsze projekty aktów prawnych Unii Europejskiej, dotyczące aktualnych i możliwych zastosowań SI. Prelegenci oceniali je krytycznie, zwracając uwagę na konieczność głębszego powiązania prawodawstwa z etyką życzliwości.

Tyle tytułem mojego wprowadzenia.

Jako właściwy wstęp do blogowej dyskusji proponuję krótki tekst samych prelegentów, którzy zarysowują etyczne pojęcie życzliwości i stawiają pewne pytania dotyczące życzliwej sztucznej inteligencji…
Powstał on spontanicznie, w efekcie rozmyślań nad spostrzeżeniami i komentarzami uczestników seminarium.

Gorąco zachęcam do rozmowy wszystkich czytelników bloga, nie tylko uczestników seminarium — Paweł Stacewicz

A OTO INICJUJĄCY DYSKUSJĘ TEKST PRELEGENTÓW:

Pojęcie życzliwości pojawia się zarówno w tekstach starożytnych (chociażby w Etyce Nikomachejskiej Arystotelesa), jak i zupełnie współczesnych (spośród tekstów polskich zasługują na uwagę pisma Marii Ossowskiej i Czesława Znamierowskiego). Część etyków, w szczególności etycy angielskiego oświecenia moralnego widzieli w życzliwości podstawę wszelkiej moralności i postulowali prawo o powszechnej obowiązywalności życzliwości.

Niemniej, gdy wspominamy o życzliwości przy okazji różnych publicznych dyskusji, najczęściej spotykamy się z pobłażliwym uśmiechem, który z jednej strony łaskawie i przyjaźnie wspiera ideę wołającą o powszechną życzliwość, a z drugiej strony lekceważąco odnosi się do siły i doniosłości życzliwości. Za tą spontaniczną pobłażliwością stoi takie mniej więcej rozumowanie: „przecież uprzejmość, serdeczność i empatia nie mogą stanowić jakieś trwałej podstawy dla realnych rozstrzygnięć moralnych. Jedni są mili, a inni nie są mili. I tyle w temacie życzliwości”.
W przeciwieństwie do takiej postawy twierdzimy, że życzliwość nie jest ani uprzejmością, ani serdecznością, ani empatią – choć z tymi fenomenami współwystępuje. Co więcej, ze względu na swą siłę oddziaływania ma istotne znaczenie dla projektowania systemów sztucznej inteligencji, na przykład takich, które byłyby używane w zarządzaniu, administracji publicznej czy systemie edukacji. Zatem to nie tyle w temacie!

Twierdzimy, że życzliwość nie jest ani uprzejmością, ani byciem miłym, ani empatią. Wspierając się Etyką Nikomachejską Arystotelesa przyjmujemy, że istotą życzliwości jest dbanie o dobro drugiej osoby: dokładnie o to, co jest właśnie dla tej osoby dobre.
Rodzic może być życzliwy dla dziecka, silnie motywując je do podejmowania działań, które służą jego rozwojowi — niezależnie od tego jednak, może być momentami nieuprzejmy. Podobnie urzędnik, załatwiając sprawę zgodnie z interesem obywatela, może (a nawet powinien!) być życzliwy, choć nie zawsze jest uprzejmy. Oczywiście, życzliwości często towarzyszą uprzejmość, empatia i serdeczność. Nie one jednak są istotą życzliwej postawy.

Wróćmy jednak do sztucznej inteligencji i jej zastosowań publicznych, takich jak publiczna administracja. Wywołując temat życzliwości SI, natykamy się również na pobłażliwe przytakiwanie, wsparte niejawnym sarkastycznym powątpiewaniem: tak, tak, mamy przecież zasadę życzliwej interpretacji w KPA a inteligentne automaty w urzędach, zgodnie z tą zasada, będą się do nas pięknie uśmiechać.
Wiarygodność obliczeniowa SI, niezależnie od jej konkretnych zastosowań, jest mierzona często jej przejrzystością, umiejętnością wyjaśniania podejmowanych decyzji, zgodnością tych decyzji z przewidywaniami itd. Niemniej, naszym zdaniem, nie jest to droga, która zaprowadzi nas do takiej SI, jakiej człowiek, w szczególności obywatel, będzie ufał.
Co z tego, że system jest przejrzysty, jeśli nie bierze pod uwagę interesu i preferencji samego obywatela? Nie jest to strategia, która gwarantuje spełnienie oczekiwań UE w stosunku do SI. Dopiero uwzględnienie życzliwości (i stojących za nią rozwiązań technicznych), pozwoli na wypracowanie takiego modelu prawnego i funkcjonalnego SI w zastosowaniach publicznych, który spełni oczekiwania pokładane w wiarygodnej SI.

Życzliwość SI to nie jest uśmiech robota upodabniającego się do człowieka (taki robot zresztą, im bardziej przypomina człowieka, tym bardziej budzi jego nieufność). SI, jeśli ma być wiarygodna w zastosowaniach publicznych, to powinna być życzliwa, a to oznacza, że powinna brać pod uwagę dobro obywatela.

Zapraszamy do dyskusji – Bartłomiej Skowron i Marcin Rojszczak.

Zaszufladkowano do kategorii Etyka, Filozofia informatyki, Retoryka, Światopogląd informatyczny | 36 komentarzy