§1. Wstępne próby definiowania. Pastuszek struga z kory wierzbowej fujarkę, żeby grać liryczne melodie swej pasterce. Czy jest to czynność przetwarzania informacji? Jest to niewątpliwie przetwarzanie kawałka materii, ale na tym odpowiedź się nie kończy, bo przetwarzanie polega tu na daniu nowej formy. Jest to więc czynność formowania, którą w języku Arystotelesa i scholastyków oddawano terminem informatio. Czy brać tę etymologię na serio — w tym sensie, że przetwarzając formę zwitka kory na formę instrumentu pastuszek przetwarza informację? Zostawmy to pytanie scholastykom i podejdźmy do sprawy od innej strony.
Zwitek kory obrabiany przez pastuszka jest w teorii Shannona reprezentowany przez pewną liczbę bitów informacji. Niezbyt jest kształtny, czyli forma w nim uboga, nie jest to więc liczba imponująca. Wzbogaci się ona po nadaniu drewnu kształtu fujarki, czyli przybędzie tu bitów. A to dlatego, że najkrótszy słowny opis fujarki będzie dłuższy od najkrótszego opisu użytego do niej materiału; ten drugi bowiem będzie częścią pierwszego, a do tego dojdzie opis struktury i funkcji (dalece innej niż np. struktura i funkcja bębna bojowego). Skoro mamy zwiększenie liczby bitów, czyż nie dokonał się akt przetwarzania informacji?
Filozoficznie rzecz biorąc, nie bardzo wiadomo, dlaczego odpowiedź nie miałaby być twierdząca. Zrezygnujemy z niej jednak ze względów praktycznych, żeby pojęcie przetwarzania informacji nie stało się kłopotliwie rozdęte. Choćby przez to, że objęłoby ono całą wytwórczość rzemieślniczą, i przemysłową, i jeszcze dużo więcej; wszak powszechny podatek VAT bierze się z większej „informatywności” produktu bardziej przetworzonego niż ma ją produkt wyjściowy, mniej przetworzony.
Skoro w argumentacji tyczącej się wzrostu liczby bitów odwołujemy się do długości opisu, a więc do pewnego tekstu, to sama narzuca się myśl, żeby za przedmiot przetwarzania informacji uznać wszelkie teksty. Wszelkie? A może tylko pisane, bo w przypadku mówionych trudno zidentyfikować produkt przetwarzania, gdzieś się on rozpływa w powietrzu (scripta manent, verba volant — mówi łacińska maksyma).
Pisane, ale jak? W jakim kodzie? Czy uwzględnić także zapisy w kodzie neuronowym albo w language of thought w sensie Jerry Fodora? Gdy prowadzę jakieś obliczenia w pamięci, czy w ten sposób przetwarzam informację? Trudno zaprzeczyć, ale trudno też wskazać na uchwytny tekst. Jeszcze trudniej, gdy wziąć pod uwagę zachowania pierwotniaków. Jeden z nich zwany błyszczką (euglena viridis) odbiera specjalną plamką impuls świetlny (co wskazuje kierunek, w którym trzeba się udać po energię fotosyntezy) i przetwarza go na polecenie sterowania wicią w pożądanym kierunku. Nie jest to jednak coś, co dałoby się umieścić na półce bibliotecznej. Co więcej, ten proces biologiczny ma zarazem charakter wyraźnie chemiczny, trzeba by więc także w reakcjach chemicznych dopatrywać się przetwarzania informacji.
§2. Do czego potrzebna jest nam refleksja nad przetwarzaniem informacji? Od początku swego istnienia gatunek ludzki zajmuje się przetwarzaniem materii (na żywność, ubrania, domy, oręż etc.) jak i przetwarzaniem informacji. To drugie w dokonywanych na każdym kroku rozumowaniach, obliczeniach, aktach instruowania i perswadowania etc. Przez tysiąclecia robiono jedno i drugie z niemałym powodzeniem, nie dysponując ogólną teorią przetwarzania materii ani ogólną teorią przetwarzania informacji. Wystarczały opracowania, jak to robić dla poszczególnych celów. Co się tyczy informacji, zajmowały się tym od starożytności logika, gramatyka i retoryka. Na ogólną teorię przetwarzania materii nadal nie ma zapotrzebowania, z powodzeniem nam wystarczają różnorakie technologie specjalistyczne. Skąd więc w naszych czasach taka potrzeba w odniesieniu do informacji?
Powody są co najmniej dwa. Jednym jest to, że przetwarzanie materii — dla zaspokojenia rosnących z gwałtownym przyspieszeniem potrzeb w sferze konsumpcji, zdrowia, bezpieczeństwa itd. — w coraz większym stopniu zależy od sukcesów w przetwarzaniu informacji, mianowicie od postępu nauk, tak teoretycznych jak i stosowanych. Łącznie tworzą one gigantyczną fabrykę przetwarzania informacji, a od jej wydajności coraz bardziej zależy los cywilizacji. Teoria informacji, w tej części, która się pokrywa z metodologią nauk, jest potrzebna w rozwiązywaniu dylematu, jak maksymalizować jednocześnie dwie wielkości tak przeciwstawne, że jedna jest odwrotnością drugiej, mianowicie informację i prawdopodobieństwo (ten dylemat jest np. osią twórczości Karla Poppera). W tym celu trzeba nam ogólniejszej refleksji nad naturą informacji — jej pomiarem, kryteriami wiarogodności etc.
Na drugi powód rzuca światło pewna analogia z energią, mianowicie z pojawieniem się maszyn do jej przetwarzania. Nie znano takich maszyn po wiek XIX, choć proste maszyny do przetwarzania materii (obrabiarki), jak młyny, prasy czy krosna były obecne już we wczesnych fazach cywilizacji. Tym się to tłumaczy, że z taką materią, jak kamień, drewno czy rośliny ma się do czynienia w codziennym doświadczeniu, więc do poznawania jej podatnych na obróbkę właściwości nie trzeba było specjalnych instrumentów ani teorii. Energia natomiast jest żywiołem bardziej tajemnym, występuje w różnych niedostępnych oku postaciach, toteż przetwarzanie przez silniki jednej postaci w inną, bardziej użyteczną, wymagało takiego poziomu nauk, jaki przyniosła dopiero nowożytność i to nie od razu. Na ten rewelacyjny zestaw złożyły się termodynamika, chemia, teoria elektromagnetyzmu, wreszcie fizyka cząstek elementarnych.
Maszyny do przetwarzania informacji — komputery — pojawiły się wiek później, a wymagało to, podobnie jak w przypadku silników, wysoce zaawansowanych abstrakcyjnych teorii (algebra Boole’a, logika matematyczna itp). W obu też przypadkach słowo”przetwarzanie” rozumiemy inaczej niż w sensie potocznym (który dopuszcza, by przetwarzaniem nazywać też transformacje destrukcyjne, np. rozbiórkę części budynku).
by przetworzeniem nazw nie jakiekolwiek transformacje, lecz takie, które są pożądane (nie interesuje nas np. takie np. przetwarzanie, jakim jest deformacja jakiejś wiadomości powstała w toku przetwarzania w łańcuchu plotek). Trzeba więc w teorii przetwarzania informacji określić ów zamierzony punkt odniesienia. W wiekowej tradycji logiki określa się go jako przeniesienie prawdziwości informacji zawartej w przesłankach na informację we wniosku — łac. salva veritate. Ten warunek, nazwijmy go SV (od owego zwrotu),
sie logicznym, tj. jako jednoznacznego przyporządkowania wartości funkcji do jej argumentu). To pierwsze
, idąc śladem odwiecznej tradycji logicznej, jako przekształcanie salva veritate, czyli z zachowaniem prawdziwości danych wejściowych (przesłanek), która powinna być transmitowana na dane wyjściowe (wnioski).
Pierwsze pomysły maszyn do przetwarzania informacji pojawiły się w wieku XVII, ale żeby mogły one wyjść poza gazę ręcznych kalkulatorów mechanicznych na cztery działania, trzeba było czekać na taki stan techniki oraz matematyki (algebra, logika matematyczna), jaki zaistniał w wieku XX. Dopiero ten poziom rozwoju umożliwia konstruowanie komputerów — maszyn do wielkoskalowego przetwarzania informacji. Jednocześnie coraz liczniejsze zjawiska będące przedmiotem nauk empirycznych staje się na tyle dobrze rozpoznane, ze umożliwia to ich opis ilościowy, a wraz z tym symulacje obliczeniowe w wykonaniu komputerów.
rzy takich różnych zastrzeżeniach, trzeba nadal poszukiwać odpowiedzi. Cennego do niej materiału dostarcza książka Marcina Miłkowskiego Explaining the Computational Mind (2013, MIT Press). Blogowy nad jej propozycjami dyskurs jest ułatwiony przez okoliczność, że kilka jej streszczeń, na różnych poziomach szczegółowości, jest dostępnych elektronicznie w Sieci. Można więc wstępnie podjąć tu dyskusję, bez potrzeby uprzedniego streszczania książki. Jedno sprawozdanie dał Autor na własnej stronie poświęconej książce, inne – na na stronie MIT Press, gdzie zachęcają do myślenia nad książką także dołączone do abstraktu opinie specjalistów. Do tego dochodzi obszerny konspekt do wykładu na tenże temat prowadzonego przez Autora w Instytucie Filozofii UW.
Na problem obecnego szkicu naprowadza następująca wypwiedź Autora na końcu rozdziału 1 (s.24). I propose that the notions of computation and information processing be used interchangeably. Nazwijmy ją Deklaracją Miłkowskiego, w skrócie DM, i zapiszmy zwięźle jako równość:
[DM] Przetwarzanie informacji = Obliczanie.
Znak równości jest tu symbolem pokrywania się zakresów (nie znaczeń).
W tym punkcie pojawia się pierwsze z serii pytań, które czytelnik chciałby zadać Autorowi. Oznaczał je będę skrótem PA z następującym dalej numerem pytania, np. PA.1. Nie zmienia tej strategii okoliczność, że będę tam, gdzie to możliwe, sam doszukiwał się odpowiedzi w tekście odpowiedzi Autora; taka próba jest hipotezą interpretacyjną którą Autor może potwierdzić lub zanegować. A oto pierwsze z pytań.
PA.1: Czy DM jest (1) definicją, w której jeden z terminów definiuje się przez drugi, czy (2) zdaniem syntetycznym, w którym sens obu stron równości jest znany skądinąd, i stwierdzamy empirycznie identyczność zakresów?
Wywód w rozdziale 2 w odcinku 4 pt. „Information Processing and Computation” (s.42-51), prowadzi do opcji (1), z następującym uszczegółowieniem OA.1: DM jest definicją obliczania, w której role definiensa pełni pojęcie przetwarzania informacji.
Taki wydaje się być sens następującego zdania podsumowującego uprzednią argumentację: „This characterization of computations in terms of information processing is very broad” (s.47) – o ile zwrot „characterization in terms” rozumieć jako synonim zwrotu „definition in terms”. To samo wyraża zwięzłe stwierdzenie: „So computation is simply information processing” (s.46).
§2. Drugie z moich pytań do Autora bierze się z próby interpretacji następującego zdania”: „Computation is a kind of flow of information, in at least the most general sense of the latter idea” (s.46). Na czym polega ów najbardziej ogólny sens pojęcia przetwarzania informacji (czyli strumienia przekształceń informacji – „flaw of information”)? Podejdźmy do sprawy na dwa sposoby. Najpierw zapytamy o najogólniejszy sens terminu „obliczanie”, to bowiem dzięki równości DM w §1, wskaże nam też możliwie największy zakres terminu „przetwarzanie informacji” (o drugim sposobie – za chwilę).
W tym celu stawiamy najpierw pytanie pomocnicze: czy Autor zgadza się, że ex definitione obliczenie jest to znajdowanie wartości funkcji – przy szerokim rozumieniu funkcji jako relacji jednoznacznej? Jeśli tak, to dokonajmy jeszcze jednego rozszerzenia. Tego mianowicie, które zawdzięczamy Turingowi: że istnieją funkcje nieobliczalne, tj. takie, których wartościami są liczby nieobliczalne (Turing 1936), oraz że przynajmniej niektóre z nich dadzą się rozpoznać drogą intuicji (Turing 1939). Treściwą informację o tym drugim wyniku podaje Andrew Hodges w encyklopedycznym artykule o Turingu.
Stąd, przy założeniu DM, dostaniemy maksymalnie szerokie określenie: Przetwarzanie informacji jest to znajdowanie wartości funkcji, określonych w zbiorze informacji i przybierających wartości z tego zbioru, nie wyłączając funkcji nieobliczalnych. Wzorcowym przykładem informacji będącej wartością funkcji nieobliczalnej jest nierozstrzygalne zdanie arytmetyczne zwane gödlowskim.
Zestawmy to z możliwie najszerszym potocznym pojęciem przetwarzania informacji. Nie jest to zwrot, którego byśmy często używali na co dzień, ale że jego składniki powszechnie są zrozumiałe, łatwo też chwytamy sens złożenia – przy rozumieniu słowa „informacja” jako „wiadomość”. Każdy wie, co to jest przetwarzanie rozumiane szeroko, to jest, niezależnie od tego, co się przetwarza, jakim sposobem, i co z tego wychodzi (owocem tej wiedzy jest m.in. idea VAT jako podatku od wzrostu wartości towaru uzyskiwanej w wyniku kolejnych jego przetworzeń). Przetworzenia produktu nazywamy też przekształceniami, a w tej drugiej wersji da się sformułować ważne pytanie: Czy do kategorii przekształceń (z łac. – transformacji) należą też zniekształcenia (z łac. – deformacje), które w skrajnym przypadku są tym samym, co unicestwienia?
Te ogólne prawidłowości, i rodzące się z nich pytania, dotyczą też jako szczególnego przypadku, przekształcania informacji (w sensie – wiadomości). Mam więc pytanie: czy deformacja wiadomości jest także jej przetworzeniem? W sytuacji, gdy (jak postuluje Autor), mamy operować najszerszym pojęciem przetwarzania informacji należałoby odpowiedzieć twierdząco. Czy jednak da się to pogodzić z pojęciem przetwarzania informacji jako obliczania w sensie procesu znajdowania wartości funkcji?