{"id":11919,"date":"2025-03-13T11:12:31","date_gmt":"2025-03-13T10:12:31","guid":{"rendered":"https:\/\/marciszewski.eu\/?p=11919"},"modified":"2025-09-23T02:43:13","modified_gmt":"2025-09-23T00:43:13","slug":"obszerne-modele-jezyka-llm-i-co-dalej","status":"publish","type":"post","link":"https:\/\/marciszewski.eu\/?p=11919","title":{"rendered":"Obszerne modele j\u0119zyka (LLM) i co dalej&#8230;"},"content":{"rendered":"<p>Oko\u0142o dw\u00f3ch miesi\u0119cy temu na <a href=\"https:\/\/marciszewski.eu\/?page_id=8381\" target=\"_blank\" rel=\"noopener\">Seminarium Filozofii Nauki<\/a> w Politechnice Warszawskiej go\u015bcili\u015bmy Profesora <strong>Andr\u00e9 W\u0142odarczyka<\/strong>, kt\u00f3ry z perspektywy swoich teorii semantycznych om\u00f3wi\u0142 szereg zagadnie\u0144 zwi\u0105zanych z prze\u0142omow\u0105 dla rozwoju sztucznej inteligencj\u0105 koncepcj\u0105 <strong>modeli LLM<\/strong> (Large Language Models).<br \/>\nMy\u015bl\u0119, \u017ce warto dotkn\u0105\u0107 tych zagadnie\u0144 r\u00f3wnie\u017c w blogu.<br \/>\nZa punkt wyj\u015bcia dyskusji niech pos\u0142u\u017cy nam <strong>poszerzony abstrakt<\/strong> wyg\u0142oszonego na seminarium referatu. Zach\u0119cam, aby odnie\u015b\u0107 si\u0119 zar\u00f3wno do kwestii w nim poruszonych, jak r\u00f3wnie\u017c innych kwestii, kt\u00f3re pojawiaj\u0105 si\u0119 na pograniczu lingwistyki, informatyki i filozofii nauki.<\/p>\n<p><span style=\"color: #800080;\">*********\u00a0 <strong>A OTO ABSTRAKT SEMINARYJNEGO REFERATU<\/strong>\u00a0 ********<\/span><\/p>\n<p><span style=\"color: #800080;\">Od kilku lat <strong>modele LLM<\/strong> (Large Language Models) robi\u0105 furor\u0119 w internecie, poniewa\u017c prezentowane s\u0105 jako przejawy &#8222;Sztucznej Inteligencji&#8221;, a dok\u0142adniej: sztucznego my\u015blenia w j\u0119zykach naturalnych. Czym wi\u0119c LLM-y s\u0105 oraz do czego mog\u0105, ale i do czego nie mog\u0105 s\u0142u\u017cy\u0107 w praktycznych zastosowaniach zw\u0142aszcza podczas bada\u0144 naukowych. Jak dosz\u0142o do tego, \u017ce mo\u017cliwo\u015b\u0107 <em>przek\u0142adu automatycznego<\/em> i nawet <em>dialogu cz\u0142owieka z maszyn\u0105<\/em>, poprawnego w j\u0119zykach naturalnych, pojawi\u0142a si\u0119 tak szybko, bo ok. <sup>3<\/sup>\/<sub>4<\/sub> wieku po zbudowaniu pierwszych komputer\u00f3w?<\/span><\/p>\n<p><span style=\"color: #800080;\">W referacie nie b\u0119dzie mowy ani o szczeg\u00f3\u0142ach dotycz\u0105cych wyuczania (training) <em>g\u0142\u0119bokich sieci neuropodobnych<\/em> (Deep Neural Networks &#8211; DNN) ani o licznych algorytmach zwanych <em>transformerami,<\/em> kt\u00f3re w po\u0142\u0105czeniu z DNN tworz\u0105 obecne LLM-y. Jednak\u017ce wska\u017c\u0119 na zaawansowane programy badawcze zar\u00f3wno takie, kt\u00f3re nale\u017c\u0105 ju\u017c do tradycji bada\u0144 nad przetwarzaniem j\u0119zyk\u00f3w naturalnych (NLP) jak i takie, kt\u00f3re stanowi\u0105 podstawy do budowania nieodzownych dla LLM-\u00f3w transformer\u00f3w w r\u00f3\u017cnych postaciach najnowszych rozwi\u0105za\u0144.<\/span><\/p>\n<p><span style=\"color: #800080;\">Ponadto referat b\u0119dzie tak\u017ce pr\u00f3b\u0105 wprowadzenia w problematyk\u0119 <strong>og\u00f3lnego j\u0119zykoznawstwa<\/strong>, kt\u00f3rego sedna mo\u017cna si\u0119 dopatrywa\u0107 w trudno\u015bciach, z jakimi borykaj\u0105 si\u0119 dzisiaj nie tylko lingwi\u015bci, ale naukowcy, kt\u00f3rych obszary zainteresowa\u0144 s\u0105 mi\u0119dzy innymi zawarte w pytaniach takich, jak:<\/span><\/p>\n<p><span style=\"color: #800080;\"><em>&#8211; czy mo\u017cliwe jest sformu\u0142owanie definicji j\u0119zyka jako przedmiotu w rzeczywisto\u015bci j\u0119zykowej w taki spos\u00f3b, \u017ceby m\u00f3g\u0142 si\u0119 sta\u0107 obiektem nauk \u015bcis\u0142ych?<\/em><\/span><\/p>\n<p><span style=\"color: #800080;\"><em>&#8211; czy w sk\u0142ad gramatyk ok. 7.000 j\u0119zyk\u00f3w \u015bwiata wchodz\u0105 regu\u0142y i struktury, kt\u00f3re s\u0105 jednakowe dla nich wszystkich?<\/em><\/span><\/p>\n<p><span style=\"color: #800080;\"><em>&#8211; czy cz\u0142owiek my\u015bli w j\u0119zyku naturalnym czy te\u017c w jakim\u015b specyfiznym j\u0119zyku my\u015bli?<\/em><\/span><\/p>\n<p><span style=\"color: #800080;\">Badania nad j\u0119zykiem we wszystkich dziedzinach nauki i jego wytworami trwaj\u0105 wi\u0119c nadal, tym bardziej, \u017ce wiedza o j\u0119zyku (cho\u0107 w niekt\u00f3rych przypadkach skuteczna bardziej ni\u017c kiedykolwiek), jest dla nas niedost\u0119pna w sensie poj\u0119ciowym i inferencyjnym. Tw\u00f3rczo\u015b\u0107 w nauce nie polega jednak na <em>&#8222;halucynacjach&#8221;<\/em>, lecz wymaga generowania nowych pomys\u0142\u00f3w, odkry\u0107 i rozwi\u0105za\u0144, kt\u00f3re poszerzaj\u0105 nasz\u0105 wiedz\u0119 i zrozumienie \u015bwiata.<\/span><\/p>\n<p><span style=\"color: #800080;\">S\u0142owem: skoro LLM-y s\u0105 pozamykane w czarnych skrzynkach &#8211; to pozostaje nam nieb\u0142ahe zadanie do wykonania: <strong>rozbi\u0107 czarn\u0105 skrzynk\u0119. <\/strong>Wska\u017c\u0119 na wa\u017cniejsze projekty badawcze w tej materii oraz przedstawi\u0119 w og\u00f3lnym zarysie inicjatyw\u0119 opracowania komputerowych metod celem zbudowania narz\u0119dzi s\u0142u\u017c\u0105cych do zinformatyzowania bada\u0144 lingwistycznych w ramach <strong>O\u015brodka bada\u0144 nad lingwistyk\u0105 teoretyczn\u0105 i stosowan\u0105<\/strong> (<em>Centre de linguistique th\u00e9orique et appliqu\u00e9e<\/em> &#8211; CELTA) na Sorbonie w latach 2004-2014.<\/span><\/p>\n<p><span style=\"color: #800080;\">To w\u0142a\u015bnie w ramach tej inicjatywy powsta\u0142y teorie Meta-informative Centering (MIC) i (Associative Semantics (AS), kt\u00f3re zosta\u0142y po\u0142\u0105czone i rozwini\u0119te pod og\u00f3ln\u0105 nazw\u0105 <strong><em>Distributed Grammar <\/em><\/strong>(<em>Gramatyka Rozproszona<\/em>). Om\u00f3wi\u0119 w szczeg\u00f3\u0142ach m.in. teori\u0119 <em>uog\u00f3lnionej predykacji<\/em>, jako \u017ce &#8211; z jednej strony &#8211; stanowi ona rozwi\u0105zanie od tysi\u0105cleci znanego problemu filozoficznego &#8211; za\u015b z drugiej strony &#8211; wyja\u015bnia, w jaki spos\u00f3b \u201ecentra uwagi\u201d (CA) czy attencje strukturyzuj\u0105 wypowiedzi, kt\u00f3re kieruj\u0105 skupianiem uwagi rozm\u00f3wc\u00f3w. Jest to zgodne z pogl\u0105dem na uwag\u0119 jako selektywnym mechanizmie w komunikacji j\u0119zykowej w ramach urz\u0105dze\u0144 LLM.<\/span><\/p>\n<p><span style=\"color: #800080;\"><strong>Zalecane LINKI<\/strong><\/span><\/p>\n<p>2010 <a href=\"https:\/\/www.researchgate.net\/publication\/50809635_Time_for_a_sea-change_in_linguistics_Response_to_comments_on_'The_Myth_of_Language_Universals'\">Time for a sea-change in linguistics<\/a><\/p>\n<p>2013 <a href=\"https:\/\/www.researchgate.net\/publication\/260580718_Meta-informative_Centering_in_Utterances_-_Between_Semantics_and_Pragmatics\">Meta-informative Centering in Utterances<\/a><\/p>\n<p>2016 <a href=\"https:\/\/www.researchgate.net\/publication\/315254364_O_Pragmatycznej_naturze_predykacji_About_the_Pragmatic_Nature_of_Predication_PAPER_IN_POLISH\">O Pragmatycznej naturze predykacji<\/a><\/p>\n<p>2015 <a href=\"https:\/\/www.researchgate.net\/publication\/312602113_Informatyka_szansa_na_rozwoj_naukowej_lingwistyki_Computer_Science_as_an_Opportunity_for_the_Development_of_Scientific_Linguistics_PAPER_IN_POLISH\">Informatyka szans\u0105 na rozw\u00f3j naukowej lingwistyki<\/a><\/p>\n<p>2022 <a href=\"https:\/\/www.researchgate.net\/publication\/367025051_Concepts_and_Categories_A_Data_Science_Approach_to_Semiotics\">Concepts and Categories: A Data Science Approach to Semiotics<\/a><\/p>\n<p><span style=\"color: #800080;\">******************************************************************<\/span><\/p>\n<p>Najserdeczniej <strong>zapraszamy do dyskusji<\/strong> &#8212; Andr\u00e9 W\u0142odarczyk i Pawe\u0142 Stacewicz.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Oko\u0142o dw\u00f3ch miesi\u0119cy temu na Seminarium Filozofii Nauki w Politechnice Warszawskiej go\u015bcili\u015bmy Profesora Andr\u00e9 W\u0142odarczyka, kt\u00f3ry z perspektywy swoich teorii semantycznych om\u00f3wi\u0142 szereg zagadnie\u0144 zwi\u0105zanych z prze\u0142omow\u0105 dla rozwoju sztucznej inteligencj\u0105 koncepcj\u0105 modeli LLM (Large Language Models). My\u015bl\u0119, \u017ce warto &hellip; <a href=\"https:\/\/marciszewski.eu\/?p=11919\">Czytaj dalej <span class=\"meta-nav\">&rarr;<\/span><\/a><\/p>\n","protected":false},"author":3,"featured_media":0,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[1,20,42,8,49],"tags":[],"class_list":["post-11919","post","type-post","status-publish","format-standard","hentry","category-bez-kategorii","category-filozofia-informatyki","category-filoz-nauki","category-informatyzm","category-racjonalizm"],"_links":{"self":[{"href":"https:\/\/marciszewski.eu\/index.php?rest_route=\/wp\/v2\/posts\/11919","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/marciszewski.eu\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/marciszewski.eu\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/marciszewski.eu\/index.php?rest_route=\/wp\/v2\/users\/3"}],"replies":[{"embeddable":true,"href":"https:\/\/marciszewski.eu\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=11919"}],"version-history":[{"count":6,"href":"https:\/\/marciszewski.eu\/index.php?rest_route=\/wp\/v2\/posts\/11919\/revisions"}],"predecessor-version":[{"id":12479,"href":"https:\/\/marciszewski.eu\/index.php?rest_route=\/wp\/v2\/posts\/11919\/revisions\/12479"}],"wp:attachment":[{"href":"https:\/\/marciszewski.eu\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=11919"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/marciszewski.eu\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=11919"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/marciszewski.eu\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=11919"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}