Stylistyka komputerowa
Garść projektów powstałych w środowisku grupy badawczej Computational Stylistics Group, zajmującej się analizą tekstu za pomocą metod statystycznych, stylometrią, atrybucją autorską, analizą wydźwięku i podobnymi zagadnieniami.
Przedsięwzięcia grupy badawczej Computational Stylistics Group można by z grubsza nazwać analizą tekstu za pomocą metod kwantytatywnych czy też, jeszcze bardziej z grubsza, tekstocentryczną humanistyką cyfrową. Należą do nich wspomniane już w innych miejscach tej witryny pakiet ‘stylo’, metoda Rolling Stylometry, wreszcie metoda Bootstrap Consensus Networks, ale także kilka innych projektów, w których również miałem swój udział. Poniżej zamieszczam mocno skróconą ich listę, zapraszając do kliknięcia w odpowiednie linki prowadzące do strony Computational Stylistics Group, gdzie znajdują się solidniejsze opisy (w języku angielskim):
-
Wielkoskalowa analiza tekstu to pięcioletni projekt badawczy finansowany ze środków Narodowego Centrum Nauki (SONATA-BIS 2017/26/E/HS2/01019), afiliowany przy Instytucie Języka Polskiego PAN. Jego celem jest wypracowanie, przetestowanie i wdrożenie innowacyjnych metod porównywania dużych zbiorów tekstów, dzięki którym będzie możliwe dostrzeganie – w wielkiej skali – podobieństw tekstowych niewidocznych gołym okiem.
-
Cykl artykułów dotyczących metodologii stylometrycznej, na który składa się m.in. studium o minimalnej długości próbek tekstowych (Eder 2015a) oraz zarys nowego podejścia do rozwiązania tego problemu (Eder 2017b), praca mierząca siłę sygnału autorskiego w zależności od analizowania częstszego lub rzadszego słownictwa (Rybicki and Eder 2011), studium o warunkach doboru próbek tekstowych do wytrenowania skutecznego modelu w klasyfikacji nadzorowanej (Eder and Rybicki 2013), artykuł o błędach systematycznych w atrybucji autorskiej (Eder 2013), o pozornym obiektywizmie metod wielowymiarowych (Eder 2014), etc.
-
Studium na temat autorstwa Kroniki polskiej Galla Anonima, w którym staram się poddać weryfikacji “wenecką” hipotezę o pochodzeniu Galla, sformułowaną przez Tomasza Jasińskiego. Okazuje się, że rzeczywiście ujawniają się uderzające podobieństwa stylometryczne między twórczością autora Kroniki oraz Mnicha z Lido: z wielkim prawdopodobieństwem można twierdzić, że jest to jedna i ta sama osoba (Eder 2015b, 2017a).
-
Przebiegi zmian gramatycznych i leksykalnych w historii języka polskiego to trzyletni projekt finansowany przez Narodowe Centrum Nauki (OPUS 2013/11/B/HS2/02795), którego celem jest prześledzenie zmian leksykalnych, ale przede wszystkim zmian gramatycznych, jakie dokonały się w języku polskim na przestrzeni wieków XVI-XIX. Jednym z istotniejszych efektów tego projektu jest monografia Zmiana w języku. Studia kwantytatywno-korpusowe (więcej na temat tej rozprawy tutaj).
-
Artykuł o Elenie Ferrante jako wirtualnym autorze, w którym chodziło o potwierdzenie niedawnych rewelacji o tym, że autorem ukrywającym się za słynnym literackim pseudonimem jest w rzeczywistości Domenico Starnone, uznany pisarz z Neapolu (Eder 2018). Szybko się jednak okazało, że warto postawić bardziej ambitne pytanie, mianowicie o to, czy (zdolny) pisarz jest w stanie wypracować dwa odrębne style. Czy da się wykazać, że Domenico Starnone jest w stanie w powieściach podpisanych własnym nazwiskiem pisać stylem Starnonego, a w innych wcielić się w wirtualną “Ferrante”?
-
Harper Lee i inni to studium na temat stylometrycznych podobieństw dwóch powieści Harper Lee: nagrodzonej Pulitzerem Zabić drozda (1961) oraz wydanej pół wieku później Idź postaw wartownika (2015); rzecz w tym, że wedle niektórych obie powieści pomógł autorce napisać (a może więcej niż pomógł) Truman Capote. Śladów udziału Capote’go nie znaleźliśmy, znaleźliśmy natomiast przedziwne wahania stylu Harper Lee w najważniejszym rozdziale Zabić drozda (Choiński et al. 2019).
Cytowane prace
Choiński, M., Eder, M. and Rybicki, J. (2019). Harper Lee and other people: a stylometric diagnosis. Mississippi Quarterly, 70/71(3): 355–374.
Eder, M. (2013). Mind your corpus: systematic errors in authorship attribution. Literary and Linguistic Computing, 28(4): 603–614, [pre-print].
Eder, M. (2014). Metody ścisłe w literaturoznawstwie i pułapki pozornego obiektywizmu – przykład stylometrii. Teksty Drugie, 2: 90–105.
Eder, M. (2015a). Does size matter? Authorship attribution, small samples, big problem. Digital Scholarship in the Humanities, 30(2): 167–182, [pre-print].
Eder, M. (2015b). In search of the author of “Chronica Polonorum” ascribed to Gallus Anonymous: A stylometric reconnaissance. Acta Poloniae Historica, 112: 5–23, [pre-print].
Eder, M. (2017a). Autorstwo „Kroniki” Anonima zwanego Gallem w świetle badań stylometrycznych: rekonesans. In Dąbrówka, A., Skibiński, E. and Wojtowicz, W. (eds), Nobis operique favete. Studia nad Gallem Anonimem. Warszawa: IBL PAN, pp. 59–74.
Eder, M. (2017b). Short samples in authorship attribution: A new approach. Digital Humanities 2017: Conference Abstracts. Montreal: McGill University, pp. 221–224, https://dh2017.adho.org/abstracts/341/341.pdf.
Eder, M. (2018). Elena Ferrante: a virtual author. In Tuzzi, A. and Cortelazzo, M. A. (eds), Drawing Elena Ferrante’s Profile. Padova: Padova University Press, pp. 31–45, http://www.padovauniversitypress.it/publications/9788869381300.
Eder, M. and Rybicki, J. (2013). Do birds of a feather really flock together, or how to choose training samples for authorship attribution. Literary and Linguistic Computing, 28(2): 229–236, [pre-print].
Rybicki, J. and Eder, M. (2011). Deeper Delta across genres and languages: do we really need the most frequent words? Literary and Linguistic Computing, 26(3): 315–321, [pre-print].