Pełnię funkcję dyrektora Instytutu Języka Polskiego PAN, pracuję również, choć w znacznie mniejszym zakresie, w Instytucie Filologii Polskiej Uniwersytetu Pedagogicznego w Krakowie.

Mimo że moja formacja uniwersytecka związana jest z literaturą staropolską (głównie XVI- i XVII-wieczną), obecne zajmuję się przede wszystkim komputerową analizą tekstu czy też – żeby ująć rzecz bardziej precyzyjnie – przecięciem historii literatury, językoznawstwa kwantytatywnego oraz zastosowania metod komputerowych (w szczególności statystycznych metod uczenia maszynowego). Jak się wydaje, takie połączenie z pozoru różnorodnych dyscyplin dobrze opisuje nazwa “humanistyka cyfrowa” (Digital Humanities). Ten wyodrębniający się coraz bardziej obszar wiedzy wydaje mi się szczególnie interesujący głównie z tego powodu, że daje narzędzia do nowego spojrzenia na wiele dawnych pytań stawianych w humanistyce, przy czym są to narzędzia wypracowane przez nauki ścisłe, połączone z ogromną mocą obliczeniową współczesnych komputerów oraz z ilością danych, o której nasi poprzednicy mogli tylko marzyć. Humanistyka cyfrowa wydaje mi się jednak atrakcyjna również dlatego, że wymaga myślenia w kategoriach zespołów badawczych i współpracy uczonych z różnych specjalności. Wreszcie, owa stosunkowo młoda dyscyplina pociagą swoją inkluzywnością: otóż stara się ona przezwyciężyć – a przynajmniej dostrzegać – ukryte i jawne niesprawiedliwości hierarchicznego świata akademickiego (jestem przekonany, że humanistyka cyfrowa jest w stanie dać innym dyscyplinom impuls to zmiany w tym zakresie).

Ostatnio zajmuje mnie przede wszystkim stylistyka komputerowa, zwana też stylometrią. Interesuje mnie pytanie o autorstwo tekstu pisanego: W jak dużym stopniu indywidualne cechy autora są zakodowane w tekście? W jaki sposób taki autorski “sygnał” da się wydobyć z tekstu, który przed opublikowaniem został poddany zmianom redakcyjnym albo podległ wielokrotnemu kopiowaniu przez nieuważnych skrybów? Jak duża musi być próbka tekstu, żeby wiarygodnie zdradziła swojego autora? Czy metody stylometryczne da się uogólnić i zastosować do wielkoskalowych badań literackich utrzymanych w paradygmacie “czytania na odległość” (distant reading)? Tego typu pytania badawcze podejmuje spora cześć moich studiów stylometrycznych.

Z kolei w swoich badaniach literaturoznawczych zajmuję się przede wszystkim literaturą polską XVI i XVII wieku, przy czym głównym obszarem moich zainteresowań jest edytorstwo naukowe. Do najważniejszych swoich prac na tym polu zaliczyłbym: 1. opracowanie XVI-wiecznego tekstu Rozmowy, które miał król Salomon z Marchołtem grubym a sprosnym, 2. wydanie wespół z prof. Romanem Mazurkiewiczem traktatu Andrzeja Wolana De libertate politica z jego przekładem O wolności ślacheckiej, wreszcie 3. przygotowanie – wraz z kilkuosobowym zespołem – edycji krytycznej Fraszek Jana Kochanowskiego, która ukaże się niebawem w ramach serii Biblioteka Pisarzów Polskich.

W życiu jest na ogół o wiele za mało czasu, by zajmować się wieloma rzeczami jednocześnie. Dlatego swój czas staram się dzielić między kilka głównych przedsięwzięć. Obecnie są to: zarządzanie Instytutem Języka Polskiego PAN, przewodniczenie Komitetowi Językoznawstwa PAN, współzarządzanie Akcją COST “Distant Reading”, praca na rzecz organizacji Alliance of Digital Humanities Organizations jako jej sekretarz generalny (w latach 2017–2019), wreszcie kierowanie pracami grupy badawczej Computational Stylistics Group. W nader rzadkich chwilach niepróżnującego próżnowania zajmuję się rozwijaniem pakietu Stylo, który jest napisanym “od zera” programem komputerowym do różnego rodzaju analiz stylometrycznych. Myślę po polsku, programuję w języku R, tweetuję po angielsku, mieszkam w Krakowie.