Pełnię funkcję dyrektora Instytutu Języka Polskiego PAN, pracuję również, choć w znacznie mniejszym zakresie, w Instytucie Filologii Polskiej Uniwersytetu Pedagogicznego w Krakowie.

Mimo że moja formacja uniwersytecka związana jest z literaturą staropolską (głównie XVI- i XVII-wieczną), obecne zajmuję się przede wszystkim komputerową analizą tekstu czy też – żeby ująć rzecz bardziej precyzyjnie – przecięciem historii literatury, językoznawstwa kwantytatywnego oraz zastosowania metod komputerowych (w szczególności statystycznych metod uczenia maszynowego). Jak się wydaje, takie połączenie z pozoru różnorodnych dyscyplin dobrze opisuje nazwa “humanistyka cyfrowa” (Digital Humanities). Ten wyodrębniający się coraz bardziej obszar wiedzy wydaje mi się szczególnie interesujący głównie z tego powodu, że daje narzędzia do nowego spojrzenia na wiele dawnych pytań stawianych w humanistyce, przy czym są to narzędzia wypracowane przez nauki ścisłe, połączone z ogromną mocą obliczeniową współczesnych komputerów oraz z ilością danych, o której nasi poprzednicy mogli tylko marzyć. Humanistyka cyfrowa wydaje mi się jednak atrakcyjna również dlatego, że wymaga myślenia w kategoriach zespołów badawczych i współpracy uczonych z różnych specjalności. Wreszcie, owa stosunkowo młoda dyscyplina pociąga swoją inkluzywnością: otóż stara się ona przezwyciężyć – a przynajmniej dostrzegać – ukryte i jawne niesprawiedliwości hierarchicznego świata akademickiego (jestem przekonany, że humanistyka cyfrowa jest w stanie dać innym dyscyplinom impuls to zmiany w tym zakresie).

Ostatnio zajmuje mnie przede wszystkim stylistyka komputerowa, zwana też stylometrią. Interesuje mnie pytanie o autorstwo tekstu pisanego: W jak dużym stopniu indywidualne cechy autora są zakodowane w tekście? W jaki sposób taki autorski “sygnał” da się wydobyć z tekstu, który przed opublikowaniem został poddany zmianom redakcyjnym albo podległ wielokrotnemu kopiowaniu przez nieuważnych skrybów? Jak duża musi być próbka tekstu, żeby wiarygodnie zdradziła swojego autora? Czego dowiadujemy się o języku i jego różnych stylistycznych rejestrach? Czy metody stylometryczne da się uogólnić i zastosować do wielkoskalowych badań literackich utrzymanych w paradygmacie “czytania na odległość” (distant reading)? Tego typu pytania badawcze podejmuje spora cześć moich studiów stylometrycznych.

Z kolei w swoich (stosunkowo nielicznych) badaniach literaturoznawczych zajmuję się przede wszystkim literaturą polską XVI i XVII wieku, przy czym głównym obszarem moich zainteresowań jest edytorstwo naukowe. Do najważniejszych swoich prac na tym polu zaliczyłbym: 1. opracowanie XVI-wiecznego tekstu Rozmowy, które miał król Salomon z Marchołtem grubym a sprosnym, 2. wydanie wespół z prof. Romanem Mazurkiewiczem traktatu Andrzeja Wolana De libertate politica z jego przekładem O wolności ślacheckiej, wreszcie 3. przygotowanie – wraz z kilkuosobowym zespołem – edycji krytycznej Fraszek Jana Kochanowskiego, która ukaże się niebawem w ramach serii Biblioteka Pisarzów Polskich.

W życiu jest na ogół o wiele za mało czasu, by zajmować się wieloma rzeczami jednocześnie. Dlatego swój czas staram się dzielić między kilka głównych przedsięwzięć. Obecnie są to: zarządzanie Instytutem Języka Polskiego PAN, przewodniczenie Komitetowi Językoznawstwa PAN, kierowanie kilkoma projektami badawczymi i jednym dużym projektem infrastrukturalnym CLS INFRA, wreszcie współuczestnictwo w pracach grupy badawczej Computational Stylistics Group. W nader rzadkich chwilach niepróżnującego próżnowania zajmuję się rozwijaniem pakietu Stylo, który jest napisanym “od zera” programem komputerowym do różnego rodzaju analiz stylometrycznych. Myślę po polsku, programuję w języku R, tweetuję po angielsku, mieszkam w Krakowie.