W 2010 ukończyłem studia (mgr inż.) na kierunku Elektronika i Telekomunikacja Politechniki Poznańskiej, specjalność multimedia, praca magisterska o syntezie dźwięku instrumentów. W 2025 obroniłem doktorat z informatyki na Wydziale Matematyki i Informatyki Uniwersytetu im. Adama Mickiewicza w Poznaniu (prezentacja z obrony). Moje badania dotyczyły ewaluacji systemów rozpoznawania mowy, których zwieńczeniem była publikacja na konferencji NeurIPS oraz otwarte wyzwanie na konkursie PolEval.
Obecnie prowadzę warsztaty dla studentów na tym samym wydziale (sylabus kursu). Współpracuję również z Centrum Sztucznej Inteligencji nad zagadnieniami dotyczącymi przetwarzania audio.
Poza działalnością naukową i dydaktyczną jestem założycielem oraz liderem zespołu Data Annotation & QA Services w Allegro, odpowiadającego za infrastrukturę i procesy zapewniania jakości rozwiązań AI w Polsce i na rynkach międzynarodowych. Posiadam doświadczenie w kierowaniu interdyscyplinarnymi projektami badawczo-rozwojowymi i zarządzaniu siecią partnerów zewnętrznych, skutecznie i terminowo dostarczając produkty oraz usługi oparte na danych, zgodnie z celami biznesowymi.
Narzędzia
- Kalkulator TCO ASR — Orientacyjny TCO systemów ASR dla języka polskiego — API, korekty, reklamacje. Na bazie danych BIGOS.
- BIGOS v2 (HuggingFace) — Otwarty korpus i framework do oceny ASR dla języka polskiego. Współtworzone z AMU CAI.
- Polish ASR Leaderboard — 40+ systemów ocenionych na BIGOS — dokładność, koszt, prędkość, odporność.
Wystąpienia
- 2024·NeurIPS 2024 (D&B Track)BIGOS V2 Benchmark for Polish ASR
- 2024·PolEval 2024Polish ASR Challenge 2024 — results & methodology
- 2024·YouTubeOcena jakości tłumaczenia maszynowego
- 2024·Panel discussion (YouTube)Rapid Tech and Business Shifts in the PL Translation Industry: Opportunities and Challenges
Wybrane publikacje
- NeurIPS 2024 (Datasets & Benchmarks Track): „BIGOS V2 Benchmark for Polish ASR: Curated Datasets and Tools for Reproducible Evaluation".
- arXiv 2408.00005 (2024): „Framework for Curating Speech Datasets and Evaluating ASR Systems: A Case Study for Polish".
- FedCSIS 2023 „BIGOS — Benchmark Intended Grouping of Open Speech Corpora for Polish Automatic Speech Recognition".
Polecam
- Designing Machine Learning Systems — Chip Huyen
Najlepsze pojedyncze źródło o ML w produkcji jakie znam.
- Speech and Language Processing — Jurafsky & Martin
Klasyk; obecnie 3rd edition draft.
- Niespokojne pokolenie — Jonathan Haidtaktualnie czytam
Empirycznie ugruntowana krytyka smartfonowego dzieciństwa.
Kontakt
Otwarty na współpracę naukową, pytania o BIGOS, kierunki ewaluacji mowy i głosu.
