Michał Junczyk — Speech AI evaluation research

W 2010 ukończyłem studia (mgr inż.) na kierunku Elektronika i Telekomunikacja Politechniki Poznańskiej, specjalność multimedia, praca magisterska o syntezie dźwięku instrumentów. W 2025 obroniłem doktorat z informatyki na Wydziale Matematyki i Informatyki Uniwersytetu im. Adama Mickiewicza w Poznaniu (prezentacja z obrony). Moje badania dotyczyły ewaluacji systemów rozpoznawania mowy, których zwieńczeniem była publikacja na konferencji NeurIPS oraz otwarte wyzwanie na konkursie PolEval.

Obecnie prowadzę warsztaty dla studentów na tym samym wydziale (sylabus kursu). Współpracuję również z Centrum Sztucznej Inteligencji nad zagadnieniami dotyczącymi przetwarzania audio.

Poza działalnością naukową i dydaktyczną jestem założycielem oraz liderem zespołu Data Annotation & QA Services w Allegro, odpowiadającego za infrastrukturę i procesy zapewniania jakości rozwiązań AI w Polsce i na rynkach międzynarodowych. Posiadam doświadczenie w kierowaniu interdyscyplinarnymi projektami badawczo-rozwojowymi i zarządzaniu siecią partnerów zewnętrznych, skutecznie i terminowo dostarczając produkty oraz usługi oparte na danych, zgodnie z celami biznesowymi.

Narzędzia

Kalkulator TCO ASR — Orientacyjny TCO systemów ASR dla języka polskiego — API, korekty, reklamacje. Na bazie danych BIGOS.
BIGOS v2 (HuggingFace) — Otwarty korpus i framework do oceny ASR dla języka polskiego. Współtworzone z AMU CAI.
Polish ASR Leaderboard — 40+ systemów ocenionych na BIGOS — dokładność, koszt, prędkość, odporność.

Wystąpienia

2024·NeurIPS 2024 (D&B Track)
BIGOS V2 Benchmark for Polish ASR
2024·PolEval 2024
Polish ASR Challenge 2024 — results & methodology
2024·YouTube
Ocena jakości tłumaczenia maszynowego
2024·Panel discussion (YouTube)
Rapid Tech and Business Shifts in the PL Translation Industry: Opportunities and Challenges

Wybrane publikacje

NeurIPS 2024 (Datasets & Benchmarks Track): „BIGOS V2 Benchmark for Polish ASR: Curated Datasets and Tools for Reproducible Evaluation".
arXiv 2408.00005 (2024): „Framework for Curating Speech Datasets and Evaluating ASR Systems: A Case Study for Polish".
FedCSIS 2023 „BIGOS — Benchmark Intended Grouping of Open Speech Corpora for Polish Automatic Speech Recognition".

Polecam

Designing Machine Learning Systems — Chip Huyen
Najlepsze pojedyncze źródło o ML w produkcji jakie znam.
Speech and Language Processing — Jurafsky & Martin
Klasyk; obecnie 3rd edition draft.
Niespokojne pokolenie — Jonathan Haidtaktualnie czytam
Empirycznie ugruntowana krytyka smartfonowego dzieciństwa.

Kontakt

Otwarty na współpracę naukową, pytania o BIGOS, kierunki ewaluacji mowy i głosu.

kontakt@michaljunczyk.pl LinkedIn Substack Hugging Face CV →