Przejdź do treści

Metodologia

Strona dokumentuje wszystkie zewnętrzne źródła danych wykorzystywane w serwisie surname.pl, ich licencje oraz sposób, w jaki oznaczamy treści zweryfikowane wobec generowanych algorytmicznie. Pełniejszy rejestr datasetów wraz z bezpośrednimi linkami do plików źródłowych znajdziesz na stronie Źródła danych.

Źródła danych i licencje

Źródła danych i licencje wykorzystywane w surname.pl
DatasetLicencjaData pobrania
Nazwiska występujące w rejestrze PESEL — częstośćCC0 1.02026-04-06
Nazwiska występujące w rejestrze PESEL — rozkład wojewódzkiCC0 1.02026-04-07
Wikidata (P734 — nazwisko)CC0 1.02026-04-07
Polish Wiktionary (XML dump)CC BY-SA 3.02026-04-07
Kaikki Wiktionary (EN/DE/RU etymologie)CC BY-SA 3.02026-04-07
Etymologia LLM (Claude)wygenerowane na potrzeby projektu2026-04-18

Daty w kolumnie «Data pobrania» odnoszą się do momentu pobrania źródłowych plików. Publiczny zbiór danych «Nazwiska występujące w rejestrze PESEL», udostępniany na portalu dane.gov.pl przez Ministerstwo Cyfryzacji, zawiera stan na styczeń 2026.

Skąd pochodzą etymologie

Pod każdą etymologią na stronie nazwiska znajduje się etykieta z kolorową kropką, która wskazuje jej źródło:

Dzięki etykiecie czytelnik od razu wie, czy ma do czynienia z opracowaniem redaktorów Wiktionary, treścią wygenerowaną przez AI, czy wynikiem analizy budowy nazwiska.