Wielką Genealogię Minakowskiego (Sejm-Wielki.pl i Wielcy.pl) czekają wielkie zmiany. Żeby móc pracować nad nią kolejne kilkadziesiąt lat muszę zmienić zasady jej działania. Oto zapowiedź zmian, które będą wdrożone w najbliższych dniach.
W tym roku moja firma genealogiczna kończy 18 lat i tyleż mija od wydania pierwszej wersji genealogii na CD (baza w XML z Herbarza Bonieckiego). Połowę tego czasu (od 2011 r.) pracuję na około półtora etatu, zostawiwszy pracę w korporacji (Onet.pl). Gdy zaczynałem nad tym pracę w roku 2001, powstawała właśnie Wikipedia, a Google miało 3 lata. Danych genealogicznych w Internecie zasadniczo nie było: nie było bibliotek cyfrowych, archiwów online ani wielkich baz typu Geneteka. Za następne 18 lat będę miał 66 lat i będę się szykował na emeryturę. Jestem więc w połowie drogi.
Dziś Wielka Genealogia Minakowskiego ma prawie 1.000.000 osób połączonych w jedną wielką rodzinę. To była moja misja przez wiele lat: udowodnić, że większość historycznych elit polskich to jedna duża rodzina: nasi kuzyni. Ale nie muszę już tego dłużej dowodzić, bo cała Polska to już wie… W tej jednej naszej rodzinie jest w tym momencie niemal 60% spośród prawie 28 tysięcy osób opisanych w Polskim Słowniku Biograficznym, 90% spośród 3 tysięcy przedrozbiorowych senatorów, połowa z niemal 5 tysięcy osób opisanych w „Czy wiesz kto to jest?” z roku 1938 itd. itd… A przecież pod koniec 2006 chwaliłem się, że dla PSB udało się połączyć w jedną rodzinę AŻ 29% – i było to tak wielkim osiągnięciem, że zostało to ogłoszone na konferencji i opublikowane w postaci artykułu [1].
Dlatego pora zająć się po prostu genealogią wszystkich wybitnych Polaków, bez skupiania się na tym, czy już udało się odnaleźć z nimi związki rodzinne, czy jeszcze nie. Przecież od wielu lat zbieram dane o wszystkich ciekawych ludziach, tyle że trzymałem je sobie prywatnie, w bazie roboczej, a do publicznej genealogii „wskakiwali” oni dopiero wtedy, gdy udało się znaleźć z nimi połączenie. Pora udostępnić więc także tych pozostałych, bo nawet jeżeli nie są oni jeszcze naszą rodziną, to przecież też mogą być ciekawi. Czy warto? Jasne, że warto!
Ale nie mogę się zajmować wszystkim. Żeby mieć dobre efekty, muszę mądrze dysponować swoim czasem i możliwościami. Milion osób w genealogii to szczyt tego, nad czym jestem w stanie panować. Lepiej starannie opracowywać ten najważniejszy milion niż rozdrabniać się w nieskończoność. Dlatego wpuszczając do WGM osoby spoza rodziny wprowadzam jednocześnie limit: wszystkich razem ma być dokładnie 1 MILION.
Ale który milion? Jak wybrać tych najważniejszych? Od lat eksperymentowałem z „wagą koligacji PSB” czyli „rankingiem Minakowskiego”. Wynikiem tych eksperymentów było kilka artykułów naukowych w polskich i zagranicznych czasopismach. Rozstrzygające wnioski ukażą się w najbliższych dniach: będzie to artykuł o tym, że takim rankingiem udało się wyjaśnić mechanizm nominacji i karier w Senacie Rzeczypospolitej w latach 1569-1795. Pokazuję tam, jaki wzór na obliczanie rankingu najlepiej wyjaśnia decyzje kolejnych królów.
W biznesie internetowym poznałem moją ulubioną maksymę: „sam jedz to, co sprzedajesz klientom” (dosłownie: „eat your own dog food”). Dlatego sam jestem głównym testerem jakości tego rankingu. On pozwala mi wybrać z dziesiątek milionów źródeł dane o tym milionie najważniejszych Polaków. Nad rankingiem wciąż pracuję, bo on kieruje moją pracą, moim czasem, moją uwagą. Trzeba więc przyjąć, że zasady obliczania rankingu będą się zmieniać, jeżeli się okaże, że inny sposób obliczania będzie dawał lepsze wyniki.
To powoduje, że pewne osoby będą do genealogii wchodzić, a inne będą z niej wypadać. To koszt, którego nie da się uniknąć. Ale to nie tylko koszt, to także korzyść. W ten sposób będę mógł bezpiecznie dorzucać do genealogii wiadrami: powiedzmy, że ktoś opracuje duże źródło genealogiczne, np. wszystkie parafie z danego powiatu. Wtedy będę mógł wrzucić wszystko i zobaczyć, co spłynie, a co pozostanie. Zawsze znajdą się jakieś perły, a reszta będzie sobie leżała gdzieś w poczekalni – tak jak do tej pory w poczekalni leżeli ci, których nie udało się połączyć z naszą rodziną, choć byli tak wielcy, jak np. Stanisław Staszic.
Do tej pory decyzje o tym, kto wchodzi do genealogii a kto nie, choć były kierowane pewnymi zasadami, ostatecznie były arbitralne: sam musiałem decydować, na co mam czas, a na co nie mam. Rodziło to we mnie wielki stres i ogromnie męczyło. Pora to zmienić: niech decyduje o tym algorytm, którego zasady obliczania będą publicznie dostępne.
Zasady obliczania Rankingu WGM (RankingWGM)
Ranking WGM zastąpi dotychczasową „Wagę Koligacji PSB”. Oto, jak będzie liczony.
- Przyjmujemy listę celebrytów, które pojawiają się w różnych encyklopediach, spisach, czy bazach danych
- Celebryci przekazują swój kapitał (prestiż) najbliższym (rodzicom, dzieciom, małżonkom, rodzeństwu)
- Następne osoby przekazują swój kapitał dalej, ale przy każdym przejściu maleje on o połowę (więc dziecko dostaje 1/2, wnuk 1/4, prawnuk 1/8, praprawnuk 1/16 i tak dalej)
- Kapitały się sumują: można być mężem znanej aktorki, wnukiem profesora i do tego samemu być posłem na Sejm – wszystko liczy się osobno, a potem sumuje
- Ostatecznie sortujemy wszystkich według malejącej łącznej wartości kapitału i numerujemy, a potem bierzemy z nich pierwszy milion.
- Od tej pory Ranking WGM to pozycja kolejna: numer 1 to osoba o najwyższej łącznej sumie kapitałów. W tej chwili osobą tą jest Magdalena Agnieszka z Lubomirskich Sapieżyna, kochanka Króla Stasia, matka dwojga jego nieślubnych dzieci. Numer 2 to Dominik Mikołaj ks. Radziwiłł, kanclerz wielki litewski (zm. 1697).
- Kto się nie zmieści w pierwszym milionie – wypada z głównej bazy genealogicznej. Ale nie niknie zupełnie, zostanie po nim strona informacyjna, zachowany też będzie identyfikator (np. sw.684227). Jeżeli ranking tej osoby wzrośnie (bo np. okaże się, że brat dziadka miał sławną żonę), to ta osoba wróci do głównej części bazy (wciąż będzie pod tym samym adresem). Do poczekalni trafi ok. 91.300 osób wg stanu na 15 marca, czyli niecałe 10% dotychczasowej bazy.
- Pozostają także (wszystkie poniższe kategorie to razem około 20 tys. dodatkowych osób):
- wszystkie osoby, które były dotychczas, a urodziły się przed rokiem 1750
- także wszyscy przodkowie osób oznaczonych jako „Korespondent MJM” (przodkowie, ale rodzeństwo przodków już niekoniecznie)
- potomkowie posłów i senatorów Sejmu Wielkiego i ich rodzeństwa wraz z małżonkami i teściami (zwykle mają wysoki ranking, ale zdarzają się nieliczne przypadki, że nie zmieściliby się w pierwszym milionie)
Poniżej opisuję to bardziej konkretnie.
Dobór celebrytów i kapitał początkowy
Podaję wartości na 15 marca 2020, oczywiście z czasem będzie ich przybywać.
Ogólne słowniki i encyklopedie
- Polski słownik biograficzny: obecnie 27.786 osób, opracowany kompletnie (choć nowe zeszyty wciąż wychodzą). Do tej por w WGM było 16.447 osób (59% całości), bo reszta była w poczekalni, czekając na odnalezienie powiązania z główną rodziną (głównym komponentem grafu). Teraz będzie wszystko. Za bycie w PSB dostaje się 5 punktów. Osoby opisane w PSB to są ludzie wybrani przez redakcję Słownika będącą częścią przez Instytutu Historii Polskiej Akademii Nauk, jest to de facto konsensus polskich historyków co do wybitności danej osoby (bo autorzy chętniej piszą biogramy o ludziach, o których inni historycy chętnie pisali książki i artykuły).
- Wzmianka o zgonie w „Kurierze Warszawskim” lat 1821-61 (na podstawie zestawienia A. Tyszki): obecnie 18.024 osoby, opracowany kompletnie. Do tej pory w WGM było 10.240 osób (57% całości), reszta była w poczekalni. To są osoby, które uchodziły za takie, które wypadało znać w czasach gdy środowisko osób czytających prasę polskojęzyczną to było kilka tysięcy osób w skali całego kraju. Jest tam trochę osób przypadkowych, ale jeżeli więcej osób z rodziny jest odnotowywanych w miarę, jak umierali, to na pewno była to rodzina ogólnie znana. Za bycie tu dostaje się 3 punkty.
- Czy wiesz, kto to jest? pod red. Stanisława Łozy z roku 1938: obecnie 4862 osoby. Do tej pory było 2364 osoby (49%), reszta była w poczekalni. Polskie Who is who podręczny spis wszystkich osób, które wypadało znać w przedwojennej Polsce: artyści, adwokaci, politycy, profesorowie, ziemianie itd. 1 punkt
- Polska Wikipedia: obecnie 21.470 osób w genealogii (było 13.089), przy czym oczywiście to nie wszystkie artykuły biograficzne, ale ich drobny wycinek. Mimo wszystko jest to ciekawe kryterium rozpoznawalności (encyklopedyczności), więc warto dać za to 1 punkt.
Oficerowie
- – Oficerowie Powstania Listopadowego według słownika Roberta Bieleckiego (trzy tomy, na litery A-R): 2443 osoby, wcześniej było 1555, reszta w poczekalni. W słowniku tym są dane o kolejnych 5387 oficerach, których nie udało się zidentyfikować na tyle, by dodać ich do genealogii. 1 punkt
- Oficerowie Królestwa Polskiego i Księstwa Warszawskiego (wraz z pułkami litewskimi) według spisów Bronisława Gembarzewskiego, w których łącznie jest ok. 8000 pozycji (4549 dla Ks. Warszawskiego i 483 dla Galicji i Litwy oraz 2967 dla Królestwa Polskiego 1815-30) ale część osób występuje tam wielokrotnie (są tacy, co się pojawiają trzykrotnie, gdy np. był ktoś w wojsku Księstwa Warszawskiego 1808-09 potem znowu 1812, a potem służył w armii Królestwa Polskiego). Zidentyfikować się udało dotąd 1.488 różnych osób i te trafią do bazy, a do tej pory było tu 1052 (71% z tych zidentyfikowanych). 1 punkt
- Listy katyńskie, czyli spisy polskich jeńców zamordowanych w ZSRR, w znacznej części oficerów rezerwy (Katyń i Charków), policjantów (Miednoje) i urzędników (lista ukraińska). Z Ukraińskiej Listy Katyńskiej, najsłabiej znanej, uwzględnionych zostały 132 osoby na całą listę 3436. Pozostałe listy są lepiej znane, wydano Księgi Cmentarne, a wszyscy oficerowie otrzymali awanse w roku 2007. Z tej liczby (14.109 osób) w bazie dotąd było 1471 (10%), teraz uwzględnieni są wszyscy. 1 punkt
Studenci, naukowcy i odkrywcy
- Członkowie akademii nauk do lat 1980-tych wg spisu Śródki i Michalskiego: wszystkie 1134 osoby, z których do tej pory 762 (67%) było tutaj. 1 punkt
- Studenci zapisani na Uniwersytet Warszawski od 1806 do 1830 r. wg słownika Rafała Gerbera, ale zweryfikowanego rzetelnie na podstawie archiwaliów. Gerber podaje 3350 osób na podstawie księgi zapisów, genealogicznie zidentyfikować się udało 1775, z których dotąd 1490 (84%) było tutaj. 1 punkt
- Studenci zapisani na Uniwersytet Jagielloński w latach 1850-1918 wg Corpus Studiosorum UJ: 6565 osób, a było 5096 (78%). Pełen spis ma 28.873 osób, ale bardzo trudno jest ich odnaleźć, bo zwykle nie ma dat urodzenia ani danych matki, często nawet ojca. 1 punkt
- Słownik odkrywców i wynalazców, 4 tomy pod red. B. Orłowskiego: 1093 osoby, z których dotąd było 614 (56%). 1 punkt
- Słownik biograficzny teatru polskiego – pierwsze dwa tomy (osoby zmarłe do 1970 r.): wszystkie osoby znane z imienia i nazwiska, jest ich 6.090, a do tej pory 1775 (29%) było tutaj. 1 punkt
Politycy
- Wszyscy senatorzy przedrozbiorowi (wojewodowie, kasztelanowie, biskupi, ministrowie) z lat 1468-1795: 3516 osób, z których dotąd było tu 3048 (87%). Mieć senatora w rodzinie to był zawsze bardzo ważny wskaźnik prestiżu, więc należy się za to 5 punktów (jak taki senator jest w PSB i Wikipedii to dostaje więc łącznie 11 punktów, bo jeszcze 5 za PSB i 1 za Wikipedię).
- Sejm Wielki (czteroletni) – wszyscy senatorowie i posłowie, w liczbie 494. Do tej pory było tu ich 472 (96%). 1 punkt
- Razem wzięci posłowie i senatorowie porozbiorowi, a więc:
o Sejm czasów Powstania Listopadowego (1830-31): było ich 180
o Sejm Królestwa Galicji i Lodomerii oraz Wlk. Księstwa Krakowskiego (967 pozycji)
o parlament II RP (2050 pozycji)
o Sejm PRL (3343 pozycje)
o Parlament III RP (2618 pozycji)
Łącznie mamy tu 8678 osób, z których 1389 (16%) było dotąd w genealogii. 1 punkt - Urzędnicy Królestwa Polskiego (1815-1914) wg opracowania prof. A. Kuleckiej. Było ich łącznie około 14.000. W genealogii mamy obecnie 4.152 osób zidentyfikowanych (głównie z czasów przed likwidacją autonomii w 1868 r.), z których 3458 (83%) było tu do tej pory. 1 punkt
- Towarzystwo Rolnicze w Królestwie Polskim 1858-61, które spełniało faktycznie funkcję jedynej legalnej organizacji pozarządowej w Kongresówce, a więc było jakby partią polityczną (jak Kluby Inteligencji Katolickiej przed r. 1989). Na pełnej liście członków z 1861 r. są 4054 osoby, genealogicznie udało się zidentyfikować 2765 i tyle teraz będzie ich tutaj, a dotąd było tu 2650 (czyli prawie wszyscy z tych zidentyfikowanych, 96%). 1 punkt
- Klub Krzywego Koła, który po 1956 r. również spełniał funkcję legalnej opozycji. Na liście uczestników jest 389 osób, w genealogii mamy teraz 121, a było 98 czyli 81% z tej liczby.
Prestiżowe cmentarze
Jeżeli w XIX wieku kogoś było stać na grobowiec, który przetrwa do XXI wieku, to znaczy że miał dość znaczny kapitał finansowy czy społeczny. Dlatego uwzględnione są tu osoby, które mają nagrobki na głównych cmentarzach, przede wszystkim w kompleksie Starych Powązek (katolickich, luterańskich, kalwińskich i żydowskich). Do tego dokładamy dobrze opracowane cmentarze w Wilnie (Rossa), Krakowie (cm. Salwatorski) i niezwykle prestiżowy cmentarz w Laskach pod Warszawą.
- Powązki katolickie (stare, cywilne), tylko groby założone przed rokiem 1939: 30.725 osób, z których dotąd w WGM było 27.202 (89%); wg inwentaryzacji zachowały się tam groby 116.148 osób, ale skupiałem się na identyfikacji grobów XIX-wiecznych i tych późniejszych, gdzie łatwo się udało ustalić genealogię. 1 punkt
- Pięć pozostałych uwzględnionych tu cmentarzy: będzie 3.683 osoby, do tej pory było ich 3.111 (84%) z tej liczby. Łącznie jest na nich ok. 140 tys. pochówków: 56 tys. chrześcijańskich i 82 tys. żydowskich. 1 punkt
Zasady dziedziczenia kapitału
Przyjmujemy, że osoby bezpośrednio związane genealogicznie dziedziczą połowę. W każdym kolejnym stopniu przekazywana jest znowu połowa. Inaczej niż do tej pory, do bezpośredniego związku zaliczam też bycie bratem lub siostrą, a więc jeden stopień odległości to dziecko, rodzic, mąż, żona, brat czy siostra. Osoby odległe od „osoby ważnej” o 1 stopień dostają 1/2 tego, co „osoba ważna”. Kolejny krok dalej: 1/4, potem 1/8, 1/16, 1/32, 1/64 i 1/128. Liczby w mianowniku to kolejne potęgi liczby 2, a więc mamy tu zależność eksponencjalną, bo z badań wyszło, że to lepiej oddaje rzeczywistość społeczną.
Przykłady kolejnych stopni:
1. (1/2) Ojciec, matka, mąż, żona, dziecko, brat, siostra
2. (1/4) Dziadek, babcia, szwagier, wnuk, teściowa, wuj, ciotka, siostrzeniec
3. (1/8) Prababcia, dziadek żony, mąż siostrzenicy, teść siostry, prawnuk, brat dziadka, brat cioteczny
4. (1/16) Praprababcia, żona brata ciotecznego, brat cioteczny żony
….
6. (1/64) Praprapraprababcia, pradziadek męża siostrzenicy…
Z powyższego widać, że związki dalsze niż 7 są już trudne do nazwania i wyobrażenia. Dlatego nie ma sensu ich brać pod uwagę. Za osobę w stopniu 8, a więc np. prapraprapraprapradziadka będziemy dostawać 0 (a nie 1/256).
3. Sumujemy wynik dla każdego z osobna.
Można być trochę wybitną osobą, ale do tego mieć kilku wybitnych wujków i wielkiego prapradziadka. Może też samemu pojawiać się równolegle w kilku źródłach. Dlatego dla każdej osoby sumujemy te wszystkie dane i dopiero ta suma pokazuje miejsce w rankingu. Dzięki temu nie musimy się przejmować lekkimi zawirowaniami, np. tym że jeszcze nie cały alfabet jest opracowany w PSB, że „Kurier Warszawski” skupiał się na Warszawie i Kongresówce, a dla innych zaborów mamy trudniej itd. itd. Wierzę, że na większą skalę to się uśredni, zadziała tu statystyka.
Tak sobie właśnie wyobrażam swoją pracę w przyszłości – na ustalaniu nowych źródeł oceny statusu społecznego – tak, żeby genealogia była jak najciekawsza. Bo o to właśnie przecież tu chodzi.
4. Osoby, które nie mają nikogo do 7. kroku
Takim osobom dajemy 1/2 najwyższego rankingu bezpośredniego sąsiada. Potem powtarzamy to 10 razy. Więc nawet osoba odległa o 17. kroków od najbliższej osoby ciekawej ma szansę coś dostać, choć oczywiście już bardzo, bardzo mało – bo gdy ktoś ma ranking równy 10, to 17 kroków dalej zostaje nam z tego już tylko 10×1/2^17 czyli 0,00008. Ale zawsze to więcej niż zero.
Czy będą wyjątki?
Czy jest możliwy sponsoring, wciskanie się bez kolejki i co z dotychczasowym płatnym dopisywaniem?
Zdarzało się, że ludzie sponsorowali dopisywanie do genealogii, wg cennika 2 zł za dodanie nowej osoby. Dotyczyło to prawie zawsze osób, które bezpiecznie mieszczą się w nowych kryteriach, więc nie wypadną z genealogii. Chyba słuszne będzie wprowadzenie możliwości objęcia wybranych osób patronatem z gwarancją, że nawet jak w wyniku zmian rankingu jakaś grupa osób będzie miała zniknąć, to będą się nadal pojawiały jako osoby dodatkowe (oprócz owego najważniejszego miliona). Wtedy ktoś mógłby zasponsorować umieszczenie np. całej swojej parafii w taki sposób, jak do tej pory w WGM były kompletne XIX-wieczna parafia Kampinos i Izraelicki Okręg Metrykalny Kraków (a więc np. cała biedota żydowską Krakowa). Szczegóły są jeszcze do przemyślenia i ustalenia. Na pewno musiałoby to być tak, żeby osoby dodatkowe były wyraźnie oznaczone (jak materiały sponsorowane w prasie).
Przypisy
[1] Marek Jerzy Minakowski, Dziesięć tomów PSB na jednej tablicy genealogicznej. „Ci wielcy Polacy to nasza rodzina”, w: Rafał T. Prinke (red.), Megabajty dziejów, Poznań: Instytut Historii UAM 2007, ss. 97-106.