Czy Twój Postgres może obsłużyć petabajty danych, zachowując przy tym wysoką wydajność i przewidywalność czasów odpowiedzi na złożone zapytania analityczne? Pojedynczy silnik w wersji społecznościowej prawdopodobnie nie… Odpowiedzią na to wyzwanie jest WarehousePG. Dlaczego?
WarehousePG to otwartoźródłowy, rozwijany przez EDB fork platformy Greenplum Database, oparty na architekturze Massively Parallel Processing (MPP). Rozwiązanie to bierze wszystko to, co administratorzy i analitycy kochają w Postgresie, i przenosi na zupełnie nowy poziom skalowalności.
Podczas godzinnego, technicznego spotkania pokażemy Ci, jak wyjść poza ograniczenia monolitu. Zobaczysz, jak w modelu Shared-Nothing wiele instancji bazy współpracuje jako jeden, wysoce niezawodny organizm analityczny.
Dlaczego warto wziąć udział? Czego się dowiesz?
- WarehousePG, czyli Postgres na sterydach (MPP): poznasz, jak działa rozproszone przetwarzanie zapytań i jak węzły równolegle przetwarzają gigantyczne zbiory danych.
- Zero przestojów z Primary-Mirror: dowiesz się, jak mechanizmy wysokiej dostępności (HA), np. segment mirroring, zapewniają ciągłość pracy, nawet w przypadku awarii klastra czy prac administracyjnych.
- Błyskawiczna Federacja Danych (PXF): pokażemy Ci, jak budować Data Lakehouse, odpytując zewnętrzne zasoby (JDBC, S3, HDFS) w czasie rzeczywistym – bez kosztownej i powolnej migracji danych.
Dla kogo jest ten webinar?
- Data Engineers i Architekci Danych, którzy projektują skalowalne hurtownie.
- Administratorzy Baz Danych (DBA), którzy szukają alternatyw dla tradycyjnego Postgresa przy pracy z Big Data.
- Liderzy IT (CDO, CTO) oraz Managerowie Platform Danych podejmujący decyzje o wyborze technologii i kierunkach rozwoju infrastruktury danych w organizacji.
- Specjaliści BI pracujący z danymi w skali petabajtowej, szukający sposobów na skrócenie czasu dostarczania wyników (Time-to-Insight).
Nie możesz być z nami na żywo? Zapisz się, a wyślemy Ci link do nagrania oraz prezentację po zakończeniu spotkania.
Nie pozwól, by rosnące wolumeny danych spowolniły Twoje procesy!
Zarezerwuj bezpłatne miejsce już teraz i poznaj możliwości WarehousePG.
Organizator

Prelegenci

Maciej Wawrzyniak, Dyrektor obszaru baz danych i inżynierii danych, Linux Polska
Data engineer z wieloletnim doświadczeniem w ekosystemie Linux, bazach danych i Big Data. Na co dzień realizuje priorytetowe projekty konsultingowe w ramach środowisk opartych na PostgreSQL, WarehousePG, DWH czy ETL dla największych firm. Fascynat nowoczesnej inżynierii danych, płynnych integracji systemowych i konteneryzacji.
Agenda:
- Koncepcja WarehousePG
- Ewolucja architektury: od modelu monolitycznego do rozproszonego MPP.
- Postgres jako fundament nowoczesnych platform danych.
- Architektura Shared-Nothing i skalowanie
- Logika podziału: rola koordynatora i autonomia segmentów.
- Interconnect: koncepcja przepływu danych między węzłami w czasie rzeczywistym.
- Mechanizmy niezawodności: Primary-Mirror
- Segment Mirroring: architektoniczne podejście do replikacji i wysokiej dostępności.
- Strategia utrzymania spójności w rozproszonym środowisku.
- Federacja danych z PXF
- Platform Extension Framework (PXF): idea równoległego dostępu do danych zewnętrznych.
- Budowa Data Lakehouse: odpytywanie danych zewnętrznych (JDBC, S3, HDFS) bezpośrednio z poziomu warstwy analitycznej.
- Analityka rozproszona w praktyce
- Mechanizmy Motion (Redistribute & Broadcast): Jak system orkiestruje przepływ danych „w locie” między segmentami podczas wykonywania zapytania.
- Eliminacja Data Skew: Strategie zapobiegania nierównomiernemu obciążeniu węzłów i dbania o idealny balans klastra.
- Podsumowanie i sesja Q&A
- Przyszłość skalowalnych systemów analitycznych w ekosystemie Postgres.
