Data lake w telekomunikacji

Realizations
1

Wyzwanie

Celem projektu było opracowanie sytemu zarządzania i monitorowania połączeń telefonicznych (dane, sms, voice) w roamingu, dla międzynarodowego operatora telekomunikacyjnego. Biznesowym celem projektu był nadzór nad ciągłością świadczenia usług telekomunikacyjnych oraz wykrywanie nadużyć i anomalii w ruchu hurtowym.

Challenge Image
2

Rozwiązanie

apache_hive_logo_icon_167868.svghadoop-logo.svgelastic-ar21.svgapache_spark-ar21.svg

Złożoność projektu:

  • Rozmiar klastra: ~2 PB
  • ponad 100 serwerów
  • utrzymanie kilkudziesięciu usług Zastosowane technologie:
  • HDFS, Hive, Spark, Ranger
  • Elasticsearch (ELK)
  • Apache Kafka
3

Wynik

  • Wdrożenie klastra Elasticsearch oraz klastra Apache Hadoop
  • Zaprojektowanie przepływów danych (metadane, sterowanie przepływami, itp.)
  • Wdrożenie integracji z AD i certyfikacji Kerberos
  • Zapewnienie ciągłości działania systemu
  • Zaprojektowanie i wdrożenie środowiska zapasowego (DR)
Umożliwienie nadzoru nad ciągłością świadczenia usług telekomunikacyjnych
Wykrywanie nadużyć w ruchu hurtowym
Wykrywanie anomalii w ruchu hurtowym