-- Etkinlik

THY Travel Datathon 2019

Kaynak: https://miro.medium.com/max/7520/1*xEocmkVGi0yhyBYWLHN6YQ.jpeg

Selamlar,

“Veri İle Uçuyoruz” mottosuyla 20-22 Eylül 2019 tarihlerinde düzenlenen THY Travel Datathon 2019 hakkında görüşlerimi kısaca paylaşmak istedim. Ben ve arkadaşlarım (alfabetik sıra ile) Abdurrahman Kocukcu, Abdülkerim Güler, Ahmet Kalafat ve Dilek Doğan ile birlikte LC Waikiki (ve yaklaşık 56 mentor: Komtaş, Obase, Artiwise) olarak THY Travel Datathon 2019’da mentor olarak yerlerimizi aldık. 👏👏👏

Kaynak: https://www.datathon.turkishairlines.com/

THY ile Travel Datathon’dan hemen birkaç ay öncesinde LC Waikiki olarak düzenlemiş olduğumuz LCW Datathon 2019’a istinaden öğrendiklerimizi/tecrübelerimizi paylaşma imkanımız oldu. Geçen birkaç ay sonrasında THY düzenleyici ekiplerin [TK Dijital İnovasyon, Veri Koordinatörlüğü, v.d. birimler] gayreti ile 20 Eylül Cuma Akşamı saat 19:00 sularında THY Travel Datathon 2019 start aldı.


THY Datathon’dan kısa kısa;

Bulut sağlayıcılar: Amazon, Google, Microsoft ve Oracle

Not: Gözlemlerime göre yarışmacılar: Amazon ve Google cloud’ları üzerinde çalıştılar.

Ödüller: Öncelikle söylemeliyim ki ödüller pişman olacak kadar iyiydi 😊

  1. Yurtdışı Business Class Gidiş Dönüş Uçak Bileti + 20.000 TL
  2. Avrupa Business Class Gidiş Dönüş Uçak Bileti + 15.000 TL
  3. Avrupa Economy Class Gidiş Dönüş Uçak Bileti + 10.000 TL

Ortam ve diğer şeyler: Dinlenme alanları,Langırt, Oyun Konsolları,Yarış Simülatörü, Mini Basket Potası (bu konuda fena sayılmam😊)

Takım ve Yarışmacı: 24 takım ve 96 yarışmacı ile Datathon Cuma akşamı 19:00 sularında start aldı.


Problemler:

THY Travel Datathon 2019’da çözülmesi istenen problemleri inceleyecek olursak;

Case 1: %30’luk kısmı oluşturan ilk case; yaklaşık 20 saat içerisinde “uçuş tarifesinde değişiklik yapıldığında (saati ileri veya geri alma), yeni durumda herhangi bir hat için oluşacak inbound/outbound listesi ve pazardaki yolcu sayısının bulunmasıydı.”

Yorum: İlk case açıkçası domain olarak pek bilinmeyen havacılık dünyasına ait kavramların (Detour Factor, Connection Time, 2 Leg (One Stop) v.d.) anlaşılması/içselleştirilmesi ve veri üzerinde belirtilen kısıtlar üzerinde bir logic oluşturularak gerçekleştirilen ETL süreçlerinin hâkim olduğu (herhangi bir makine öğrenmesi sürecinin olmadığı) bir vaka idi.

Case 2: %70’lik kısmı oluşturan asıl case ise; “90 milyon gözlemden oluşan tüm dünyadaki hava yollarının geçmiş rezervasyon verisi üzerinden gelecekte oluşacak rezervasyon sayılarının (PSGR_COUNT) tahminlenmesiydi.”

Performans Metriği: Root Mean Square Error (RMSE)

Yorum: “Yiğidin harman olduğu yer” işte tam burası idi. Üzerinde çalışacağın veri seti 90 milyon satır ve 23 feature’dan oluştuğu için veri (preprocess, feature selection, feature engineering, sampling) üzerinde model öncesi hazırlıkların yapılması gerekiyordu. Veri zenginleştirme (envanter içi ve envanter dışı) ile tahmin modellerinin performanslarına olumlu olarak katkı alabileceği bir vaka idi.


Sunumlar ve Sonuçlar

24 takım ile start alan datathon’da takımların gönderdiği sonuçlara göre belirlenen 9 takım finale kaldı.

Kaynak: https://miro.medium.com/max/2500/1*h1rdCU7J7EljnH1L4lcxhw.png
  1. Takım: Crawlers (Yavuz Selim Elmas, Sabri Suyunu, Yasin Sancaktutan, Burak Suyunu, Mehmet Emin Öztürk)
  2. Takım: Stationary Traveller (Burak Önal, Kadircan Özdemir, İlhan Yıldırım)
  3. Takım: Dataddicts (Yetkin Eser, Özge Filizcan, Ceren Kartal, Azat Şaşkal)
Kaynak: https://miro.medium.com/max/7520/1*I01saHX-5I-8T4KRkxaFEg.jpeg

THY Travel Datathon 2019 ait resmin blog yazısına buradan ve diğer tüm bilgilere için https://www.datathon.turkishairlines.com/ buradan erişim sağlayabilirsiniz.

Not: 08-10 Mart 2019 tarihlerinde düzenlenen LCW Datathon 2019’a ait yazmış olduğumuz yazıya “Bir Datathon’un Anatomisi: LC Waikiki Datathon 2019buradan erişebilirsiniz.

Son olarak; tüm düzenleyicilere, paydaşlara, emeği geçenlere herkese ve yarışmacılara katılım sağlayanlara teşekkür ederiz.

Yeniden görüşmek üzere, selamlar. ✋✋✋