Ders Adı Kodu Yarıyıl T+U Saat Kredi AKTS
Büyük Veri SWE 307 5 3 + 0 3 5
Ön Koşul Dersleri
Önerilen Seçmeli Dersler
Dersin Dili İngilizce
Dersin Seviyesi Lisans
Dersin Türü Zorunlu
Dersin Koordinatörü Prof.Dr. AHMET ÖZMEN
Dersi Verenler Prof.Dr. AHMET ÖZMEN,
Dersin Yardımcıları
Dersin Kategorisi Diğer
Dersin Amacı

Derste büyük veri kavramı, veri görselleştirme ve analiz yöntemlerinin tanıtılması hedeflenmiştir. Büyük veriyi işlerken yaygın olarak kullanılan programlama dilleri ve yazılım araçları detayları ile tanıtılmaktadır. Bu yazılım araçlarının kurulumu ve veri işleme hatlarının oluşturulması örnek uygulamalar ile gösterilir.  

Dersin İçeriği

Veri biliminde ve büyük data konusunda temel kavramlar. Büyük verinin analizi ve görselleştirme. Büyük verinin toplanması, saklanması ve işlenmesi için yazılım mimarileri, araçlar ve uygulamalar.

Kalkınma Amaçları
# Ders Öğrenme Çıktıları Öğretim Yöntemleri Ölçme Yöntemleri
1 Büyük veri analizi ve temel kavramların öğrenilmesi Anlatım, Soru-Cevap, Tartışma,
2 Büyük veri ve dağıtık paralel programlama, MapReduce hesaplama modeli Tartışma, Soru-Cevap, Anlatım,
3 Büyük veri modülleri ile web tabanlı bilgi sistemlerinin entegrasyonu Grupla Çalışma, Soru-Cevap, Anlatım,
4 Kafka-Spark-Cassandra ile veri hattı oluşturma Gözlem, Problem Çözme, Tartışma, Soru-Cevap, Anlatım,
5 Büyük veri problemleri için analiz, sistem tasarlama ve çözüm üretme Gözlem, Deney ve Laboratuvar, Problem Çözme, Tartışma,
Hafta Ders Konuları Ön Hazırlık
1 Büyük veriye giriş, temel bilgiler, data visualization
2 R ile veri analizi ve modelleme
3 Makine öğrenmesi: doğrusal regresyon, kümeleme ve sınıflandırma
4 Hadoop mimari özellikleri, HDFS dağıtık dosyalama sistemi, MapReduce programlama modeli
5 Apache-Yarn resource manager
6 Apache-Spark mimari özellikleri ve Spark ile dağıtık paralel hesaplama
7 Apache-Cassandra ile NoSQL uygulamaları, CAP ile ACID karşılaştırma
8 Spark-Cassandra ile web tabanlı uygulama geliştirme
9 Apache Kafka mimarisi, kurulumu ve uygulama geliştirme
10 Data pipeline uygulaması: Kafka-Spark-Cassandra
11 Apache-HBase mimari özellikleri ve NoSQL uygulamlar, Cassandra ile kıyaslama
12 Data warehousing ve ETL, Apache Hive
13 Apache NiFi, APache Sqoop data warehousing
14 Apache Flume ile sosyal medya uygulamalarından data çekme uygulamaları
Kaynaklar
Ders Notu

Mining of Massive Datasets, Jure Leskovec, Anand Rajaraman, Jeff Ullman, Cambridge University Press, 3rd Edition. Link: http://infolab.stanford.edu/~ullman/mmds/book0n.pdf

Ders Kaynakları

Sakti Mishra, Simplify Big Data Analytics with Amazon EMR, Packt Publising, March 2022.

Nasir Raheem, Big Data: A Tutorial-Based Approach, CRC Press, 2019, ISBN0429592450, 9780429592454
Soraya Sedkaoui, Data Analytics and Big Data, John Wiley & Sons, 2018, ISBN1119528062, 9781119528067
Kuan-Ching Li, Hai Jiang, Laurence T. Yang, Alfredo Cuzzocrea, Big Data: Algorithms, Analytics, and Applications (Chapman & Hall/CRC Big Data Series), PublisherCRC Press, 2015, ISBN1482240564, 9781482240566

Sıra Program Çıktıları Katkı Düzeyi
1 2 3 4 5
1 Matematik, fen bilimleri ve ilgili mühendislik disiplinine özgü konularda yeterli bilgi birikimi; bu alanlardaki kuramsal ve uygulamalı bilgileri, karmaşık mühendislik problemlerinde kullanabilme becerisi. X
2 Karmaşık mühendislik problemlerini saptama, tanımlama, formüle etme ve çözme becerisi; bu amaçla uygun analiz ve modelleme yöntemlerini seçme ve uygulama becerisi. X
3 Mühendislik uygulamalarında karşılaşılan karmaşık problemlerin analizi ve çözümü için gerekli olan modern teknik ve araçları geliştirme, seçme ve kullanma becerisi; bilişim teknolojilerini etkin bir şekilde kullanma becerisi. X
4 Karmaşık bir sistemi, süreci, cihazı veya ürünü gerçekçi kısıtlar ve koşullar altında, belirli gereksinimleri karşılayacak şekilde tasarlama becerisi; bu amaçla modern tasarım yöntemlerini uygulama becerisi. X
5 Karmaşık mühendislik problemlerinin veya disipline özgü araştırma konularının incelenmesi için deney tasarlama, deney yapma, veri toplama, sonuçları analiz etme ve yorumlama becerisi. X
6 Bilişim Teknolojilerinin yönetim, denetim, gelişim ve güvenliği/güvenilirliği hakkında bilgi sahibi olma ve farkındalık.
7 Disiplin içi ve çok disiplinli takımlarda etkin biçimde çalışabilme becerisi; bireysel çalışma becerisi.
8 Türkçe sözlü ve yazılı etkin iletişim kurma becerisi; en az bir yabancı dil bilgisi; etkin rapor yazma ve yazılı raporları anlama, tasarım ve üretim raporları hazırlayabilme, etkin sunum yapabilme, açık ve anlaşılır talimat verme ve alma becerisi.
9 Yaşam boyu öğrenmenin gerekliliği bilinci; bilgiye erişebilme, bilim ve teknolojideki gelişmeleri izleme ve kendini sürekli yenileme becerisi.
10 Etik ilkelerine uygun davranma, mesleki ve etik sorumluluk bilinci; mühendislik uygulamalarında kullanılan standartlar hakkında bilgi.
11 Proje yönetimi, risk yönetimi ve değişiklik yönetimi gibi, iş hayatındaki uygulamalar hakkında bilgi; girişimcilik, yenilikçilik hakkında farkındalık; sürdürülebilir kalkınma hakkında bilgi.
12 Mühendislik uygulamalarının evrensel ve toplumsal boyutlarda sağlık, çevre ve güvenlik üzerindeki etkileri ve çağın mühendislik alanına yansıyan sorunları hakkında bilgi; mühendislik çözümlerinin hukuksal sonuçları konusunda farkındalık.
# Ders Öğrenme Çıktılarının Program Çıktılarına Katkısı PÇ 1 PÇ 2 PÇ 3 PÇ 4 PÇ 5 PÇ 6 PÇ 7 PÇ 8 PÇ 9 PÇ 10 PÇ 11 PÇ 12
1 Büyük veri analizi ve temel kavramların öğrenilmesi 5
2 Büyük veri ve dağıtık paralel programlama, MapReduce hesaplama modeli 5
3 Büyük veri modülleri ile web tabanlı bilgi sistemlerinin entegrasyonu 5
4 Kafka-Spark-Cassandra ile veri hattı oluşturma 5
5 Büyük veri problemleri için analiz, sistem tasarlama ve çözüm üretme 5
Değerlendirme Sistemi
Yarıyıl Çalışmaları Katkı Oranı
1. Ara Sınav 40
1. Kısa Sınav 10
2. Kısa Sınav 10
1. Performans Görevi (Uygulama) 40
Toplam 100
1. Yıl İçinin Başarıya 50
1. Final 50
Toplam 100
AKTS - İş Yükü Etkinlik Sayı Süre (Saat) Toplam İş Yükü (Saat)
Ders Süresi (Sınav haftası dahildir: 16x toplam ders saati) 14 3 42
Sınıf Dışı Ders Çalışma Süresi(Ön çalışma, pekiştirme) 14 1 14
Ara Sınav 1 15 15
Kısa Sınav 2 4 8
Performans Görevi (Uygulama) 1 25 25
Final 1 20 20
Toplam İş Yükü 124
Toplam İş Yükü / 25 (Saat) 4,96
Dersin AKTS Kredisi 5