BilimKoop

Düzenleyen

BilimKoop
Web sitesi
https://bilimkoop.org

Destekleyenler

Melda.io
Melda.io
Web sitesi
http://www.melda.io/

Konuşmacı / Eğitmen

Etkinlik Mekanı

Online

Tarih

01 Kas 2020
Expired!

Zaman

12 saat
8:00 pm

Veri Analizi için R Programlamaya Giriş

R, istatistik ve veri biliminde kullanılan en popüler programlama dillerinden biridir. Uzun yıllardan beri geliştirilmekte olduğu için bolca test edilmiş ve güvenirliği kanıtlanmış bir özgür yazılımdır. 3. şahısların geliştirdiği zengin paket sistemi sayesinde veri ile ilgili her konuda aktif bir şekilde kullanılabilmektedir.    

 

Bu eğitim serisinin amacı, R dilini, gerçek veriler ile uygulama yaparak öğretmek ve veri bilimi konusunda kariyer yapmak isteyenleri iş dünyasının ihtiyaçlarına uygun bir şekilde hazırlamaktır. Eğitimi tamamlayan katılımcılar, hem R dilinde hem de veri ön analiz, işleme ve görselleştirme konularında iş yapabilecek seviyeye gelmiş olacaklar.

 

Veri analizi için geliştirilen R, öncelikle akademisyenler ve araştırmacılar tarafından sıklıkla kullanılmaktadır. Son yıllarda, kurumsal alanda da kullanımının yaygınlaştığını görmekteyiz. Bilgisayar programlama becerisi olmadan da kullanılabildiği için özellikle istatistikçiler, mühendisler ve bilim adamları tarafından tercih edilmiştir. Akademide; finans, ilaç, medya ve pazarlama sektörlerinde oldukça popülerdir.

Ayrıca, python’un kod tabanını değiştirerek hızlı bir şekilde deney yapabilir, çünkü her türlü geliştirici arasında daha popüler hale gelen yorumlanmış bir dildir.

Eğer kodlama konusunda herhangi bir deneyiminiz yok ve veri analizi konusunda kendinizi yetiştirmek istiyorsanız R tam size göre. İstatistiksel modelleri sadece bir kaç satır kod yazarak geliştirebilirsiniz. Diğer dillere kıyasla, R dilinde benzer türde bir analiz fonksiyonunu farklı şekillerde yazmak / kodlamak mümkündür. 

R ile karmaşık veri analizi işlevlerini yerine getirmek çok kolaydır. Her türlü istatistiksel test ve model için hazırlanmış paketlere kolayca erişilebilir ve kullanılabilir. 

Açık kaynak yazılım olan R’ın geniş bir kullanıcı topluluğu bulunmaktadır. Bu topluluk sayesinde tek bir satır kod ile çalıştırabileceğiniz R fonksiyonlarını, kod bloklarını ve veri setlerini içeren hazır paketlere ulaşabilirsiniz. Paketlere CRAN, GitHUB ve Bioconductor’dan erişebilir ve katkı sunabilirsiniz.

R ile veri analizine giriş yapmak ve basit görevleri yerine getirmek çok kolaydır. Problemler karmaşıklaştığı zaman derinlemesine öğrenmeye devam etmek gerekir. Hiç kodlama deneyimi olmayan bir kişi için karmaşık görevler biraz zorlayıcı olabilir, ama kodlama deneyimi olan kişiler için R öğrenmek ve R ‘da uzmanlaşmak çok kolaydır.

Veri görselleştirme ve muhteşem grafikler için yaygın olarak tercih edilen programlama dili olmuştur. 

Veri analizi için tasarlanmıştır, bu nedenle de bu alanda yaygın olarak tercih edilen iki programlama dilinden birisi olmuştur. 

İstatistiksel analiz yapmak için çok güçlü bir fonksiyonalite sunar. 

Komut satırı üzerinden geliştirme yapabileceğiniz gibi, yaygın olarak tercih edilen IDE – geliştirme ortamlarını (melda.io, RStudio) kullanarak görsel bir arayüz üzerinden de kodlama yapabilirsiniz. 

Amacınıza uygun doğru pakete ulaşmanız ve paketler arası bağımlılıklar nedeniyle kullanmaya başlamanız zaman alabilir. Eğitimimizde hiçbir program ve paket kurulum gerektirmeyen melda.io web platformunu kullanacağız.

R ile hazırladığınız kod blokları, eğer temiz kodlamadıysanız yavaş çalışabilir. Eğitimimizde doğru programlama yöntemleri sayesinde hızlı çalışan kod yazmayı öğreneceksiniz.

Günlük Program

17 Ağustos 2020, 20:00 - 22:00

R’a giriş 

  • R diline giriş (özgür yazılım, matrix dili, paket sistemi, başka dillere R fonksiyonu yazma)
  • R yardım sistemi 
  • R ile dosya sistemine erişim
  • R değişkenleri, hafıza, workspace
  • Eksik gözlemler
  • Pratik egzersizler içeren ödev
20 Ağustos 2020, 20:00 - 22:00

Yerli (native) veri tipleri 

  • vector sistemi
  • sayısal vektörler
  • karakter vektörler 
  • logical vektörler ve operatörler
  • kategori (factor)
  • data frame – csv dosyaları
  • list – json dosyaları
  • Pratik egzersizler içeren ödev
24 Ağustos 2020, 20:00 - 22:00

Değişken alt kümeleme (subsetting) 

  • boolean değişkenlerle alt kümeleme
  • sayısal indekslerle alt kümeleme
  • gözlem isimleri ile alt kümeleme
  • gözlem silme
  • değişken alt kümesine atama
  • Pratik egzersizler içeren ödev
27 Ağustos 2020, 20:00 - 22:00

Akış kontrolü 

  • Şartlı akış (if)
  • Matrix döngüleri (index ve apply* ile)

Fonksiyonlar

  • Modüler programlama
  • R’da konsiyon yazma kuralları
  • R’ın “formula” sistem
  • Pratik egzersizler içeren ödev
31 Ağustos 2020, 20:00 - 22:00

Veri ithal ve ihraç yöntemleri 

  • csv
  • json
  • xml
  • http API’lerinden veri çekmek 
  • Pratik egzersizler içeren ödev
3 Eylül 2020, 20:00 - 22:00

R ile veri görselleme 

  • veri analizi için grafik yaratma prensipleri 
  • base R grafik sistemi
  • Pratik egzersizler içeren ödev

Eğitim Süreci:

  • Eğitim haftada 2 gün 2şer saatlk programlarla, uygulamalı ve canlı olarak gerçekleştirilecektir. 
  • Eğitime katılabilmek için ön başvuru yapmak ve bu eğitime neden katılmak istediğinizi belirtmeniz gerekmektedir. 
  • Eğitime kabul edilen ve eğitim ücretini yatıran kişiler eğitime katılan tüm kişilerin, eğitmenlerin ve dönemsel olarak eğitime katkı sunacak mentörlerin dahil olduğu bir iletişim kanalına dahil edilirler. 
  • Yukarıda paylaşılan  programa ek olarak eğitim süresince Veri Bilimi alanında çalışan uzmanlar ve kurumların katılacağı webinarlar düzenlenecektir. 
  • Eğitim süresince Pranageo tarafından geliştirilen ve hiçbir program ve paket kurulum gerektirmeyen Melda.io platformu kullanılacağız. Melda.io web platformuna eğitim katılımcılarına özel ücretsiz erişim sunulacaktır. 

Dr. Ahmet Çizmeli’nin kurucu ortağı olduğu Türk AR-GE firması PranaGEO tarafından, tamamıyla yerel kaynaklar kullanılarak geliştirilmiştir. Akademisyenler ve veri bilimciler için büyük bir zaman kaybı teşkil etmekte olan online paylaşım, hesap ölçeklendirme ve tekrarlanabilirlik (reproducibility) problemlerine çözüm üretmek üzere tasarlanmış bir platformdur. Platforma bağlanan her kullanıcı için özel veri depolama alanı, CPU ve RAM rezerve edilir. R yazılımı docker konteyneri içinde anında kullanıma hazır şekilde kurulu olarak gelir.

Eğitim Kimler için:

  • Veri bilimi üzerine kariyerini geliştirmek isteyenler. 
  • Yaptığı araştırmalar ve projelerde veri analizi tekniğini derinleştirmek ve farklılaşmak isteyenler. 
  • Veri bilimi ile neden ilgilendiğini, bireysel hayat vizyonu ışığında açıklama yetisine sahip olanlar.