15 Mayıs 2017 Pazartesi

Data Science Roadshow Etkinliği - 26 Mayıs 2017

26 Mayıs 2017'de gerçekleşecek olan etkinlikte konuşmacı olarak yerimizi aldık. MVP'lerin konuşmacı olduğu ve en güncel başlıkların yer aldığı bu etkinliği kaçırmamanızı öneririm.

Kayıt Olmak İçin :
26 Mayıs 2017 - Microsoft Türkiye

Etkinlik içeriği :

  • 10:00 – 10:30 A Data-driven Business Era
  • 10:30 – 11:30 Understanding the three V's of big data (Velocity)
  • 11:30 – 11:45 Break and Q&A time
  • 11:45 – 12:35 Understanding the three V's of big data (Volume)
  • 12:35 – 12:50 Break and Q&A time
  • 12:50 – 13:40 Understanding the three V's of big data (Variety)
  • 13:40 – 14:10 Lunch
  • 14:10 – 14:50 Building predictive models inAzure Machine Learning
  • 14:50 – 15:05 Break and Q&A time
  • 15:05 – 15:45 Cognitive Services (it's cool!)


Şimdi Data Scientist olmak için en doğru zaman!

Tüm Dünya’da büyük bir heyecanla beklenen Data Science Roadshow’ları Türkiye’de de gerçekleşiyor!

Data Science (Veri Bilimi), fikir bulma ve kritik iş sorunlarını çözmede anahtar bir rol oynamaktadır. Dünya’nın veri ile döndüğü günümüzde, Data Scientist’lere olan ihtiyaç da her geçen gün katlanarak büyüyor.

Microsoft size Data Scientist olabilmeniz için benzersiz bir fırsat sunuyor ve sizi Cloud Society Programı’nın bir parçası olan Data Science Roadshow’una davet ediyor.

Bir IT Profesyoneli, bir yazılım geliştirici, bir startup, bir Microsoft İş Ortağı veya bir Bağımsız Yazılım Evi olabilirsiniz. Bu etkinlik serisi size:

  • Gerçek dünyadan örnek veri problemlerini uygun araç ve eğitimlerle çözümleme
  • İstatistik ve makina öğrenimi (machine learning) ile hayalinizdeki işe sahip olma
  • Microsoft Cloud Society ile bilgi seviyenizi arttırma

imkanı sunuyor.

Data Scientist olmak istiyorsan sen de 26 Mayıs’ta Microsoft Türkiye ofisinde gerçekleşecek olan Data Science Roadshow’una katıl! 

Kayıt Olmak İçin :
26 Mayıs 2017 - Microsoft Türkiye

14 Mayıs 2017 Pazar

Power BI Demo Serisi ( Meşrubatçı Senaryosu - 1 ) - Video

Bu seride bir aylık meşrubat satışları senaryosunu ele alıyoruz. Power BI Desktop ile satışların bulunduğu Excel dosyasına bağlanıp verileri istediğimiz formata getireceğiz. Hemen ardından modelleyip sonrasında da karlılık durumunu ve çeşitli korelasyonları görebileceğimiz raporlar tasarlayacağız.

Serimiz bir kaç bölümden oluşuyor. Bu bölümde Query ekranında çalışıyoruz. Tarih (Date Tipi) kolonundan yeni alanlar türetme, parametre tanımlama ve M dili ile yeni kolonlar ekleme işlemlerine odaklanıyoruz.

Aşağıdaki linkten satışların bulunduğu Excel dosyasına ve videoda geliştirilen Power BI dosyasına erişebilirsiniz:

https://1drv.ms/f/s!Ap5-WHzOJRrTuEbJRl3dAagR9NeA




19 Mart 2017 Pazar

Adım Adım Veri Bilimi - 2 ( İstatistik Nedir?)

Bu konuda yerli ve yabancı, çeşitli derinliklerde bir çok kaynak bulmak mümkün. Bizim amacımız; İstatistik konusuna, Veri Bilimi serimize ışık tutacak nitelikte pratiğe dönük ve mümkün olduğunca teknik terimlerden uzak bir giriş yapmaktır. İlerleyen bölümlerde gerek gördükçe teferruata girebiliriz.

Bir önceki R dünyasına giriş konulu yazımıza şu linkten ulaşabilirsiniz:

İstatistik Nedir?


Bir birine benzeyen iki farklı tanımdan söz edebiliriz;

Bunlardan ilki günlük hayatta kullanılan ".... istatistikleri" ifadesi ile ilgilidir. Mesela "Spor İstatistikleri", "Nüfus İstatistikleri" vs. böyledir. Bu ifadelerde geçen istatistik kelimesi bize, belirtilen konuda sistemli bir şekilde toplanan sayısal verilerin var olduğunu anlatır.

İkinci tanım ise İstatistiğin bilimsel uğraşı ile ilgilidir. Bu bakış açısı ile temel olarak istatistik, çeşitli sorulara cevaplar üretmek ve bir takım çıkarımlar sonucunda kararlar verebilmek için kullanılan bilimsel yöntemlerin işletildiği süreci ifade eder diyebiliriz.

İstatistiksel bir çalışmada temelde şu adımlar atılır:
  • Araştırma konusu belirlemek ve çalışma için makul bir çerçeve tasarlamak.
  • Araştırma konusu hakkında bilgi toplamak için ön yargısız, anlamlı ve kaliteli veri kaynakları edinmek.
  • Toplanan verileri tasnif etmek ve sayılar veya görsellerle (grafikler vs.) özetlemek.
  • Verileri analiz etmek ve sonuçları yorumlamak.
  • Sonuçlara ne kadar güvenilebileceğini ölçmek.
  • Küçük bir örnek grubundan (örneklem) elde edilen sonuçları genele yaymak.
  • Özellikler arası ilişkileri, nedensellikleri, verideki eğilimleri ve desenleri ortaya çıkararak geleceğe ilişkin tahminlerde bulunmak.

Veri Toplama Yöntemleri


İstatistiksel çalışmalar veriye dayalı olduğu için veri toplama aşamasının kalitesi sonuçların kalitesini belirler. Unutmayalım; GIGO (Garbage In Garbage Out) yani çöp giren çöp çıkar. 

İstatistiksel çalışmalarda bazen hakkında veri toplamak istediğimiz grubun tüm üyelerine erişebiliriz. Bazen de zaman, maliyetler vs. gibi bir çok nedenden dolayı grup üyelerinin tümüne ulaşmak mümkün olmayabilir. Bu durumda tüm üyelerine ulaşamadığımız gruba en çok benzeyen küçük bir grup üzerinde çalışmak ve çıkan sonuçlardaki hatayı göz ardı ederek tüm grup hakkında fikir edinmeyi ummak zorunda kalırız.

İstatistiksel çalışmalarda çoğunlukla küçük bir grup üzerinde yapılan analizlerden elde edilen sonuçlara bakılarak büyük bir grup hakkında karara varılması amaçlanır. Büyük grup olarak nitelendirdiğimiz kitle (ana kütle) hakkında merak ettiğimiz soruların cevabını bu kitleyi (ana kütleyi) en iyi ifade eden küçük grupta yani örneklemde ararız. Sonra bulgularımızı genele yayar, kitleyi anlamak için kullanırız. 

Örneklem üzerinden kitle (ana kütle) hakkında fikir edinme yöntemleri oldukça kullanışlıdır. Mesela bu sayede ülkedeki tüm hayvanları yemeden et kalitesi hakkında fikir edinebiliyoruz. Çok şükür!

Örneklem seçerken çok dikkatli olmak gerekir. Örneklem kitleyi en iyi ifade edecek şekilde seçilmelidir. Hem örneklem seçimi sırasında hem de veri toplarken ön yargıdan (biased) ve veri toplama sürecini sekteye uğratacak yaklaşımlardan (mesela uzun anketler) uzak durmak gerekir. Kitleyi temsil etmeyecek küçük belirgin bir gruptan çeşitli yönlendirmeler ve kısıtlı cevap seçeneklerine mahkum ederek elde edilen veriler çöptür ve yapılan analizler çöp olur. 

Örneklem seçimi rassal (rastgele) veya kitleyi ifade edecek şekilde iradi (istemli) olarak yapılabilir. Seçilen örneklemlerden veri toplanırken amaca uymayan ve sonucu etkileyen faktörlerin devrede olup olmadığı kontrol edilmelidir.

Veri toplamak için temelde 2 yöntem kullanılır:
  • Anketler (Survey): Anketler anlaşılır, yeterli, yapılabilir ve tamamlanabilir nitelikte olmalıdır. Sorular sunulurken kasıtlı, hataya yapmaya açık ve yetersiz yönlendirmeler yapılmamalıdır.
  • Deney - Gözlem (Experiment): Örneklemin ürettiği verileri toplarken sonuçları etkileyebilecek durumlar ve karakteristik özelliklere dikkat etmek gerekir. Bir örneklem üzerinde deney yaparken deneyin başarılı, mantıklı ve sağlıklı olup olmadığını kontrol edebilmek için bir de kontrol grubu kullanılmalıdır. Mesela bir ilacın etkisini araştırırken deney grubundan elde edilen sonuçlarla birlikte, ilaç verilmeyen kontrol grubundaki sonuçları da değerlendirmek gerekir.

İstatistiksel Veri Analizi Yöntemleri


Veri analizi konusunu geçmişin tahlili ve geleceğin tahmini olarak en tepeden ikiye ayırabiliriz. Bir miktar daha detaya inersek; bazen geçmiş verilerimize baktığımızda neler olup bittiğini (Descriptive Analytics), olayların sebebini (Diagnostic Analytics) anlamayı amaçlarız. Bazen de geçmiş verilerden faydalanarak neler olacağını (Predictive Analytics) veya gelecekte olmasını arzu ettiğimiz şeyleri gerçekleştirmek için neler yapmamız gerektiğini (Prescriptive Analytics) tahmin etmeye çalışırız.



Sonuç olarak topladığımız verileri iki temel amaç için istatistiksel analize tabi tutarız:
  • Betimsel İstatistik (Descriptive Statistics): Bu analiz çalışmasının amacı sayılar ve görsellerle toplanan örneklem verilerini betimlemektir. Sonuç olarak toplanan verileri temsil eden ortalama, standart sapma, ortanca vs. gibi çeşitli sayısal özetler ve histogram, bar, pasta grafiği gibi çeşitli görseller hazırlanır. (Bu konuda Microsoft'un SSRS, Excel, Power BI, Microsoft R Open vs. ürünlerinden faydalanabilirsiniz. )
  • Çıkarımsal İstatistik (Inference Statistics): Bu analiz çalışmasının amacı veri içerisindeki eğilimleri, ilişkileri, desenleri ortaya çıkarmak, bir takım olasılıkları hesaplamak ve çeşitli tahminlemeler yapmaktır. İlişkili olma ve nedensellik (Association and Causation), hipotez testleri (Hypothesis Tests) ve veri madenciliği (Data Mining) bu tür istatistiksel çalışmaların kapsamına girer. (Bu konuda Microsoft'un SSAS, Excel, Azure ML, Microsoft R Open, R Server vs. ürünlerinden faydalanabilirsiniz.)

İstatistiğin Güvenilirliği


İstatistiksel yöntemler bilimseldir. İstatistiğin temelinde Matematik vardır. Matematik ise son derece güvenilirdir, yalan söylemez ve evrenseldir. Fakat istatistiksel çalışmalar doğası gereği çeşitli paradokslar içerir. Olasılıklar, güven aralıkları ve kabuller üzerine inşa edilmiş yöntemlerle çevrilidir. Bunun üzerine bir de bilerek veya bilmeyerek yapılan hatalı çıkarımları, ön yargılı çalışmaları, araştırma konusundaki ölçülemeyen noktaları ve hesaplama hatalarını da eklersek istatistikten mutlak doğru beklenemez. Belki elde edilen sonuçlar karar verebilmek için bir takım fikirler verir diyebiliriz. Elde edilen sonuçlar karar verme konusunda avantaj sağlar diyebiliriz. Ancak istatistiksel çıkarımları tümüyle doğru kabul etmek yanıltabilir.

Bu nokta ile ilgili olan Simpson paradoksu konulu yazımıza bir göz atmak isteyebilirsiniz:

19. yüzyılda Benjamin Disraeli'nin dediği gibi "Üç türlü yalan bulunmaktadır: yalanlar, kuyruklu yalanlar ve istatistikler."

17 Mart 2017 Cuma

SQL Server 2016 Yenilikleri Etkinliğine Bekleriz - 23,29 Mart 2017

SQL Server 2016 yeniliklerine odaklandığımız etkinliklerimiz yolda. İlkini 23 Mart 2017 Perşembe günü, ikincisini 29 Mart 2017 Çarşamba günü İTÜ Teknokent'te gerçekleştiriyoruz.

Bekleriz!

27 Şubat 2017 Pazartesi

SQL Server Üzerinde 'Veri Şifreleme' Teknikleri ( E-Kitabım Yayınlandı )

Microsoft SQL Server üzerinde Veri Şifreleme yöntemlerine odaklandığımız e-kitabımı sizlerle paylaşmaktan mutluluk duyuyorum. 

Microsoft SQL Server üzerinde Veri Şifreleme konusunda temel seviyede beceri oluşturmasını ve daha fazlası için cesaret vermesini dilerim.

Giriş


Veritabanı şifreleme yöntemleri ile hassas verileri şifreleyip koruyabilirsiniz. Şifrelenmiş veriler ilk bakışta anlamsız ifadelerle temsil edilir ve üzerinde çalışılması engellenir. Kredi kartı bilgilerini, kişisel kimlik bilgilerini veya herhangi birisi için önemli olan, görünmesini ve kolayca kullanılmasını istemediğiniz diğer verileri hassas veri olarak düşünebilirsiniz.

Firmalar müşterileri, personelleri, finansal geçmişleri ve stratejileri ile ilgili hassas bilgileri yetkisiz gözlerden korumak için birçok seviyede çeşitli önlemler almaktadır. Bu önlemler yönetim, yöntem, insan, donanım ve yazılım seviyesinde olabilir. Pesimist veya optimist yaklaşımlara göre belli seviyede veya her seviyede farklı yöntemlerde önlemler alınabilir.

Verileri korumanın en etkili yolu onları şifrelemektir. Şifrelenmiş veriler farklı bir sisteme taşınsa bile onları okumak neredeyse imkansızdır. Tarih boyunca birçok şifreleme yöntemi uygulanmış ve çeşitli birçok konuda avantaj veriyi şifreli tutan veya şifreli veriyi okumayı başarabilen tarafta olmuştur.

Bu kitapta avantajı daima elinde tutmak isteyenler için Microsoft SQL Server üzerinde uygulanabilecek şifreleme yöntemlerine odaklanıyoruz. Bu yöntemlerin koruma gücü, geliştirme iş yükü, performansı, bakım sıklığı gibi çeşitli alanlarda kendine göre avantaj ve dezavantajları var. Sisteminiz için en uygun olan yöntemi dikkatlice belirlemeniz gerekir.

Kitap Hakkında


Bu kitap Microsoft SQL Server 2005, 2008, 2008 R2, 2012, 2014 ve 2016 versiyonları üzerinde uygulanabilen veri şifreleme yöntemlerini konu almıştır. Kitabın amacı, kolayca ve pratiğe dayalı bir yaklaşımla şifreleme yöntemlerinin temellerini okurlarına aktarmaktır.

Veri Şifreleme (Data Encryption) geçmişten bu güne ilgi çeken önemli bir konudur. Ancak bir çok uzman bu konuya tedirginlikle yaklaşır. Bu kitap sayesinde SQL Server üzerinde veri şifreleme yöntemlerinin temellerini öğrenecek, daha derine dalmak için cesaret bulacaksınız.

Geri bildirimlerinizi şu adresime gönderebilirsiniz: mailto:abdullahkise@hotmail.com

Faydalı olması dileğiyle …

E-kitabı okumak ve indirmek için:
https://1drv.ms/b/s!Ap5-WHzOJRrTqHA9BwO2KeFLQea2


E-kitabı okumak ve indirmek için:
https://1drv.ms/b/s!Ap5-WHzOJRrTqHA9BwO2KeFLQea2