Otomatik Makine Öğrenmesi ve Sektördeki Konumuna Genel Bakış

Rümeysa Kara
6 min readMar 17, 2022

--

AutoML nedir?

AutoML, Machine Learning ile problem çözme sürecini otomatikleştirebilen bir dizi araç olarak tanımlanabilir. Böyle bir süreç, veri ön işleme, feature engineering, seçme ve çıkarma gibi alanda özel uzmanlık gerektiren birkaç adımı içerir. Sadece bu değil, Makine Öğrenimi uzmanları da doğru algoritmayı seçmeli ve doğruluğunu en üst düzeye çıkarmak için hiper parametrelerde optimizasyon görevleri gerçekleştirmelidir.

AutoML, Makine Öğrenimi modellerinin ölçekli olarak geliştirilmesi ve devreye alınması için MLOps metodolojileri ve çerçeveleri ile birleştirildiğinde, iş organizasyonları için yapay zekayı demokratikleştirmek için ilginç bir araç haline gelebilir.

Son yıllarda, veri bilimi becerilerine yönelik eğilim ve talep, beceri arzını geride bırakmıştı. Yapay zeka endüstrinin her köşesine nüfuz ettiğinden, veri bilimcilerini olası her kullanım durumuna yerleştirmek zor.

Bu boşluğu kapatmak için şirketler, veri setini otomatik olarak işleyen ve bir temel model oluşturan çerçeveler oluşturmaya başladı.

Google Trends’e göre, AutoML’in yükselişi 2017'nin ikinci çeyreğinde başladı:

AutoML vs Veri Bilimciler

Otomatikleştirilmiş Makine Öğrenimi (AutoML), şirketlerin Makine Öğrenimi sorunlarına yaklaşma biçiminde sismik bir değişim sunar. Geleneksel yaklaşımlarda tipik olarak emek yoğundur, Veri Bilimcileri için büyük miktarda zamana ihtiyaç vardır ve hiçbir başarı garantisi sunulamaz. Makine Öğrenimi (ML) modellerinin oluşturulması ve test edilmesinin otomatikleştirilmesi, Finansal Hizmetler sektöründeki birçok alanda benimsenmiştir ve aynı zamanda kaynak maliyetleri olmadan çok daha fazla denemeye olanak tanır. Bankalar, fonlar ve verileri ile akıllı içgörüden yararlanmak isteyen kuruluşlar, bu araçlarla ilişkili fırsatları ve tehlikeleri dikkatli bir şekilde değerlendirmelidir.

Geleneksel olarak, AutoML araçlarının odak noktası, model seçimini ve hiper parametre optimizasyonunu otomatikleştirmek, yani veri kümesinde en iyi performansa sahip modeli bulmak ve sizi kendi tekrarlayan deneyimlerinizi yürütme zahmetinden kurtarmaktır. Bunun sunduğu en önemli faydalardan biri, giriş engelini azaltarak Makine Öğrenimini etkin bir şekilde demokratikleştirmesidir. Sınırlı ML deneyimine ve uygun bir veri kümesine sahip biri, deneyimli bir Veri Bilimcisinin zamanını gerektirecek kısımlarda benzer performansa sahip bir modeli otomatik olarak oluşturabilir. AutoML’nin gücünden yararlanmak, genellikle bunu yapacak bütçeye, kaynaklara veya deneyime sahip olmayan iş alanlarında yenilik ve dönüşüme olanak tanır.

AutoML, deneyimli bir Veri Bilimcisinin işini yapma yeteneğine sahipse, Veri Bilimcilerinin hangi role hizmet edeceği konusunda sorular ortaya çıkıyor. AutoML’in yararı, dikkatlerini daha gelişmiş ön işleme ve modelleme tekniklerine yönlendirebilecek olmalarıdır. Araştırma alanlarını daha geniş, daha değerli bir alana açabilirler veya bunun yerine işin diğer, daha karmaşık alanlarındaki süreçleri iyileştirmeye bakabilirler. Bir Veri Bilimcinin zamanını rahatlatmak, daha önce öncelik verilmemiş alanlara değer katmalarını sağlayacaktır.

Bir Veri Bilimcisinin girdisi, yalnızca verilerin işlenmesinden daha ilerisine ulaşır. AutoML araçları, çıktılarını sorgulamak için tam bir anlayış veya yetki olmadan kullanılırsa, ortaya çıkan ürün potansiyel olarak bir “kara kutu modeli” olabilir. Yalnızca modelin performansına odaklanmak (modelin performansını temel bir metrik etrafında optimize ederek), modelin verileri tam olarak nasıl kullandığı konusunda dikkati dağıtabilir. Performans kabul edilebilir olmadığında, bir AutoML kullanıcısı vazgeçebilir veya farklı bir AutoML aracı deneyebilir. Bir AutoML algoritması, gerekli performansı karşılayan veya aşan bir model oluşturduğunda daha zararlı sonuçlar ortaya çıkabilir. Yalnızca bir performans metriğine odaklanmak ve bir modelin iç işleyişini göz ardı etmek, veri kümesinde fazla uyum sağlamaya neden olabilir, performanstaki değişiklikleri açıklayamama veya model tarafından yapılan herhangi bir önyargılı tahmine yönelik etik soruları gündeme getirebilir. Makine Öğrenimi modellerine tıbbi teşhisler, sürücüsüz araçlar ve kredi kararları gibi her zamankinden daha kritik alanlarda artan düzeyde özgürlük veriliyor. Bir modelin tahmini tarafından verilen kararlar üzerinde giderek artan bir etkiyle, modelin kararlarına nasıl ulaştığını anlamamız ve kararı etkileyen özelliklerin sadece ilgili değil aynı zamanda etik olup olmadığını doğrulayabilmemiz çok önemlidir. AI daha geniş bir toplumda daha yüksek etkili kullanım durumları ile benimsenecekse, işletmelerin ilgili mekaniklere güvenebileceklerinden ve kararların nasıl alındığını açıklayabileceklerinden emin olmaları gerekir. Bu, ‘kullanıma hazır’ AutoML araçlarıyla elde edilemeyecek bir şeydir.

AutoML’nin en büyük sınırlamasından biri, iş isteklerini Makine Öğrenimi sorunlarına dönüştürememesidir diyebiliriz. Çoğu durumda, sorunu konumlandırmak en büyük zorluktur. Çoğu iş talebi geniş kapsamlı ve çok yönlüdür ve Makine Öğreniminin faydalarından yararlanmak için sorunların uygun şekilde çerçevelenmesini gerektirir. AutoML’den yararlanacak olsak bile, otomatik model geliştirmenin sınırlarını konumlandırmak için bir veri bilimcisinin deneyimi gerekli olacaktır. Şirketler tarafından depolanan veri miktarı katlanarak artıyor ve veri bilimcilerinin bu verileri kullanılabilir ve bilgilendirici bir formatta karıştırmak ve derlemek için giderek daha fazla zaman harcadığını söyleyebiliriz.

Performans, bir Makine Öğrenimi modelinin önemli bir ölçüsüdür ve AutoML araçları, gerekli performansın daha hızlı elde edilmesinde etkilidir. AutoML araçlarının daha geniş çapta benimsenmesi için, açıklanabilirliğin özünde yer alacak şekilde gelişmeye ihtiyaçları vardır. Kararları için net açıklamalar içeren modelleri otomatik olarak eğitebilir, devreye alabilir ve sunabilirsek, bu modelleri Finansal Hizmetler gibi yüksek düzeyde düzenlenmiş endüstrilerde daha güvenli bir şekilde devreye almak için gereken güven düzeyine ulaşacağız. AutoML’in görünüşte asla aşamayacağı kısım insan yaratıcılığındadır. Deneyimli bir kişiden bilgi elde etme ve karmaşık bir iş sorununun üstesinden gelmek için veri setini manipüle etme yeteneği, günümüzün mevcut durumundan büyük bir sıçramadır.

AutoML Çözümlerinin Mevcut Durumu Nedir?

İlk olarak, AutoML olarak sınıflandırılabilecek farklı türde araçlar bulabileceğinizi belirtmek önemlidir. Bunları sınıflandırmanın bir yolu, Makine Öğrenimi süreç otomasyonunun belirli bölümlerine odaklananları ve uçtan uca kapsamaya çalışanları ayırmaktır.

DataRobot

DataRobot, muhtemelen AutoML için en iyi bilinen ticari çözüm ve 1 milyar doların üzerinde bir değerleme ile AI alanındaki önemli girişimlerden biridir.

bir AutoML çözümünde aramanız gereken en önemli 10 özellik şu şekilde özetleniyor:

  • Veri Ön İşleme
  • Future Engineering
  • Çeşitli Algoritmalar
  • Algoritma Seçimi
  • Training and tuning
  • Topluluk
  • Başa Baş Model Yarışmaları
  • İnsan Dostu Görüşler
  • Kolay Dağıtım
  • Model İzleme ve Yönetimi

H2O.ai

H20.ai , platformu “AI’yı herkes için demokratikleştirme misyonuyla AI ve makine öğreniminde açık kaynak lideri” olarak tanımlıyor. Şirket, web sitelerine göre, Açık Kaynak platformunun bir parçası olarak aşağıdaki özellikleri içeren bir AutoML paketi sunuyor:

  • Imputation, one-hot kodlama, standardizasyon dahil olmak üzere veri ön işleme. Kategorik özelliklerin sayım/etiket/hedef kodlamasının yanı sıra özellik seçimi ve/veya çıkarma.
  • Kartezyen veya rastgele ızgara araması ve Bayes hiper parametre optimizasyonu dahil olmak üzere model oluşturma.
  • Topluluklar

H2O.ai ayrıca web sitelerinde mimari bir şemada güzel bir şekilde özetledikleri Driverless AI adlı kurumsal bir sürüm de satıyor.

Dataiku

Dataiku, ücretsizden kurumsala kadar dört ürün paketi sunar. Farklı sürümlerin nasıl karşılaştırıldığını burada bulabilirsiniz .

Bu özel AutoML çözümlerinin yanı sıra hiper ölçekleyicileri, Otomatik Makine Öğrenimi özelliklerini geliştirme araçlarına dahil etmeye başlıyor.

B2Metric

Ülkemizde başarılı AutoML girişimlerinden olan ve hızla büyümeye devam eden B2Metric Dijital Optimizasyon Platformu , yapay zeka tabanlı kullanıcı segmentasyonu ve grup analizi ile uygulama içi kullanıcısını elde tutmayı, geliri artırmayı ve uygulama içi kullanıcı kaybını azaltmayı hedefliyor. AutoML ile veri analizini otomatikleştirerek yapay zekanın gücüyle üründeki müşteri eylemleri ile özellik kombinasyonu tahmini, eyleme geçirilebilir iş sonuçları, yaşam boyu değer ve gelir elde etmeyi sağlıyor.

Sigortacılık Sektöründe Otomatik Makine Öğrenmesi

B2Metric sigorta sektöründe ; yapay zeka ile risk yönetimi , müşteri kaybı ve dolandırıcılık tespiti ve önleme alanlarında çözümler sunuyor.

Telekom Sektöründe Otomatik Makine Öğrenmesi

Makine Öğrenimi uygulamaları, telekom sektöründe en iyi müşteri iletişimi için gelişir ve müşteri hareketlerini analiz eder. B2Metric, müşterilerin bir sonraki adımını tahmin ederek onlar için en iyi seçenek ile dolandırıcılık tespiti ve önleme alanlarında da çözümler sunuyor.

Otomotiv Sektöründe Otomatik Makine Öğrenmesi

Otomotiv sektöründe yedek parça stok ve fiyat optimizasyonu , anormallik tespiti analizleri yapılabiliyor.
Potansiyel sorunlar, makine öğrenimi yoluyla ortaya çıkmadan önce kolayca tespit edilir. Anormallik tespit modülleri ile binlerce veri noktası izlenip değişiklikler tespit edilebiliyor.

AWS, Google Cloud veya Microsoft gibi AI oyuncularının AutoML özelliklerini sunmaya başladığı işlevlerin kapsamlı olmayan bir listesi de aşağıda bulunuyor.

--

--

Rümeysa Kara

Data Science and Deep Learning enthusiast. Computer Engineering Student.